ClawSkills logoClawSkills

4chan-reader

浏览 4chan 版块并将主题讨论提取为结构化文本文件。当您需要获取目录信息或特定主题内容(包括

介绍

# 4chan Reader

此技能允许您将 4chan 版块中的主题编入目录并提取为结构化文本。

## 工作流

### 1. 查看版块目录

要查看版块中的活跃主题及其回复数量: ```bash python3 scripts/chan_extractor.py catalog <board> ``` 输出格式:`ThreadID|PostCount|TeaserText`

### 2. 提取主题内容

要阅读特定主题并(可选)保存它: ```bash python3 scripts/chan_extractor.py thread <board> <thread_id> [output_root_dir] [word_limit] ``` - `output_root_dir`(可选):如果提供,则将内容保存到 `<output_root_dir>/<board>_<timestamp>/<thread_id>.txt`。 - `word_limit`(可选):将每行帖子文本限制为指定的字数。

## 详情 - **脚本**:所有操作均使用 [chan_extractor.py](scripts/chan_extractor.py)。

更多产品