介绍
# 4chan Reader
此技能允许您将 4chan 版块中的主题编入目录并提取为结构化文本。
## 工作流
### 1. 查看版块目录
要查看版块中的活跃主题及其回复数量: ```bash python3 scripts/chan_extractor.py catalog <board> ``` 输出格式:`ThreadID|PostCount|TeaserText`
### 2. 提取主题内容
要阅读特定主题并(可选)保存它: ```bash python3 scripts/chan_extractor.py thread <board> <thread_id> [output_root_dir] [word_limit] ``` - `output_root_dir`(可选):如果提供,则将内容保存到 `<output_root_dir>/<board>_<timestamp>/<thread_id>.txt`。 - `word_limit`(可选):将每行帖子文本限制为指定的字数。
## 详情 - **脚本**:所有操作均使用 [chan_extractor.py](scripts/chan_extractor.py)。