ClawSkills logoClawSkills

MinerU PDF Parser Clawdbot Skill

使用 MinerU 在本地(CPU)将 PDF 解析为 Markdown/JSON。假定 MinerU 创建每个文档的输出文件夹;支持表格/图像提取。

介绍

# MinerU PDF

## 概述 使用 MinerU 在本地解析 PDF(基于 CPU)。默认输出为 Markdown + JSON。仅在请求时使用表格/图片。

## 快速开始(单个 PDF) ```bash # Run from the skill directory ./scripts/mineru_parse.sh /path/to/file.pdf ```

可选示例: ```bash ./scripts/mineru_parse.sh /path/to/file.pdf --format json ./scripts/mineru_parse.sh /path/to/file.pdf --tables --images ```

## 何时阅读参考文档 如果参数选项与您的封装工具不同,或者您需要高级默认设置(后端/方法/设备/线程/格式映射),请阅读: - `references/mineru-cli.md`

## 输出约定 - 输出根目录默认为 `./mineru-output/`。 - MinerU 会在输出根目录下为每个文档创建子文件夹(例如 `./mineru-output/<basename>/...`)。

## 批处理 默认为单 PDF 解析。仅在明确要求时实现批量文件夹解析。

更多产品