介绍
# PDF Extract
从 PDF 文件中提取文本以供 LLM 处理。使用 poppler-utils 包中的 `pdftotext` 将 PDF 文档转换为纯文本。
## 命令
```bash # Extract all text from a PDF pdf-extract "document.pdf"
# Extract text from specific pages pdf-extract "document.pdf" --pages 1-5 ```
## 安装
```bash sudo dnf install poppler-utils ```