ClawSkills logoClawSkills

Literature Review

通过 Semantic Scholar、OpenAlex、Crossref 和 PubMed API 搜索学术资源,协助撰写文献综述。当用户需要撰写文献综述时使用。

介绍

# Literature Review

利用多引擎搜索集成(S2, OA, CR, PM)帮助撰写学术文献综述。

## 功能

- **多源搜索**:使用 Semantic Scholar (S2)、OpenAlex (OA)、Crossref (CR) 和 PubMed (PM) 查找相关学术论文。 - **完整摘要**:所有来源现在均返回完整摘要(PubMed 使用 `efetch` 获取完整 XML 记录)。 - **DOI 提取**:从所有来源提取 DOI 以便交叉引用和去重。 - **自动去重**:搜索多个来源(`--source all` 或 `--source both`)时,结果会根据 DOI 自动去重。 - **礼貌访问**:通过 `USER_EMAIL` 环境变量为 OpenAlex/Crossref“礼貌池”自动提供电子邮件身份标识。 - **摘要重构**:从 OpenAlex 倒排索引格式重构摘要。 - **综合**:按主题对论文进行分组,并根据元数据起草综述部分。

## 环境变量

| 变量 | 用途 | 默认值 | |----------|---------|---------| | `USER_EMAIL` | 用于礼貌 API 访问的电子邮件 | `[email protected]` | | `CLAWDBOT_EMAIL` | 如果未设置 USER_EMAIL 则使用此回退值 | — | | `SEMANTIC_SCHOLAR_API_KEY` | 可选的 S2 API 密钥,以获得更高的速率限制 | — | | `OPENALEX_API_KEY` | 可选的 OpenAlex API 密钥 | — |

## 工作流程

### 1. 广泛搜索(所有数据库) 从所有主要学术数据库获取全面的概览。结果根据 DOI 自动去重。 ```bash python3 scripts/lit_search.py search "impact of glycyrrhiza on bifidobacterium" --limit 5 --source all ```

### 2. 定向搜索 - **OpenAlex** (`oa`):快速且全面,摘要质量好。 - **Semantic Scholar** (`s2`):高质量的引文数据和 TL;DR(一句话总结)。 - **Crossref** (`cr`):精确的基于 DOI 的元数据(无摘要)。 - **PubMed** (`pm`):生物医学研究的黄金标准,包含完整摘要和 PMID。

```bash python3 scripts/lit_search.py search "prebiotic effects of liquorice" --source pm ```

### 3. 比较来源 同时搜索 S2 和 OA 以确保不遗漏任何内容。默认去重。 ```bash python3 scripts/lit_search.py search "Bifidobacterium infantis growth" --source both ```

### 4. 获取完整详细信息 (S2) 检索包括 TL;DR 摘要在内的详细元数据。 ```bash python3 scripts/lit_search.py details "DOI:10.1016/j.foodchem.2023.136000" ```

### 5. 撰写综述 1. **提取**:从找到的摘要中提取关键发现。 2. **组织**:将发现归纳为逻辑结构(例如按时间顺序或按主题)。 3. **起草**:使用“循序渐进思考”的方法将多个来源综合成连贯的叙述。

## 输出格式

每个结果包括: - `id`:特定来源的标识符(PubMed 为 PMID,OpenAlex ID,S2 论文 ID,Crossref 为 DOI) - `doi`:可用的 DOI(用于去重) - `title`:论文标题 - `year`:发表年份 - `authors`:作者姓名列表 - `abstract`:完整摘要文本(可用时) - `venue`:期刊或会议名称 - `citationCount`:引文计数 (S2, OA) - `source`:结果来自哪个数据库

## 成功技巧

- **引文**:始终交叉引用 DOI 或 PMID 以确保参考文献的准确性。 - **筛选**:专注于 `citationCount` 较高或近年发表的论文,以获得更现代化的综述。 - **医学文献使用 PubMed**:使用 `--source pm` 获取最可靠的生物医学文献。 - **去重**:多源搜索会自动删除重复项;如果需要原始计数,请使用单一来源。

更多产品