ClawSkills logoClawSkills

Local Rag Search

利用 mcp-local-rag 服务器和语义相似度排序高效执行网络搜索。当需要搜索网络上的最新信息时使用此技能。

介绍

# Local RAG Search Skill

此技能使您能够有效地使用 mcp-local-rag MCP 服务器,进行具备语义排序功能的智能网络搜索。该服务器执行类似 RAG 的相似度评分,以优先返回最相关的结果,而无需任何外部 API。

## 可用工具

### 1. `rag_search_ddgs` - DuckDuckGo 搜索

用于注重隐私的通用网络搜索。

**何时使用:** - 用户偏好注重隐私的搜索 - 通用信息查询 - 大多数查询的默认选择

**参数:** - `query`:自然语言搜索查询 - `num_results`:初始获取的结果数(默认:10) - `top_k`:返回的最相关结果数(默认:5) - `include_urls`:是否包含源 URL(默认:true)

### 2. `rag_search_google` - Google 搜索

用于全面、技术性或详细的搜索。

**何时使用:** - 技术或科学类查询 - 需要全面的覆盖 - 搜索特定文档

### 3. `deep_research` - 多引擎深度研究

用于跨多个搜索引擎的全面研究。

**何时使用:** - 研究需要广泛覆盖的复杂主题 - 需要来自多个来源的不同视角 - 收集关于某个主题的全面信息

**可用后端:** - `duckduckgo`:注重隐私的通用搜索 - `google`:全面的技术结果 - `bing`:微软搜索引擎 - `brave`:隐私优先搜索 - `wikipedia`:百科/事实性内容 - `yahoo`、`yandex`、`mojeek`、`grokipedia`:替代引擎

**默认:** `[["duckduckgo", "google"]]`

### 4. `deep_research_google` - 仅 Google 深度研究

仅使用 Google 进行深度研究的快捷方式。

### 5. `deep_research_ddgs` - 仅 DuckDuckGo 深度研究

仅使用 DuckDuckGo 进行深度研究的快捷方式。

## 最佳实践

### 查询构建 1. **使用自然语言**:以问题或描述性短语的形式编写查询 - 好:“latest developments in quantum computing”(量子计算领域的最新进展) - 好:“how to implement binary search in Python”(如何在 Python 中实现二分查找) - 避免:“quantum”或“Python”等单一关键词

2. **保持具体**:包含上下文和细节 - 好:“React hooks best practices for 2024”(2024 年 React hooks 最佳实践) - 更好:“React useEffect cleanup function best practices”(React useEffect 清理函数最佳实践)

### 工具选择策略

1. **单一主题,快速回答** → 使用 `rag_search_ddgs` 或 `rag_search_google` ``` rag_search_ddgs( query="What is the capital of France?", top_k=3 ) ```

2. **技术/科学查询** → 使用 `rag_search_google` ``` rag_search_google( query="Docker multi-stage build optimization techniques", num_results=15, top_k=7 ) ```

3. **全面研究** → 使用 `deep_research` 并配合多个搜索词 ``` deep_research( search_terms=[ "machine learning fundamentals", "neural networks architecture", "deep learning best practices 2024" ], backends=["google", "duckduckgo"], top_k_per_term=5 ) ```

4. **事实/百科内容** → 使用 `deep_research` 并配合维基百科 ``` deep_research( search_terms=["World War II timeline", "WWII key battles"], backends=["wikipedia"], num_results_per_term=5 ) ```

### 参数调优

**针对快速回答:** - `num_results=5-10`,`top_k=3-5`

**针对全面研究:** - `num_results=15-20`,`top_k=7-10`

**针对深度研究:** - `num_results_per_term=10-15`,`top_k_per_term=3-5` - 使用 2-5 个相关搜索词 - 使用 1-3 个后端(越多越全面,但速度越慢)

## 工作流示例

### 示例 1:时事 ``` Task: "What happened at the UN climate summit last week?"

1. Use rag_search_google for recent news coverage 2. Set top_k=7 for comprehensive view 3. Present findings with source URLs ```

### 示例 2:技术深度解析 ``` Task: "How do I optimize PostgreSQL queries?"

1. Use deep_research with multiple specific terms: - "PostgreSQL query optimization techniques" - "PostgreSQL index best practices" - "PostgreSQL EXPLAIN ANALYZE tutorial" 2. Use backends=["google", "stackoverflow"] if available 3. Synthesize findings into actionable guide ```

### 示例 3:多视角研究 ``` Task: "Research the impact of remote work on productivity"

1. Use deep_research with diverse search terms: - "remote work productivity statistics 2024" - "hybrid work model effectiveness studies" - "work from home challenges research" 2. Use backends=["google", "duckduckgo"] for broad coverage 3. Synthesize different perspectives and studies ```

## 指南

1. **始终引用来源**:当 `include_urls=True` 时,在回复中引用源 URL 2. **验证时效性**:检查内容是否为最新且相关 3. **交叉参考**:对于重要事实,使用多个搜索词或引擎 4. **尊重隐私**:除非特定需求要求使用 Google,否则通用查询使用 DuckDuckGo 5. **批量相关查询**:研究主题时,为 `deep_research` 创建多个相关搜索词 6. **语义相关性**:信任 RAG 评分 - 排名靠前的结果在语义上最接近查询 7. **解释您的选择**:简要说明您正在使用哪个工具以及原因

## 错误处理

如果搜索返回结果不足: 1. 尝试用不同的关键词重新表述查询 2. 切换到不同的后端 3. 增加 `num_results` 参数 4. 使用 `deep_research` 并配合多个相关搜索词

## 隐私注意事项

- DuckDuckGo:注重隐私,不跟踪用户 - Google:覆盖范围最广,但会跟踪搜索记录 - 推荐默认使用 DuckDuckGo,除非用户特别需要 Google 的覆盖范围

## 性能说明

- 首次搜索可能会较慢(模型加载) - 后续搜索速度更快(模型已缓存) - 更多后端 = 覆盖更全面,但速度更慢 - 根据用例调整 `num_results` 和 `top_k`

更多产品