ClawSkills logoClawSkills

News Aggregator Skill

综合新闻聚合器,从 Hacker News、GitHub Trending、Product Hunt、36K 等 8 个主要来源获取、过滤和深度分析实时内容

介绍

# News Aggregator Skill

从多个来源获取实时热点新闻。

## 工具

### fetch_news.py

**使用方法:**

```bash ### Single Source (Limit 10) ```bash ### 全局扫描(选项 12)- **广泛获取策略** > **注意**:此策略专门用于“全局扫描”场景,旨在捕捉所有趋势。

```bash # 1. Fetch broadly (Massive pool for Semantic Filtering) python3 scripts/fetch_news.py --source all --limit 15 --deep

# 2. SEMANTIC FILTERING: # Agent manually filters the broad list (approx 120 items) for user's topics. ```

### 单一来源与组合(智能关键词扩展) **关键**:你必须自动将用户的简单关键词扩展,以覆盖整个领域。 * 用户:“AI” -> Agent 使用:`--keyword "AI,LLM,GPT,Claude,Generative,Machine Learning,RAG,Agent"` * 用户:“Android” -> Agent 使用:`--keyword "Android,Kotlin,Google,Mobile,App"` * 用户:“Finance” -> Agent 使用:`--keyword "Finance,Stock,Market,Economy,Crypto,Gold"`

```bash # Example: User asked for "AI news from HN" (Note the expanded keywords) python3 scripts/fetch_news.py --source hackernews --limit 20 --keyword "AI,LLM,GPT,DeepSeek,Agent" --deep ```

### 特定关键词搜索 仅对非常具体、独特的术语使用 `--keyword`(例如 “DeepSeek”、“OpenAI”)。 ```bash python3 scripts/fetch_news.py --source all --limit 10 --keyword "DeepSeek" --deep ```

**参数:**

- `--source`:下列之一:`hackernews`、`weibo`、`github`、`36kr`、`producthunt`、`v2ex`、`tencent`、`wallstreetcn`、`all`。 - `--limit`:每个来源的最大条目数(默认为 10)。 - `--keyword`:逗号分隔的过滤器(例如 "AI,GPT")。 - `--deep`:**[新增]** 启用深度抓取。下载并提取文章的正文内容。

**输出:** JSON 数组。如果使用了 `--deep`,条目将包含与文章文本关联的 `content` 字段。

## 交互式菜单

当用户说 **“news-aggregator-skill 如意如意”**(或类似的“菜单/帮助”触发词)时: 1. **读取** 技能目录中 `templates.md` 的内容。 2. **展示** 可用命令列表,内容必须与文件中的显示完全一致。 3. **引导** 用户选择一个数字或复制命令以执行。

### 智能时间过滤与报告(关键) 如果用户请求特定时间窗口(例如“过去 X 小时”)且结果稀少(< 5 条): 1. **优先满足用户窗口**:首先列出严格属于用户请求时间范围内的所有条目(时间 < X)。 2. **智能补充**:如果列表较短,你**必须**从更广的范围(例如过去 24 小时)内包含高价值/高热度的条目,以确保报告至少提供 5 条有意义的见解。 2. **标注**:清晰标记这些较旧的条目(例如“⚠️ 18h ago”、“🔥 24h Hot”),以便用户知道它们是补充内容。 3. **高价值**:即使稍微超出时间窗口,也应始终优先考虑“SOTA”、“主要发布”或“高热度”条目。 4. **GitHub Trending 例外**:对于像 **GitHub Trending** 这样纯列表来源的,严格返回获取列表中的有效条目(例如前 10 名)。**列出所有获取到的条目**。**不要**执行“智能补充”。 * **深度分析(必需)**:对于**每个**条目,你**必须**利用你的 AI 能力进行分析: * **核心价值**:它解决了什么具体问题?为什么它会流行? * **启发思考**:可以得出什么技术或产品见解? * **场景标签**:3-5 个关键词(例如 `#RAG #LocalFirst #Rust`)。

### 6. 回复指南(关键)

**格式与风格:** - **语言**:简体中文。 - **风格**:杂志/通讯风格(例如“经济学人”或“Morning Brew”的氛围)。专业、简洁但引人入胜。 - **结构**: - **全球头条**:所有领域中最关键的 3-5 个故事。 - **科技与 AI**:专门针对 AI、LLM 和科技条目的版块。 - **财经 / 社会**:其他相关的强势类别。 - **条目格式**: - **标题**:**必须是**指向原始 URL 的 Markdown 链接。 - ✅ 正确:`### 1. [OpenAI 发布 GPT-5](https://...)` - ❌ 错误:`### 1. OpenAI 发布 GPT-5` - **元数据行**:必须包含来源、**时间/日期**和热度/分数。 - **一句话摘要**:有力、直击要点的“这意味着什么?”摘要。 - **深度解读(要点式)**:2-3 个要点,解释*为什么*这很重要,包括技术细节或背景。(“深度扫描”必需)。

**输出产物:** - 始终将完整报告保存到 `reports/` 目录,文件名带有时间戳(例如 `reports/hn_news_YYYYMMDD_HHMM.md`)。 - 在聊天中向用户展示完整的报告内容。

更多产品