ClawSkills logoClawSkills

memory_baidu_embedding_db

使用 Baidu Embedding-V1 的语义记忆系统,用于 Clawdbot 中安全、本地的向量存储和检索,具有 SQLite 持久化功能。

介绍

# Memory Baidu Embedding DB - Semantic Memory for Clawdbot

**使用百度 Embedding 技术的基于向量的记忆存储与检索**

这是 Clawdbot 的一个语义记忆系统,使用百度的 Embedding-V1 模型根据含义而非关键词来存储和检索记忆。旨在作为传统向量数据库(如 LanceDB)的安全、本地化替代方案。

## 🚀 功能特性

- **语义记忆搜索** - 根据含义查找记忆,而不仅仅是关键词 - **百度 Embedding 集成** - 使用百度强大的 Embedding-V1 模型 - **SQLite 持久化** - 无需外部依赖的本地、安全存储 - **零数据泄露** - 所有处理均在本地使用您的 API 凭证完成 - **灵活的标签系统** - 使用自定义标签和元数据组织记忆 - **高性能** - 优化的向量相似度计算 - **轻松迁移** - 可作为 memory-lancedb 系统的直接替代品

## 🎯 使用场景

- **对话上下文** - 记住用户偏好和对话历史 - **知识管理** - 语义化地存储和检索信息 - **个性化** - 维护用户特定的设置和偏好 - **信息检索** - 根据含义查找相关信息 - **数据组织** - 使用标签和元数据构建记忆结构

## 📋 系统要求

- Clawdbot 安装 - 百度千帆 API 凭证(API Key 和 Secret Key) - Python 3.8+ - 用于初始 API 调用的互联网连接

## 🛠️ 安装

### 手动安装

1. 将技能文件放入您的 `~/clawd/skills/` 目录 2. 安装依赖项(如果需要任何 Python 包) 3. 配置您的百度 API 凭证

### 配置

设置环境变量: ```bash export BAIDU_API_STRING='${BAIDU_API_STRING}' export BAIDU_SECRET_KEY='${BAIDU_SECRET_KEY}' ```

## 🚀 使用示例

### 基本用法 ```python from memory_baidu_embedding_db import MemoryBaiduEmbeddingDB

# Initialize the memory system memory_db = MemoryBaiduEmbeddingDB()

# Add a memory memory_db.add_memory( content="The user prefers concise responses and enjoys technical discussions", tags=["user-preference", "communication-style"], metadata={"importance": "high"} )

# Search for related memories using natural language related_memories = memory_db.search_memories("What does the user prefer?", limit=3) ```

### 高级用法 ```python # Add multiple memories with rich metadata memory_db.add_memory( content="User's favorite programming languages are Python and JavaScript", tags=["tech-preference", "programming"], metadata={"confidence": 0.95, "source": "conversation-2026-01-30"} )

# Search with tag filtering filtered_memories = memory_db.search_memories( query="programming languages", tags=["tech-preference"], limit=5 ) ```

## 🔧 集成

该技能与 Clawdbot 的记忆系统无缝集成,可作为 memory-lancedb 的直接替代品。只需更新您的配置以使用此记忆系统,即可替换原有的系统。

## 📊 性能

- **向量维度**:384(百度 Embedding-V1 输出) - **存储**:SQLite 数据库(每 1000 条记忆约 1MB) - **搜索速度**:1000 条记忆约 50ms(在典型硬件上) - **API 延迟**:取决于百度 API 响应时间(通常 <500ms)

## 🔐 安全性

- **本地存储**:所有记忆存储在本地 SQLite 数据库中 - **加密的 API 密钥**:凭证安全地存储在环境变量中 - **无外部共享**:记忆永远不会离开您的系统 - **选择性访问**: 对存储内容进行精细控制

## 🔄 从 memory-lancedb 迁移

1. 将此技能**安装**在您的 `skills/` 目录中 2. **配置您的百度 API 凭证** 3. **初始化新系统** 4. **更新您的机器人配置**以使用新的记忆系统 5. **验证数据完整性**和性能

## 🤝 贡献

我们欢迎贡献!请随时提交问题、功能请求或拉取请求以改进此技能。

更多产品