介绍
# Memory Baidu Embedding DB - Semantic Memory for Clawdbot
**使用百度 Embedding 技术的基于向量的记忆存储与检索**
这是 Clawdbot 的一个语义记忆系统,使用百度的 Embedding-V1 模型根据含义而非关键词来存储和检索记忆。旨在作为传统向量数据库(如 LanceDB)的安全、本地化替代方案。
## 🚀 功能特性
- **语义记忆搜索** - 根据含义查找记忆,而不仅仅是关键词 - **百度 Embedding 集成** - 使用百度强大的 Embedding-V1 模型 - **SQLite 持久化** - 无需外部依赖的本地、安全存储 - **零数据泄露** - 所有处理均在本地使用您的 API 凭证完成 - **灵活的标签系统** - 使用自定义标签和元数据组织记忆 - **高性能** - 优化的向量相似度计算 - **轻松迁移** - 可作为 memory-lancedb 系统的直接替代品
## 🎯 使用场景
- **对话上下文** - 记住用户偏好和对话历史 - **知识管理** - 语义化地存储和检索信息 - **个性化** - 维护用户特定的设置和偏好 - **信息检索** - 根据含义查找相关信息 - **数据组织** - 使用标签和元数据构建记忆结构
## 📋 系统要求
- Clawdbot 安装 - 百度千帆 API 凭证(API Key 和 Secret Key) - Python 3.8+ - 用于初始 API 调用的互联网连接
## 🛠️ 安装
### 手动安装
1. 将技能文件放入您的 `~/clawd/skills/` 目录 2. 安装依赖项(如果需要任何 Python 包) 3. 配置您的百度 API 凭证
### 配置
设置环境变量: ```bash export BAIDU_API_STRING='${BAIDU_API_STRING}' export BAIDU_SECRET_KEY='${BAIDU_SECRET_KEY}' ```
## 🚀 使用示例
### 基本用法 ```python from memory_baidu_embedding_db import MemoryBaiduEmbeddingDB
# Initialize the memory system memory_db = MemoryBaiduEmbeddingDB()
# Add a memory memory_db.add_memory( content="The user prefers concise responses and enjoys technical discussions", tags=["user-preference", "communication-style"], metadata={"importance": "high"} )
# Search for related memories using natural language related_memories = memory_db.search_memories("What does the user prefer?", limit=3) ```
### 高级用法 ```python # Add multiple memories with rich metadata memory_db.add_memory( content="User's favorite programming languages are Python and JavaScript", tags=["tech-preference", "programming"], metadata={"confidence": 0.95, "source": "conversation-2026-01-30"} )
# Search with tag filtering filtered_memories = memory_db.search_memories( query="programming languages", tags=["tech-preference"], limit=5 ) ```
## 🔧 集成
该技能与 Clawdbot 的记忆系统无缝集成,可作为 memory-lancedb 的直接替代品。只需更新您的配置以使用此记忆系统,即可替换原有的系统。
## 📊 性能
- **向量维度**:384(百度 Embedding-V1 输出) - **存储**:SQLite 数据库(每 1000 条记忆约 1MB) - **搜索速度**:1000 条记忆约 50ms(在典型硬件上) - **API 延迟**:取决于百度 API 响应时间(通常 <500ms)
## 🔐 安全性
- **本地存储**:所有记忆存储在本地 SQLite 数据库中 - **加密的 API 密钥**:凭证安全地存储在环境变量中 - **无外部共享**:记忆永远不会离开您的系统 - **选择性访问**: 对存储内容进行精细控制
## 🔄 从 memory-lancedb 迁移
1. 将此技能**安装**在您的 `skills/` 目录中 2. **配置您的百度 API 凭证** 3. **初始化新系统** 4. **更新您的机器人配置**以使用新的记忆系统 5. **验证数据完整性**和性能
## 🤝 贡献
我们欢迎贡献!请随时提交问题、功能请求或拉取请求以改进此技能。