腾讯开源TencentDB Agent Memory：四层本地记忆管道，AI Agent上下文缩减61%

一句话看懂

腾讯开源了TencentDB Agent Memory，一个四层本地记忆管道，让AI Agent在长期任务中token消耗降低61%，通过率提升51%，且完全本地运行。

详细发生了什么

腾讯发布了TencentDB Agent Memory，一个面向AI Agent的开源记忆系统，采用MIT许可。它解决的是长期运行Agent的常见痛点：上下文膨胀和回忆失败。系统结合了符号短期记忆和分层长期记忆，作为OpenClaw插件和Hermes Agent的Docker镜像发布。默认后端是本地SQLite + sqlite-vec扩展，无需外部API。

核心架构是四层语义金字塔：L0对话（原始对话）、L1原子（原子事实）、L2场景（场景块）、L3人格（用户画像）。查询时先查人格层，需要细节时再向下钻取。短期记忆通过Mermaid语法将工具日志卸载到外部文件，Agent在上下文中只保留符号图，需要时通过node_id检索原始文本。

基准测试（腾讯自测）显示：在WideSearch上，集成插件后通过率从33%提升到50%（相对提升51.52%），token从221.31M降至85.64M（减少61.38%）；在SWE-bench上，成功率从58.4%升至64.2%，token从3474.1M降至2375.4M（减少33.09%）；PersonaMem准确率从48%升至76%。

检索默认使用BM25+向量嵌入的混合策略，通过RRF融合，支持中文（jieba）分词。开发者可切换纯关键词或纯嵌入模式。

中文圈视角

对中文用户来说，这个项目有几个直接价值：

完全本地运行：默认SQLite + sqlite-vec，不需要任何外部API，数据不出本地，对数据合规敏感的企业和开发者非常友好。国内很多Agent框架（如Dify、FastGPT）依赖云端向量数据库，TencentDB Agent Memory提供了一种零依赖的替代方案。
中文支持：BM25分词器内置jieba中文分词，L1原子提取默认每5轮对话触发一次，人格每50条新记忆生成一次。这意味着中文Agent的长期记忆效果有原生保障，不像某些海外方案需要额外配置中文分词。
国产替代对比：相比Mem0（原MemGPT）等海外记忆方案，TencentDB Agent Memory的差异化在于四层金字塔结构——不是扁平向量库，而是有层次地组织记忆，上层结构（人格、场景）可读性强，适合调试。国内类似项目如AgentBase的记忆模块相对简单，TencentDB Agent Memory的符号短期记忆（Mermaid画布）是一个创新点。
潜在盲点：目前中文社区讨论Agent记忆多集中在RAG和向量检索，对“符号记忆+分层结构”关注较少。这个项目可能启发国内开发者重新思考Agent记忆的设计——不是所有记忆都需要向量化，结构化符号表示在某些场景下更高效。

几条值得记住的细节

安装简单：OpenClaw插件只需一个npm包 @tencentdb-agent-memory/memory-tencentdb，配置文件中加一行 "enabled": true 即可启用。
默认模型：Hermes Docker镜像默认使用腾讯云DeepSeek-V3.2，但任何兼容OpenAI的端点都可通过 MODEL_PROVIDER=custom 切换。
存储路径：记忆文件默认存放在 ~/.openclaw/memory-tdai/，所有文件为人类可读的Markdown格式，便于白盒调试。
超时机制：召回默认5秒超时，超时后跳过注入而非阻塞对话，保证Agent流畅运行。
可配置性强：召回策略、最大结果数、提取频率等均有默认值，但可通过配置文件调整。

一句话总结

如果你在开发需要长期记忆的AI Agent，TencentDB Agent Memory提供了一个本地、分层、可调试的开源方案，尤其适合中文场景。