AI 快讯 编译自 marktechpost #模型发布#开源#AI Agent

腾讯开源TencentDB Agent Memory:四层本地记忆管道,AI Agent上下文缩减61%

腾讯开源TencentDB Agent Memory,一个完全本地的AI Agent记忆系统,采用MIT许可。它通过符号短期记忆和四层长期记忆金字塔(L0对话→L1原子→L2场景→L3人格)解决上下文膨胀和回忆失败问题。默认使用本地SQLite+sqlite-vec,无需外部API。基准测试显示,在WideSearch上token减少61.38%,通过率提升51.52%。

编译发布 2026/05/24 原文发布 2026/05/23

一句话看懂

腾讯开源了TencentDB Agent Memory,一个四层本地记忆管道,让AI Agent在长期任务中token消耗降低61%,通过率提升51%,且完全本地运行。

详细发生了什么

腾讯发布了TencentDB Agent Memory,一个面向AI Agent的开源记忆系统,采用MIT许可。它解决的是长期运行Agent的常见痛点:上下文膨胀和回忆失败。系统结合了符号短期记忆和分层长期记忆,作为OpenClaw插件和Hermes Agent的Docker镜像发布。默认后端是本地SQLite + sqlite-vec扩展,无需外部API。

核心架构是四层语义金字塔:L0对话(原始对话)、L1原子(原子事实)、L2场景(场景块)、L3人格(用户画像)。查询时先查人格层,需要细节时再向下钻取。短期记忆通过Mermaid语法将工具日志卸载到外部文件,Agent在上下文中只保留符号图,需要时通过node_id检索原始文本。

基准测试(腾讯自测)显示:在WideSearch上,集成插件后通过率从33%提升到50%(相对提升51.52%),token从221.31M降至85.64M(减少61.38%);在SWE-bench上,成功率从58.4%升至64.2%,token从3474.1M降至2375.4M(减少33.09%);PersonaMem准确率从48%升至76%。

检索默认使用BM25+向量嵌入的混合策略,通过RRF融合,支持中文(jieba)分词。开发者可切换纯关键词或纯嵌入模式。

中文圈视角

对中文用户来说,这个项目有几个直接价值:

  1. 完全本地运行:默认SQLite + sqlite-vec,不需要任何外部API,数据不出本地,对数据合规敏感的企业和开发者非常友好。国内很多Agent框架(如Dify、FastGPT)依赖云端向量数据库,TencentDB Agent Memory提供了一种零依赖的替代方案。

  2. 中文支持:BM25分词器内置jieba中文分词,L1原子提取默认每5轮对话触发一次,人格每50条新记忆生成一次。这意味着中文Agent的长期记忆效果有原生保障,不像某些海外方案需要额外配置中文分词。

  3. 国产替代对比:相比Mem0(原MemGPT)等海外记忆方案,TencentDB Agent Memory的差异化在于四层金字塔结构——不是扁平向量库,而是有层次地组织记忆,上层结构(人格、场景)可读性强,适合调试。国内类似项目如AgentBase的记忆模块相对简单,TencentDB Agent Memory的符号短期记忆(Mermaid画布)是一个创新点。

  4. 潜在盲点:目前中文社区讨论Agent记忆多集中在RAG和向量检索,对“符号记忆+分层结构”关注较少。这个项目可能启发国内开发者重新思考Agent记忆的设计——不是所有记忆都需要向量化,结构化符号表示在某些场景下更高效。

几条值得记住的细节

  • 安装简单:OpenClaw插件只需一个npm包 @tencentdb-agent-memory/memory-tencentdb,配置文件中加一行 "enabled": true 即可启用。
  • 默认模型:Hermes Docker镜像默认使用腾讯云DeepSeek-V3.2,但任何兼容OpenAI的端点都可通过 MODEL_PROVIDER=custom 切换。
  • 存储路径:记忆文件默认存放在 ~/.openclaw/memory-tdai/,所有文件为人类可读的Markdown格式,便于白盒调试。
  • 超时机制:召回默认5秒超时,超时后跳过注入而非阻塞对话,保证Agent流畅运行。
  • 可配置性强:召回策略、最大结果数、提取频率等均有默认值,但可通过配置文件调整。

一句话总结

如果你在开发需要长期记忆的AI Agent,TencentDB Agent Memory提供了一个本地、分层、可调试的开源方案,尤其适合中文场景。