GBrain 开源记忆层教程：Y Combinator 总裁 Garry Tan 用正则而非 LLM 构建 AI Agent 知识图谱

一句话看懂

Y Combinator 总裁 Garry Tan 开源了 GBrain，一个基于 Markdown 和 Postgres 的记忆层，用正则而非 LLM 自动构建知识图谱，让 AI Agent 拥有持久记忆。

详细发生了什么

AI Agent 每次新会话都从零开始，没有会议、笔记或决策的记忆。GBrain 正是为解决这个问题而生。它由 Y Combinator 总裁兼 CEO Garry Tan 开发，用于驱动他自己的 OpenClaw 和 Hermes 部署。GBrain 是一个以 Markdown 优先、Postgres 为后端的知识层，可以摄入会议记录、邮件、推文和笔记，然后自动构建带类型的知识图谱——且图谱提取过程完全不需要 LLM 调用。

Garry 实际 Agent 的生产大脑目前包含 146,646 个页面、24,585 个人、5,339 家公司以及 66 个自主 cron 任务。在其自有基准 BrainBench（240 页长篇散文语料库）上，GBrain 的 P@5 达到 49.1%，R@5 达到 97.9%，比禁用图谱层的同一代码库 P@5 高出 31.4 个百分点。

本文是一份实操教程，你将本地安装 GBrain，导入一个小型笔记文件夹，运行真实搜索，观察知识图谱自动构建，并通过 MCP 将其连接到 Claude Code。整个过程约 20 分钟。所有终端输出均来自 GBrain v0.38.2.0 的实时安装。仓库地址：github.com/garrytan/gbrain，采用 MIT 许可。

中文圈视角

GBrain 对中文用户来说有几点值得关注：

无需梯子即可本地运行：GBrain 使用 PGLite（Postgres 编译为 WASM），完全本地运行，无需服务器或 Docker。数据不出本地，对数据安全敏感的用户友好。但注意，混合搜索需要嵌入 API key（ZeroEntropy、OpenAI 或 Voyage），这些服务可能需要网络访问。
国产替代对比：目前国内类似项目有 Dify 的记忆模块、FastGPT 的知识库，但它们通常依赖 LLM 进行图谱构建，成本较高。GBrain 的纯正则方案在效率和成本上有优势，但中文 wikilink 解析可能需要额外适配（正则对中文分词不友好）。
中文场景应用：对于需要长期记忆的 AI 写作助手、个人知识管理工具，GBrain 的 markdown-first 设计很适合 Obsidian 用户。但中文笔记中的实体识别（如人名、公司名）可能不如英文准确，需要用户手动添加 wikilink。
合规角度：GBrain 本地运行，数据不出境，符合国内数据安全要求。但若使用 OpenAI 等外部嵌入服务，需注意数据出境合规。

几条值得记住的细节

GBrain 图谱提取完全基于正则和类型推断，零 LLM 调用，顺序为：FOUNDED → INVESTED → ADVISES → WORKS_AT → MENTIONS。
安装只需 Bun ≥ 1.3.10 和一条命令：bun install -g github:garrytan/gbrain。
数据库使用 PGLite（Postgres 17 WASM 版本），无需服务器配置，初始化约 2 秒。
混合搜索结合向量 + BM25 关键词 + RRF 融合，默认使用 ZeroEntropy 重排序器。
MCP 服务器暴露 74 个工具，Claude Code、Cursor、Windsurf 可直接读写 brain。

一句话总结

GBrain 让 AI Agent 拥有持久记忆，且无需 LLM 参与图谱构建——20 分钟即可上手，适合本地知识管理场景。