AI 快讯 编译自 marktechpost #开源项目#AI Agent#知识图谱

GBrain 开源记忆层教程:Y Combinator 总裁 Garry Tan 用正则而非 LLM 构建 AI Agent 知识图谱

Y Combinator 总裁 Garry Tan 开源了 GBrain,一个基于 Markdown 和 Postgres 的记忆层,通过正则推理自动构建知识图谱,无需 LLM 调用。本文提供 20 分钟上手教程,涵盖安装、导入笔记、混合搜索和连接 Claude Code。

编译发布 2026/05/24 原文发布 2026/05/22

一句话看懂

Y Combinator 总裁 Garry Tan 开源了 GBrain,一个基于 Markdown 和 Postgres 的记忆层,用正则而非 LLM 自动构建知识图谱,让 AI Agent 拥有持久记忆。

详细发生了什么

AI Agent 每次新会话都从零开始,没有会议、笔记或决策的记忆。GBrain 正是为解决这个问题而生。它由 Y Combinator 总裁兼 CEO Garry Tan 开发,用于驱动他自己的 OpenClaw 和 Hermes 部署。GBrain 是一个以 Markdown 优先、Postgres 为后端的知识层,可以摄入会议记录、邮件、推文和笔记,然后自动构建带类型的知识图谱——且图谱提取过程完全不需要 LLM 调用。

Garry 实际 Agent 的生产大脑目前包含 146,646 个页面、24,585 个人、5,339 家公司以及 66 个自主 cron 任务。在其自有基准 BrainBench(240 页长篇散文语料库)上,GBrain 的 P@5 达到 49.1%,R@5 达到 97.9%,比禁用图谱层的同一代码库 P@5 高出 31.4 个百分点。

本文是一份实操教程,你将本地安装 GBrain,导入一个小型笔记文件夹,运行真实搜索,观察知识图谱自动构建,并通过 MCP 将其连接到 Claude Code。整个过程约 20 分钟。所有终端输出均来自 GBrain v0.38.2.0 的实时安装。仓库地址:github.com/garrytan/gbrain,采用 MIT 许可。

中文圈视角

GBrain 对中文用户来说有几点值得关注:

  1. 无需梯子即可本地运行:GBrain 使用 PGLite(Postgres 编译为 WASM),完全本地运行,无需服务器或 Docker。数据不出本地,对数据安全敏感的用户友好。但注意,混合搜索需要嵌入 API key(ZeroEntropy、OpenAI 或 Voyage),这些服务可能需要网络访问。

  2. 国产替代对比:目前国内类似项目有 Dify 的记忆模块、FastGPT 的知识库,但它们通常依赖 LLM 进行图谱构建,成本较高。GBrain 的纯正则方案在效率和成本上有优势,但中文 wikilink 解析可能需要额外适配(正则对中文分词不友好)。

  3. 中文场景应用:对于需要长期记忆的 AI 写作助手、个人知识管理工具,GBrain 的 markdown-first 设计很适合 Obsidian 用户。但中文笔记中的实体识别(如人名、公司名)可能不如英文准确,需要用户手动添加 wikilink。

  4. 合规角度:GBrain 本地运行,数据不出境,符合国内数据安全要求。但若使用 OpenAI 等外部嵌入服务,需注意数据出境合规。

几条值得记住的细节

  • GBrain 图谱提取完全基于正则和类型推断,零 LLM 调用,顺序为:FOUNDED → INVESTED → ADVISES → WORKS_AT → MENTIONS。
  • 安装只需 Bun ≥ 1.3.10 和一条命令:bun install -g github:garrytan/gbrain
  • 数据库使用 PGLite(Postgres 17 WASM 版本),无需服务器配置,初始化约 2 秒。
  • 混合搜索结合向量 + BM25 关键词 + RRF 融合,默认使用 ZeroEntropy 重排序器。
  • MCP 服务器暴露 74 个工具,Claude Code、Cursor、Windsurf 可直接读写 brain。

一句话总结

GBrain 让 AI Agent 拥有持久记忆,且无需 LLM 参与图谱构建——20 分钟即可上手,适合本地知识管理场景。