YC总裁开源GBrain:用8层架构突破AI记忆困境,打造真正的「第二大脑」

2026年5月18日

62

381

YC总裁开源GBrain:用8层架构突破AI记忆困境,打造真正的「第二大脑」

大语言模型参数规模已突破万亿,却在「记忆」这件事上频频翻车。上下文窗口从32K扩展到128K,AI能在几秒内读完一本《三体》,但只要对话一长、时间跨度一大,它就会把之前的设定忘得干干净净——前脚刚说完的偏好,后脚就彻底失忆,甚至开始「自己编造记忆」。这是AI发展的结构性缺陷,而非简单的技术瓶颈。

GBrain:AI的第二大脑如何炼成

YC总裁Garry Tan在X平台上公布了他的解决方案——GBrain,瞬间引爆AI社区。截至目前,该项目已在GitHub斩获超过1.6万颗星。GBrain的工作模式如同一个永不停歇的「数字分身」:当你入睡时,它会自动摄取白天的会议记录、邮件、推文、语音通话以及随手写下的碎片想法。更关键的是,它不仅做简单的信息存储,还会在夜间像人类大脑一样进行「梦境整合」——自动丰富实体信息、修复错误引用、合并冗余记忆。第二天醒来,你的AI Agent已完成新一轮认知进化。

8层架构 vs 传统4层RAG

GBrain与传统RAG方案的核心差异在于架构层级的深度扩展。传统RAG通常只有4层(分块→嵌入→索引→查询),检索完即结束。而GBrain扩展为8层架构,真正实现了从「找得到」到「记住并进化」的跨越。 前四层聚焦于基础检索能力的强化: • 分块策略(Chunking):文本分割方式至关重要,代码与会议记录的分块逻辑截然不同。GBrain采用迭代至v4版本的分块器,能够精准处理Markdown结构、代码块和前置元数据。 • 嵌入模型(Embedding):将文本块转化为向量表示。团队测试了3家嵌入服务供应商,以找出最匹配自身语料库语义特征的方案——并非所有嵌入模型都能对所有数据类型表现出色。 • 索引结构(Indexing):快速查找的数据结构直接决定检索效率。没有索引时,复杂度为O(n);有索引后降至O(log n)。在处理37.5万个文本块时,这相当于2秒与2毫秒的天壤之别。 • 查询理解(Query Understanding):GBrain的tokenmax模式会进行查询扩展,将用户问题改写为多个搜索请求以扩大检索范围;意图检测模块则判断用户要找的

模型越来越聪明,但始终不记事。GBrain不再只是让AI「查得到信息」,而是试图让AI形成可持续演化的记忆结构。

“社区评论”
🦞

JimoClaw — 桌面 AI Agent 工作台

让 AI 处理本地资料、操控浏览器,最终交付可直接使用的文档、表格与 PPT,而不只是一段回答。

下载桌面版

前四层:基础检索强化

后四层才是GBrain的真正壁垒所在,也是社区认为的「护城河」: • 重排序层(Reranking):初次搜索返回候选结果后,由重排序器(如ZE的zerank-2模型)用更复杂、成本更高的模型重新打分。实测数据显示,92%的第一名结果在这一步发生了变动。 • 认识论层(Epistemology Layer):严格记录每一个事实的来源、时间戳和置信度。AI不仅知道结论是什么,还知道这个结论是谁在什么时候说的、靠不靠谱。 • 实体知识图谱(Entity Knowledge Graph):包含超过14万条带类型的关联边,打通了人物→公司→会议→概念的关系网络。例如搜索某个人物时,图谱能识别出他与白宫、顶级风投机构、AI政策乃至社交群组的关联。 • 梦境循环(Synthesis Cycles):模拟人类的深度睡眠机制。在系统闲时(如夜间),自主触发定时任务,合并同类项、提炼长期认知、修补逻辑断层。

后四层:记忆与认知进化引擎

实测数据也印证了架构优势:GBrain在由Opus生成的240页富文本语料库上评估,P@5达到49.1%(前5个结果中正确率),R@5达到97.9%(应被找出的正确答案中有多少被包含在前5名)。相比关闭图谱功能的版本,P@5提升了31.4个百分点,同时显著优于传统的ripgrep-BM25+向量检索方案。 Garry Tan透露,他已在自己的7人团队中部署GBrain,效果非常出色。他预计:「企业很可能是由这些个人AI组成的集合体。」这一观点引发了社区热议,有网友表示:「这是正确的方向,一旦这种模式普及,个人生产力将会得到极大提升。」

🛡️

积墨 AI 安全隐患巡检系统

任务一键下达 · 隐患 AI 识别 · 整改全程留痕 · 报告一键生成。让安全巡检真正看得见、管得住、能闭环。

了解方案

如有侵权,请联系删除。

Related Articles

联系我们 免费试用
小墨 AI