Agent记忆:我们可能一直理解错了

2026年6月18日

73

315

Agent记忆:我们可能一直理解错了

在AI Agent开发领域,记忆(Memory)已成为一个被反复包装却又本质模糊的概念。图结构记忆、AutoMemory、做梦机制……各类框架层出不穷,每个新场景似乎都催生出一套新词汇。这种概念泛滥恰恰反映出整个行业对Agent记忆本质的认知不足。更令人忧虑的是,在眼花缭乱的技术包装之下,记忆究竟要走向何方,已成为一个被忽视的视野盲区。基于数月的工程落地实践,我们尝试构建一套系统性的认知框架。

三层记忆演进:从狭义到广义

最早的记忆分类直接套用了人类心理学的表面概念:短期记忆与长期记忆。短期记忆是大模型上下文窗口能够容纳的部分,包括简单的临时信息和用户偏好;长期记忆则是将历史交互全部记录,按需检索。这种二元论虽然直观,却很快在复杂工程实践中碰壁——它将记忆的内涵过于狭义地限定为对话历史,忽视了更广阔的记忆维度。

CoALA认知架构:广义记忆的分类法

2023年9月,CoALA(Cognitive Architectures for Language Agents)论文提出了一套革命性的认知架构分类法,将记忆划分为三个长期维度加一个短期工作空间:程序记忆(Procedural Memory)关乎"如何做",对应今天的Skill技能体系;语义记忆(Semantic Memory)关乎"是什么",对应RAG和知识库的业务知识沉淀;情景记忆(Episodic Memory)关乎"经历过什么",对应早期执着追求的会话历史。这套分类法以其惊人的精确度,踩中了这两年AI Agent演进的所有关键路径——程序记忆正是如火如荼的Skill赛道,语义记忆是沉淀无数业务知识的RAG与知识库,情景记忆则是最早期我们执着追寻的Session历史。

自然语言就像乐高积木,每一个Token都是一块最小的积木单元。当你要表达一个意图、一段记忆、一种逻辑时,你是在非线性高维空间中拼出一个特定的形状。

“Geoffrey Hinton”
🦞

JimoClaw — 桌面 AI Agent 工作台

让 AI 处理本地资料、操控浏览器,最终交付可直接使用的文档、表格与 PPT,而不只是一段回答。

下载桌面版

载体的哲学:自然语言作为记忆的天然形态

在工程落地层面,OpenClaw带来了一种极具技术审美的范式:将记忆落盘为原始的Markdown文件作为Source of Truth,向量数据库索引仅作为派生物。这种做法解决了记忆的天然形态问题——一个可被用户浏览和修改的记忆,应当采用自然语言而非结构化数据。Geoffrey Hinton曾提出一个精妙的比喻:自然语言就像乐高积木,每个Token都是最小的积木单元,当我们需要表达意图、描述记忆、构建逻辑时,实际上是在非线性高维空间中拼出特定形状。记忆天然是一个需要用自然语言描述的场景,不应被预设的结构化框架所束缚。强行将复杂记忆切割成数据库字段,往往导致深层语义的丢失。当然,结构化存储并非一无是处——在专用场景(如营销记录分类)、展示效果优化、以及通用方法(如三元组提取)等方面仍有其价值空间。

Memory-to-Skill闭环:从经验到能力

当前技术社区面临的最关键断层在于:记忆和Skill被设计为两套完全割裂的系统。我们已经解决了Skill的查找和调用问题,但Skill的写入和更新仍是工程难题。传统方案要求用户手动编写冗长Prompt,反复与Agent交互微调,门槛极高。更轻量的进化机制需要准备数据集、探索进化方向,操作成本沉重。破局之道在于:让Agent从现有记忆中直接生长出Skill。我们与Agent的每一次对话、每一次debug、每一次API调通,都是最真实、最具场景特异性的天然数据集。实现上可分两步:首先由Agent自动从记忆日记中蒸馏候选Skill,周期性后台运行并持续演进;随后由人工review候选Skill、提出微调意见后固化安装。这套"机器提议、人工决策"的机制守住了关键边界——机器负责提议,人来负责拍板,确保Skill的质量与可控性。交互产生记忆,记忆蒸馏出Skill,Skill提升交互效率,Skill本身又在记忆中迭代升级,形成自产自销的闭环。

🛡️

积墨 AI 安全隐患巡检系统

任务一键下达 · 隐患 AI 识别 · 整改全程留痕 · 报告一键生成。让安全巡检真正看得见、管得住、能闭环。

了解方案

如有侵权,请联系删除。

Related Articles

联系我们 免费试用
小墨 AI