2026年5月5日

964

第一个 Agent 从 Pi 开始

学习Agent开发，入口往往比模型API更先把人卡住。不少开发者第一天就去研究memory、MCP、skills、multi-agent、Agent OS等概念，这些方向本身没有问题，但落到代码实现时，最先撞上的问题往往非常具体：模型怎么看文件？怎么修改文件？怎么执行命令？执行失败了怎么办？上下文溢出了怎么办？它说做完了，证据在哪里？这些看似简单的基础问题，才是真正考验工程能力的地方。

Harness到底解决了什么问题

建议从Pi项目开始学习。Pi在coding-agent README中将自己定位为「minimal terminal coding harness」——最小化终端编码工具。这个定位非常精准。它没有停留在聊天壳的层面，也没有把几十个概念堆在一起做演示。默认情况下，Pi先给模型一组很小的身体能力：read、write、edit、bash。除此之外，还内置了grep、find、ls这类只读检索工具。再往外，才是session、context files、compaction、skills、extensions、TUI、RPC、SDK等层次。这个顺序把Agent的底层工程暴露得很清楚：能力不会从概念里自动长出来，它靠一层层工程边界托住。

Pi的分层架构设计

凡是让Agent趋近于目标的一切工程化手段，都是harness。用工程语言来说，harness做的事情包括：让模型能观察环境，能采取动作，动作前能被限制，动作后能被记录，失败后能继续修复，最后能拿证据判断任务有没有完成。用户说“帮我修一下这个bug”，模型本身只能生成文本。它不会天然知道项目结构，不会真的打开文件，不会运行测试，也不会记住刚才改了什么。要让它从“建议你怎么修”走到“自己去修”，至少要补齐几件事：读取项目、修改文件、执行命令、把工具结果送回模型、保存行动轨迹、裁剪上下文、拦截风险动作、用真实证据判断完成状态。这些加起来，就是harness。Pi的价值在于：它把最小coding harness拆成了模型、loop、工具、session、上下文和扩展点，没有多余包装，骨架直接暴露出来。

Agent工程不急着把模型包装得更像人。关键在于，把模型的判断放进一套可投影、可授权、可恢复、可观测的系统里。模型越强，这套外部秩序越不能省。

“技术观察”

🦞

JimoClaw — 桌面 AI Agent 工作台

让 AI 处理本地资料、操控浏览器，最终交付可直接使用的文档、表格与 PPT，而不只是一段回答。

下载桌面版

工具不是函数，是合约

先看Pi的分层架构。Pi的monorepo分得很清楚：packages/ai是多provider的LLM API适配层；packages/agent是通用agent runtime，处理tool calling、state、event streaming；packages/coding-agent是终端coding harness，也就是pi本身；packages/tui和packages/web-ui是界面层。这几个包之间的关系大概是：Provider API → agent loop → coding tools → session/context/compaction → terminal UI/RPC/SDK。这个分层比抽象概念更容易落到工程判断上。写Agent最常见的坏习惯，是把模型请求、工具执行、UI输出、文件读写、会话存储全塞进一个函数里。刚开始能跑，后面一加权限、一加压缩、一加恢复，就会变成难以调试的隐式状态机。Pi的边界更清楚：模型适配是一层，agent loop是一层，coding tools是一层，session/context是一层，UI只是外围投影。

Context要按轮装配

Pi默认给模型的工具很朴素：read、write、edit、bash。这四个工具刚好对应coding agent的基本身体能力。工具设计的重点不在数量，而在合约。以read为例，如果它只是fs.readFile，很快就会出问题：大文件怎么办？图片怎么办？二进制文件怎么办？输出太长怎么办？敏感文件要不要拦？Pi的read tool支持offset/limit，文本输出会按行数和字节数截断，内容被截断时还会提示下一次该从哪个offset继续读。这个细节背后是实战经验：工具结果很容易吃掉上下文窗口，read和bash尤其明显。bash也是同样思路，命令输出通常保留尾部，因为错误大多在最后；输出太大时会截断，并把完整输出写到临时文件；执行过程支持timeout和abort。edit更典型，它要求模型提供精确的oldText/newText replacement，oldText必须唯一不能重叠，执行后返回diff。这个设计比整文件重写稳得多，修改范围收窄了，结果也方便展示和审计。不少人把context理解成“把资料塞给模型”，做Agent时这个理解会带来问题。一个coding age

🛡️

积墨 AI 安全隐患巡检系统

任务一键下达 · 隐患 AI 识别 · 整改全程留痕 · 报告一键生成。让安全巡检真正看得见、管得住、能闭环。

了解方案

如有侵权，请联系删除。

Agent Harness Engineering Pi OpenClaw AI开发积墨AI AI智能体 AI智能体平台私有化AI智能体平台企业级AI智能体

Share This Post

🦞

JimoClaw 桌面 AI Agent 工作台

让 AI 处理本地资料 · 操控浏览器 · 交付可用文档

下载桌面版

第一个 Agent 从 Pi 开始

Harness到底解决了什么问题

Pi的分层架构设计

JimoClaw — 桌面 AI Agent 工作台

工具不是函数，是合约

Context要按轮装配

积墨 AI 安全隐患巡检系统

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

库克坦言涨价无可避免，行业真相：苹果已错失 AI 先发优势

2026-AI科学家-Nature：两天完成十年研究，加速科学发现新时代

阿里腾讯等大厂Agent同台交锋！年度AI智能体大会7月开幕

全国首家政医企共建AI医院成立；25项目招标超1.7亿；证监会支持AI大模型企业上市；多个医疗智能体发布

AI跨境电商交流会，探索'一人出海'新模式

PPT 从跑分到护栏：AI Agent 可观测和质量保障体系

Hermes Agent v0.17.0重磅发布：AI智能体的触达时代来了

Cursor 600亿美元卖给SpaceX，DeepSeek估值突破500亿：AI商业化两条截然不同的赢家路径

当AI贯穿消费到产业，618彻底变了

Fluss+Flink+AI Agent：淘宝交易实时风控智能体探索！

Cursor 600亿美元卖给SpaceX，DeepSeek估值突破500亿：AI商业化两条截然不同的赢家路径

公开课来了！第19讲：学习搭建生产排产与LCEL架构 AI 智能体

AI PCB生态专业展超75%展位售罄，首批展商选位圆满完成！10月引领全球产业风向

AI来了，中国动画电影反而更需要人了

AI时代的智能体先锋论坛

'梁文锋'们，上市有门了

AI Agent倒逼舱驾一体芯片成为刚需？

AI资本开支2.0

第一个 Agent 从 Pi 开始

Harness到底解决了什么问题

Pi的分层架构设计

JimoClaw — 桌面 AI Agent 工作台

工具不是函数，是合约

Context要按轮装配

积墨 AI 安全隐患巡检系统

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

库克坦言涨价无可避免，行业真相：苹果已错失 AI 先发优势

2026-AI科学家-Nature：两天完成十年研究，加速科学发现新时代

阿里腾讯等大厂Agent同台交锋！年度AI智能体大会7月开幕

全国首家政医企共建AI医院成立；25项目招标超1.7亿；证监会支持AI大模型企业上市；多个医疗智能体发布

AI跨境电商交流会，探索'一人出海'新模式

PPT 从跑分到护栏：AI Agent 可观测和质量保障体系

Hermes Agent v0.17.0重磅发布：AI智能体的触达时代来了

Cursor 600亿美元卖给SpaceX，DeepSeek估值突破500亿：AI商业化两条截然不同的赢家路径

当AI贯穿消费到产业，618彻底变了

Fluss+Flink+AI Agent：淘宝交易实时风控智能体探索！

Cursor 600亿美元卖给SpaceX，DeepSeek估值突破500亿：AI商业化两条截然不同的赢家路径

公开课来了！第19讲：学习搭建生产排产与LCEL架构 AI 智能体

AI PCB生态专业展 超75%展位售罄，首批展商选位圆满完成 ！10月引领全球产业风向

AI来了，中国动画电影反而更需要人了

AI时代的智能体先锋论坛

'梁文锋'们，上市有门了

AI Agent倒逼舱驾一体芯片成为刚需？

AI资本开支2.0

AI PCB生态专业展超75%展位售罄，首批展商选位圆满完成！10月引领全球产业风向