Agent时代,我们真的需要操作系统吗?

2026年3月17日

20

555

Agent时代,我们真的需要操作系统吗?

在人工智能 Agent 蓬勃发展的今天,一个根本性问题被悄然提出:我们习以为常的操作系统,在 Agent 时代是否仍然不可或缺?当 AI 能够自主执行任务、调用工具、进行复杂推理时,那些为人类设计的系统组件——进程调度、文件系统、图形界面——是否成了多余的累赘?

一个颠覆性的实验

一位来自奇绩创坛的创业者王子伯炎,用一个令人震惊的项目回答了这个问题。他将 OpenClaw——一个开源的多 Agent 协作框架——成功运行在仅售 5 美元的 ESP32 芯片上。整个项目没有使用任何操作系统,纯 C 语言实现,从立项到发布仅用了三天时间。成果令人侧目:2.7K Star,330 个 Fork。

从模型压缩到循环压缩

伯炎在深入分析 OpenClaw 的底层逻辑后,发现真正运转的核心极其简单:一个标准的 ReAct 循环。用户发送消息,模型接收后进行思考,发现需要调用工具时执行调用,获取结果后继续思考,再次调用——如此往复。这个流程可以进一步抽离:一个 for 循环,加一个能够发送 HTTP 请求的网络模块,就足以支撑整个 Agent 的运转。 传统操作系统管理的进程调度、文件系统、用户权限、图形界面,这些全部是「给人用的」。当人从这个循环中被移除,操作系统便失去了存在的意义。事情变得异常简单:将 for 循环用 C 语言写死,编译成固件,烧录进 5 美元芯片,插上 USB 供电,连接 WiFi,通过 Telegram 发送消息就能使用。

在 Agent 的世界里,操作系统就是多余的。

“王子伯炎”

MimiClaw 项目有一个值得玩味的细节:它没有浏览器操控能力。在大多数 Agent 项目依赖浏览器实现网页操作、数据抓取的今天,这个选择显得格外另类。但伯炎的逻辑极具前瞻性:未来将没有给人用的浏览器。 Agent 在浏览器上点来点去,本质上操作的是文字。网页是给人看的渲染层,而 Agent 需要的是底层数据。给 Agent 套上一个浏览器,只是因为很多服务还没有提供对 Agent 友好的接入方式。这一判断在项目发布次日就得到了印证——Cloudflare 发布了将网站转换为 Markdown 的服务,Google 推出了 Web MCP。大厂们正在加速将给人看的网页翻译成给 Agent 读取的文本,浏览器这个中间层正在被逐步跳过。

有意思的是,作者在对话中分享了自己的「极端」配置:两块新显示器(49寸和57寸),一台85寸8K电视,两块163寸 LED 屏幕准备贴满墙壁,以及一套全向麦克风系统。这么多屏幕的原因是:同时运行多个 Agent,需要同时监控状态、审核输出、介入修正。 然而,伯炎的一句话点醒了梦中人:「以后不需要屏幕。」这个逻辑细思极恐:我们需要看大量信息,是因为 Agent 还不够好。在 Agent 出现之前,人们手动搭建工作流,是因为不放心自动化——担心某一步出错,需要设检查点、人工审核、画流程图。现在买屏幕、搭中控,本质上还是因为不放心。 显示器本质上是硬件层面的「我不放心」。当 Agent 的能力从 70 分提升到 95 分的那天,这些屏幕可能全部变成多余的。伯炎设想的终局更加激进:一个拇指大小的设备,语音下达指令,Agent 在云端完成一切,最后告知结果——不需要屏幕,不需要确认。

如有侵权,请联系删除。

Related Articles

联系我们 预约演示
小墨 AI