达尔文.skill正式发布:让技能自主进化的革命性系统

2026年4月14日

86

484

达尔文.skill正式发布:让技能自主进化的革命性系统

当技能(Skill)数量从十几个扩展到五十几个时,手动维护的弊端开始显现:格式不统一、工作流缺失、测试效果参差不齐。更棘手的是,你无法准确判断哪个技能需要优化、优化的方向是否正确。杨芳贤在手动优化了38轮skill后,决定设计一套让技能自主进化的系统——达尔文.skill应运而生。

实际效果与开源

实际测试效果显著:huashu-slides经过5轮优化,从「能用但随时可能翻车」变成「可靠到可以去泡咖啡」;comedy(脱口秀编剧skill)一轮优化就解决了风格选择无结构的问题;7个perspective skill经过5轮批量优化,从「能用」变成「风格稳定、不会漂移」。优化过程中还发现了手动维护难以察觉的共性问题:边界条件处理缺失、frontmatter描述太短、引用不存在的文件路径等。 达尔文.skill已于4月14日正式开源,安装方式: GitHub: https://github.com/alchaincyf/darwin-skill 或使用 npx skills add alchaincyf/darwin-skill 安装后在Claude Code中说「优化所有skills」或「优化某个skill」即可使用。这套系统让开发者从手动维护的困境中解放出来,真正实现「让技能自己变好」的愿景。

棘轮机制的工程化迁移

达尔文.skill的设计100%受Karpathy开源的autoresearch项目启发。这个71k+ Star的项目用一句话概括:让AI自己跑实验、自己评估结果、只保留有改进的修改。它的工作机制像一个只能向前转动的棘轮:AI Agent自动修改训练代码,跑5分钟看loss有没有下降,降了就保留(git commit),没降就回滚(git revert)。每小时约12个实验,一晚上能跑100个。Shopify CEO用它优化模板引擎,性能提升了53%。

当你给任何创造性工作加上「只保留改进」的约束时,时间就站在了你这边。你不需要每一步都走对,你只需要确保走错的那步不留痕迹。

“杨芳贤”

8维度评估体系

生物学早已验证了棘轮的美感:达尔文进化论本质上就是一个只能向前的棘轮——随机变异产生候选方案,自然选择保留有利的、淘汰有害的。Karpathy把这一逻辑工程化了,而达尔文.skill则把它从模型训练领域迁移到了Skill优化领域。两者逻辑完全一致,只是优化对象不同:autoresearch优化训练代码,达尔文优化SKILL.md;autoresearch用loss判断好坏,达尔文用8维度加权总分。

五大优化原则

达尔文.skill采用100分制评估体系,分为结构维度(60分)和效果维度(40分)。结构维度考察6个方面:Frontmatter规范性(8分)、工作流清晰度(15分)、异常情况处理(10分)、关键决策确认点(7分)、指令具体性(15分)、文件路径有效性(5分)。效果维度考察架构合理性(15分)和实测输出质量(25分)。实测权重最高,因为一个结构满分但跑出来一坨的skill,远不如一个写得粗糙但好用的skill有价值。

如有侵权,请联系删除。

Related Articles

联系我们 获取方案
小墨 AI