Agent 越强,常识越值钱
上个月写了'无知是优势',这个月被 agent 连坑四次:性能虚高几十倍、实验机被删成砖、优化原地打转、目标太高交付不了。今天修正一下:无知让你敢试,常识让你不被骗。
Agent 架构、信任模型、行为设计
上个月写了'无知是优势',这个月被 agent 连坑四次:性能虚高几十倍、实验机被删成砖、优化原地打转、目标太高交付不了。今天修正一下:无知让你敢试,常识让你不被骗。
今天去上海 AMD 开发者大会。2000 多人挤进现场,AMD 把两个开发者奖之一颁给了一个不会写代码的人,他靠 agent 把东西用 Rust 重写做出了性能优化。一年前大家还在愁需求,半年过去所有人见面第一句都是:再给我点货。
用 Codex APP 的自动化做了两天,烧了一个 Pro 账号,进展微乎其微。换到 Codex CLI 的 Goal 功能就立刻顺了。一开始以为是模型变蠢,后来想明白:是 agent 形态在定型,人不该再被绑在屏幕前。
代号 SPUD 的 GPT-5.5 上线两周,我把 Claude Code 卸得差不多了。让我意外的不是它强了几个百分点,是几个老短板一次性补完之后,agent 的设计哲学第一次变得清晰。
折腾两天做不出来的工具,换个模型半小时搞定。电脑登不进去,一个 AI 智能体半小时帮我修好。后来我做了 Aima Service,想让每台设备在出问题时都能有个 AI 来帮忙。
Mac 的权限设计是给人用的,Linux 是给程序用的。Agent 不是应用,是基础设施。把 Agent 跑在 Mac 上,就像把服务器塞进笔记本壳里——能跑,但哪里都别扭。
新文章发布时第一时间通知你,不会发送垃圾邮件。
仅用于博客更新通知,随时可以取消订阅。