Agent 越强,常识越值钱
上个月写了'无知是优势',这个月被 agent 连坑四次:性能虚高几十倍、实验机被删成砖、优化原地打转、目标太高交付不了。今天修正一下:无知让你敢试,常识让你不被骗。
72 篇文章
上个月写了'无知是优势',这个月被 agent 连坑四次:性能虚高几十倍、实验机被删成砖、优化原地打转、目标太高交付不了。今天修正一下:无知让你敢试,常识让你不被骗。
Gemini 3.5 Flash 发布会几乎不讲智能,智谱 GLM-5.1 高速版冲到 400 token/s。背后是同一个故事——推理速度跨过 5 倍那条线之后,模型解锁的就是另一类产品了。
今天去上海 AMD 开发者大会。2000 多人挤进现场,AMD 把两个开发者奖之一颁给了一个不会写代码的人,他靠 agent 把东西用 Rust 重写做出了性能优化。一年前大家还在愁需求,半年过去所有人见面第一句都是:再给我点货。
Codex 上了 /goal 我用了几周。Claude Code 最近几天也跟着上,我把手头几个 Codex 没搞定的任务挪过去试,结果反差太大,值得记下来。
从 GitHub Copilot 到 Claude Code 走了五年。方向印证得越彻底,最早笃定方向的那批人活得越艰难。小模型、工作流、独立 IDE,一层一层被基础模型吞掉。剩下还能卖的东西其实清晰,只是不再叫软件。
朋友问我要不要接 AI 变革专家的 offer。聊完三个小时,我把判断写下来:尖兵阶段不要省钱、不要碰 IDE、不要让 agent 黑盒化。GPT-5.5 发布两周,剩下 10 周世界会被一批意想不到的成果震撼。
朋友问 Vibe Coding 该从哪开始用。两条路:从工作切入,或从数字身份切入。前提是发出去的必须是真实的你——互联网有记忆,Kevin Hart 翻出来的旧推是十年前的。
用 Codex APP 的自动化做了两天,烧了一个 Pro 账号,进展微乎其微。换到 Codex CLI 的 Goal 功能就立刻顺了。一开始以为是模型变蠢,后来想明白:是 agent 形态在定型,人不该再被绑在屏幕前。
代号 SPUD 的 GPT-5.5 上线两周,我把 Claude Code 卸得差不多了。让我意外的不是它强了几个百分点,是几个老短板一次性补完之后,agent 的设计哲学第一次变得清晰。
60 人公司一夜被封号、110 人公司账号封了 API 还在扣钱、Altman 家被扔燃烧瓶、Meta 搞 token 烧钱排行榜——AI 时代的权力问题已经摆到桌面。这一波重新分配里,公司、国家、个人各自该把什么握在自己手里?
做完 AIMA 管理层和售后层之后我发现还差一块。Ollama 太傻、llama.cpp 精度被自己的格式吃了、vLLM 又太重。市面上没有现成的解,那就自己来。
前几天大会上聊 AI for science,有人提到三堵墙:付费墙、湿实验墙、感知墙。陶哲轩说我们正在经历智能的哥白尼革命,人不再是智能的中心。全球 880 万全职科研人员,AI 之后可能是几亿。门外汉先冲进来了,但真正的瓶颈不在模型。
23 岁的 Liam Price 让 GPT-5.4 Pro 在 80 分钟里破了 Erdős 困了人类 60 年的猜想,陶哲轩说大家在第一步就集体走偏了。同一周电梯里两个陌生人在谈裁员。AI 把过去最贵的资源给到了每个个体,问题只是你拿来给世界多加点东西,还是把交差做得更漂亮。
起因是儿子小声跟我说,学校里认字能得小红花,他经常拿不到。我用 coding agent 给他做了一个汪汪队 IP 的认字游戏,前后一天半。最意外的不是儿子玩到不肯走,是我妻子的反应——她第一次真正感觉到,AI 这东西落到了我们家客厅里。
给一个 idea 点个赞、收下一个 star 现在是秒级的事。但把想法做到真正能用、经得起挑刺,中间那段最长最枯燥的路,vibe coding 并没怎么缩短。写一写我最近的切身感受,也翻了翻乔布斯和张小龙身上绕不开的那个共同点。
Karpathy 自己都不用 vibe coding 这个词了,Amazon 一次宕机之后干脆给初级工程师的 AI 代码加了 senior 签字关。我从自己的日常用法讲起,聊聊这个工具真正改变的四件事——宽度、速度、质量,和那件永远没动过的责任归属。
昨晚 Opus 4.7 发布,我就没睡成。起来试了试,顺手给 OpenClaude 提了几个 PR 合进了主干,还把 Strix Halo 上 Qwen3-30B 的 prefill 推到了接近 DGX Spark 的水平。Agent 够强之后,一个人能同时做几件事,变成了一个挺具体的问题。
Anthropic 搞实名认证,中国这边炸锅了。但说实话这事一点都不意外。AI 行业从 2023 年开始就是战时状态,芯片禁令、军事合同、模型封锁,跟工业革命那会儿的清朝太像了。
朋友圈又在刷 GPT-6 发布了。假信息有观众,真信息是细分市场。AI 让这件事严重了,不是变轻了——这也是为什么我最近把团队又推回了 Claude Code。
一个是 Claude Code 修不好自己家的 Chrome 插件,绕了四个小时;一个是小红书怎么发都被软限流。AI 没把工作从失败变成成功,它只是让失败跑得更快——这反而是它最值钱的地方。
GitHub 在小红书化,公众号在 GitHub 化。饺子馆老板 vibe coding 写 skill,好莱坞明星当 GitHub 第一作者,朋友圈流行把同事蒸馏成 skill。不过 skill 可能不是重点,agent 互通才是。
Aima Service 重构复盘。产品像急诊室,用户不在乎装修,只在乎医生能不能看病。Claude Code 和 Codex 交替跑了一周多,130 万行代码落地。回头一看,代码量这条护城河可能已经不在了。
调研文生视频的时候发现,中国模型在语言模型开源社区的统治力并没有延伸到所有地方。回头看这三年,从 LLaMA 到千问到 DeepSeek,开源社区经历了什么?现在又在等什么?
编程和内容创作是两条正在分叉的路。Seedance 2.0 的 API 一开放,朋友圈全炸了。Agent 对 Agent 的效率是开会的一百倍。打球的时候终于不用谈生意了。
张雪为了把公差从五丝压到三丝,自己扛供应链的试错成本。祝铭明十年死磕 AR 眼镜,中间靠音箱续命。这些人身上有一种共同的东西,不是聪明,是热情。AI 恰好在放大这种东西。
折腾两天做不出来的工具,换个模型半小时搞定。电脑登不进去,一个 AI 智能体半小时帮我修好。后来我做了 Aima Service,想让每台设备在出问题时都能有个 AI 来帮忙。
Mac 的权限设计是给人用的,Linux 是给程序用的。Agent 不是应用,是基础设施。把 Agent 跑在 Mac 上,就像把服务器塞进笔记本壳里——能跑,但哪里都别扭。
帮几十个人远程装完OpenClaw后,被问最多的三件事:安不安全、贵不贵、跟Claude Code怎么选。一篇讲透,附国内模型真实价格。
帮人装了一圈小龙虾之后的想法:OpenClaw 的体验取决于背后模型的执行力,而当前最好的模型体验在 Claude Code 这样的 coding agent 上。
不用远程协助了。打开终端,粘贴一行命令,输入邀请码,AI 自动帮你装好 OpenClaw、连上大模型、接入飞书。全程你只需要回答几个问题。
一台AI服务器买回来调好,三个月后价值可能只剩一半。我们开源了AIMA——一个Go二进制,57个MCP工具,用YAML知识库驱动异构硬件上的AI推理部署。
当 Claude Code 可以帮你安装软件、处理数据、部署应用时,它已经超出「编程工具」的范畴。这是一种元能力——让普通人以极低的门槛,真正掌控自己的电脑。
不懂网页上线,不懂 SEO,就一个念头想记录想法。两天后网站上线,一周后奇绩创坛找上门。这是我的 Claude Code 亲测记录。
一个技术外行用Claude Code做了个实验:10天堆出30万行代码,发现走不通,推倒重来。48小时后,不到1万行代码,端到端跑通了。代码是负债,不是资产。
从代码补全到Vibe Coding,AI编程经历了三次跃迁。这不只是工具进步——当AI学会写代码,它就拿到了操控整个数字世界的钥匙。