标签:
思考59 篇文章
Agent 越强,常识越值钱
上个月写了'无知是优势',这个月被 agent 连坑四次:性能虚高几十倍、实验机被删成砖、优化原地打转、目标太高交付不了。今天修正一下:无知让你敢试,常识让你不被骗。
模型快 5 倍,就不再是同一个模型
Gemini 3.5 Flash 发布会几乎不讲智能,智谱 GLM-5.1 高速版冲到 400 token/s。背后是同一个故事——推理速度跨过 5 倍那条线之后,模型解锁的就是另一类产品了。
AMD 开发者大会给一个不会写代码的人颁了奖
今天去上海 AMD 开发者大会。2000 多人挤进现场,AMD 把两个开发者奖之一颁给了一个不会写代码的人,他靠 agent 把东西用 Rust 重写做出了性能优化。一年前大家还在愁需求,半年过去所有人见面第一句都是:再给我点货。
同一个 /goal功能,两种Agent性格
Codex 上了 /goal 我用了几周。Claude Code 最近几天也跟着上,我把手头几个 Codex 没搞定的任务挪过去试,结果反差太大,值得记下来。
AI Coding 这门生意,被自己吃掉了
从 GitHub Copilot 到 Claude Code 走了五年。方向印证得越彻底,最早笃定方向的那批人活得越艰难。小模型、工作流、独立 IDE,一层一层被基础模型吞掉。剩下还能卖的东西其实清晰,只是不再叫软件。
AI 尖兵:还剩 10 周
朋友问我要不要接 AI 变革专家的 offer。聊完三个小时,我把判断写下来:尖兵阶段不要省钱、不要碰 IDE、不要让 agent 黑盒化。GPT-5.5 发布两周,剩下 10 周世界会被一批意想不到的成果震撼。
Vibe Coding 起步只有两条路
朋友问 Vibe Coding 该从哪开始用。两条路:从工作切入,或从数字身份切入。前提是发出去的必须是真实的你——互联网有记忆,Kevin Hart 翻出来的旧推是十年前的。
陪 agent 干活到此为止
用 Codex APP 的自动化做了两天,烧了一个 Pro 账号,进展微乎其微。换到 Codex CLI 的 Goal 功能就立刻顺了。一开始以为是模型变蠢,后来想明白:是 agent 形态在定型,人不该再被绑在屏幕前。
Codex 5.5:版本号是骗人的
代号 SPUD 的 GPT-5.5 上线两周,我把 Claude Code 卸得差不多了。让我意外的不是它强了几个百分点,是几个老短板一次性补完之后,agent 的设计哲学第一次变得清晰。
AI 时代的赛博地主:你的工作流不是你的
60 人公司一夜被封号、110 人公司账号封了 API 还在扣钱、Altman 家被扔燃烧瓶、Meta 搞 token 烧钱排行榜——AI 时代的权力问题已经摆到桌面。这一波重新分配里,公司、国家、个人各自该把什么握在自己手里?
AI 做科研:三堵墙、八亿人、一场哥白尼革命
前几天大会上聊 AI for science,有人提到三堵墙:付费墙、湿实验墙、感知墙。陶哲轩说我们正在经历智能的哥白尼革命,人不再是智能的中心。全球 880 万全职科研人员,AI 之后可能是几亿。门外汉先冲进来了,但真正的瓶颈不在模型。
AI 让无知变成了优势
23 岁的 Liam Price 让 GPT-5.4 Pro 在 80 分钟里破了 Erdős 困了人类 60 年的猜想,陶哲轩说大家在第一步就集体走偏了。同一周电梯里两个陌生人在谈裁员。AI 把过去最贵的资源给到了每个个体,问题只是你拿来给世界多加点东西,还是把交差做得更漂亮。
用 AI 花了一天半给儿子做个识字游戏
起因是儿子小声跟我说,学校里认字能得小红花,他经常拿不到。我用 coding agent 给他做了一个汪汪队 IP 的认字游戏,前后一天半。最意外的不是儿子玩到不肯走,是我妻子的反应——她第一次真正感觉到,AI 这东西落到了我们家客厅里。
GitHub 小红书化之后:做产品这件事反而更孤独了
给一个 idea 点个赞、收下一个 star 现在是秒级的事。但把想法做到真正能用、经得起挑刺,中间那段最长最枯燥的路,vibe coding 并没怎么缩短。写一写我最近的切身感受,也翻了翻乔布斯和张小龙身上绕不开的那个共同点。
一个人并行跑六个 agent:AI coding 改了什么,没改什么
Karpathy 自己都不用 vibe coding 这个词了,Amazon 一次宕机之后干脆给初级工程师的 AI 代码加了 senior 签字关。我从自己的日常用法讲起,聊聊这个工具真正改变的四件事——宽度、速度、质量,和那件永远没动过的责任归属。
被郑丽文圈粉,新一代的领导应该什么样?
国民党新主席访问大陆,回台湾不找主流媒体,跑去跟网红直播。她跟雷军见面说自己老公全身都是小米。这种人让我想起春秋末期。礼崩乐坏的另一面是百家争鸣,现在也一样。
Opus 4.7 上线前后这两天
昨晚 Opus 4.7 发布,我就没睡成。起来试了试,顺手给 OpenClaude 提了几个 PR 合进了主干,还把 Strix Halo 上 Qwen3-30B 的 prefill 推到了接近 DGX Spark 的水平。Agent 够强之后,一个人能同时做几件事,变成了一个挺具体的问题。
AI 行业的战时状态
Anthropic 搞实名认证,中国这边炸锅了。但说实话这事一点都不意外。AI 行业从 2023 年开始就是战时状态,芯片禁令、军事合同、模型封锁,跟工业革命那会儿的清朝太像了。
GPT-6 今天又'发布'了一次?
朋友圈又在刷 GPT-6 发布了。假信息有观众,真信息是细分市场。AI 让这件事严重了,不是变轻了——这也是为什么我最近把团队又推回了 Claude Code。
AI 不是许愿池:两个我最近搞不定的事
一个是 Claude Code 修不好自己家的 Chrome 插件,绕了四个小时;一个是小红书怎么发都被软限流。AI 没把工作从失败变成成功,它只是让失败跑得更快——这反而是它最值钱的地方。
当饺子馆开始发 Skill
GitHub 在小红书化,公众号在 GitHub 化。饺子馆老板 vibe coding 写 skill,好莱坞明星当 GitHub 第一作者,朋友圈流行把同事蒸馏成 skill。不过 skill 可能不是重点,agent 互通才是。
急诊室与消失的护城河
Aima Service 重构复盘。产品像急诊室,用户不在乎装修,只在乎医生能不能看病。Claude Code 和 Codex 交替跑了一周多,130 万行代码落地。回头一看,代码量这条护城河可能已经不在了。
开源社区的 DeepSeek 时刻
调研文生视频的时候发现,中国模型在语言模型开源社区的统治力并没有延伸到所有地方。回头看这三年,从 LLaMA 到千问到 DeepSeek,开源社区经历了什么?现在又在等什么?
不是一场革命,是两场
编程和内容创作是两条正在分叉的路。Seedance 2.0 的 API 一开放,朋友圈全炸了。Agent 对 Agent 的效率是开会的一百倍。打球的时候终于不用谈生意了。
AI 放大的不是技能,是热情
张雪为了把公差从五丝压到三丝,自己扛供应链的试错成本。祝铭明十年死磕 AR 眼镜,中间靠音箱续命。这些人身上有一种共同的东西,不是聪明,是热情。AI 恰好在放大这种东西。
装了OpenClaw对多数人意味着什么?
帮人装了一圈小龙虾之后的想法:OpenClaw 的体验取决于背后模型的执行力,而当前最好的模型体验在 Claude Code 这样的 coding agent 上。
10天写了30万行代码,然后我全删了
一个技术外行用Claude Code做了个实验:10天堆出30万行代码,发现走不通,推倒重来。48小时后,不到1万行代码,端到端跑通了。代码是负债,不是资产。

























































