最近跟朋友聊 AI,越聊越觉得不对劲。每个人都说自己懂,每个人都聊得起来,但聊到一半我经常发现,我们说的根本不是一个东西。
这让我想起一个经济学家的吐槽。他说经济学跟物理学不一样。你在饭桌上说自己是物理学家,对方一般会回"我不懂物理,最近有啥新进展?"然后认真听你讲。但你说自己研究经济学,对方会说"我不太懂经济学",然后开始讲他对经济学的看法,一讲半个钟头。一桌人都在聊经济学,唯独经济学家自己没怎么开口。
AI 现在就是新的经济学。
一个词,换了三次魂
"Artificial Intelligence" 这个词是 1956 年达特茅斯会议上 John McCarthy 提出的。到现在快七十年,词没换过,但它背后到底指什么,已经悄悄换了好几次。
第一代:远方的智能传说
我读书那会儿,业内说 AI 主要指机器学习。天文学里找规律,金融里挖数据,给广告做点击预测。这些事离普通人很远,没人会在饭桌上聊。
大众对 AI 的最初印象来自两个事件。
1997 年 5 月 11 日,IBM 深蓝在第六局赢了卡斯帕罗夫,国际象棋世界冠军第一次输给电脑。那时候大家还是当一台超级算力机器看,跟所谓"通用智能"挂不上边。
真正的拐点是 2016 年 3 月,AlphaGo 在首尔 4-1 赢了李世石。围棋在中文世界的地位很特殊,它代表的是策略、全局、兵法。一个能下赢人类顶尖棋手的程序,一下让人产生联想:它围棋这么强,是不是别的领域也很强?是不是已经有了"通用智能"?
差不多同一时期,计算机视觉也突破了。2014 年 3 月,香港中文大学汤晓鸥团队的 DeepID 在 LFW 人脸识别基准上拿到 98.52% 的准确率,第一次超过人眼平均水平 97.53%。2015 年微软的 ResNet 在 ImageNet 上把分类错误率降到 4.94%,又一次超过人类。
人脸这件事很不一样。一只猫稍微动一下,你分不清是 A 猫还是 B 猫;但一个人五官稍微变一下,你立刻看得出来"这不是同一个人"。人对人脸的敏感度是天赋级的。计算机能在这件事上超过人,意义就大了。
围棋的策略加上视觉的感知,两件事撞在一起,民众情绪一下被点燃。
戏剧性的是,在 AlphaGo 之前,国内做视觉的公司其实日子并不好过。商汤 2014 年拿到 IDG 天使轮之后有过一段资金紧张的时间,外面的钱不太愿意进——一个看起来跟围棋没什么直接关系的事件,是 AlphaGo 把整个 AI 赛道一起带火之后,下一轮才顺利接上。从 2016 到 2018 年,AI 四小龙商汤、旷视、云从、依图融资拿到手软。
但热潮持续几年就降温了。
为什么?因为期待中的"泛化"没出现。AlphaGo 只能下围棋,让它干别的就废了。视觉公司想识别人脸就训一个人脸模型,想识别车就再训一个车模型,每多一个场景成本几乎线性增加。"重大投入产生通用智能"那个故事,在那一代技术里就不成立。
到 2020 年前后,情绪回到了商业化的锅碗瓢盆里。
第二代:ChatGPT 让 AI 长出了嘴
第二次大转变是 2022 年 11 月 30 日,OpenAI 发布 ChatGPT 3.5。
这次最大的不同在"语言"。AI 第一次能跟人聊得像那么回事。坐在屏幕另一头的,你有时候真分不清是人还是机器。
老一辈搞 AI 的人会马上想起图灵测试:人和 AI 双盲对话,让第三方猜哪个是机器。这是 1950 年图灵提出的判定通用智能的标准。原本以为要被通过得很久。
结果 2024 年加州大学圣迭戈分校 Cameron Jones 的研究里,GPT-4 在五分钟对话测试中被判为"是真人"的概率达到 54%,已经接近真人水平的 67%。2025 年的后续研究里,GPT-4.5 直接被认为通过了"原始图灵测试"。曾经被供奉的标准,现在已经没人提了,因为早就被默默跨过去。
ChatGPT 真正的不一样,是它把 AI 变成了"每个人都能亲手用"的东西。机器学习、AlphaGo 那一代,普通人是当新闻看的,评头论足是别人的事。ChatGPT 之后不一样了,到 2026 年 2 月已经有 9 亿人每周打开它聊一次。这个普及度跟以前完全是两件事。
所以过去两三年里,绝大多数人讲 AI 时——不管说的是 ChatGPT、DeepSeek、豆包还是 Kimi——指的都是这个东西:聊天机器人。
第三代:从嘴到手脚
但从去年年底到今年初,AI 的内涵又变了一次。
我最近聊天经常碰到一个情景。对方说"我懂啊我经常用,豆包 Kimi DeepSeek 我都用过"。这话过去几年都成立。现在不成立了。因为我说的 AI 已经不是那个东西。
新范式叫"智能体"(Agent)。
如果上一代 AI 是有嘴有脑、坐你对面陪聊的顾问,那这一代是有手有脚、能拿工具替你干活的同事。至少在数字世界里是这样。
引爆这次转变的标志事件是 2024 年 10 月 Anthropic 发布的 Claude Computer Use。AI 第一次能自己看屏幕、移动鼠标、点按钮、敲键盘。从那以后一年多时间里,编程智能体成了主战场。Claude Code 2024 年宣布、2025 年成熟,OpenAI 2025 年 4 月发布 Codex CLI、5 月接着发 Codex Cloud,国内 Kimi Code 等也都跟了上来。
最有意思的是泛化。原本编程智能体冲着"写代码"去的,结果做着做着发现,它能干的活远不止代码:查资料、批量处理文件、操作浏览器、调试软件、自动跑实验。电脑上 80% 到 90% 的任务它都能干,而且干得不算差。这一代终于兑现了上一代承诺过却没做到的"泛化"。
为什么很多人没注意到这次的 AI 跟上次的 AI 是两个东西?因为词没换,还是 AI 这两个字。但脑子里那个"AI"是聊天框,还是会自己干活的智能体,是天差地别的两件事。
我们到底在聊什么
回到最开始那个问题:今天讲 AI 的时候到底在讲什么?
我试着分了一下。
第一种,脑子里"AI = 豆包 / Kimi / DeepSeek 这种聊天框"。那是 2022 到 2024 那一代的认知。我们说的不是同一件事。
第二种,用过 OpenClaw、Hermes、KimiClaw 这种通过 IM 操控的智能体应用。我们说的至少在同一平面上,能聊到一起。
第三种,日常在用 Claude Code、Codex、Kimi Code 任意一个编程智能体。我们说的就是同一件事,可以非常精确地讨论它带来的变化。
反复强调这个,是因为这件事跟图灵测试很像。已经悄悄跨过去了,但很多人还停留在上一代的认知里,在讨论一个其实不存在的东西。
真正的壁垒不是技术
每次 AI 内涵切换,普通人体验它的方式也跟着变。
机器学习那一代,普通人完全没机会上手。门槛太高,要准备数据、配环境、调参数,对非专业的人完全不友好。对 AI 的印象只能从新闻里来。
ChatGPT 那一代,普及度天花板被打穿了。打开网页就能用,免费的,能"用"AI 了。那时候大家开始评头论足说"哪家更好哪家不行",能评论是因为能用。
智能体这一代其实也一样。门槛很低,几十块钱一个月就能起步。我之前帮过几个在校大学生用 Claude Code,他们没什么基础,照样跑通了自己的项目。
那真正的壁垒在哪?我觉得就一个字:懒。
不是技术上的懒,是认知上的懒。已经听过别人说,已经刷过两条短视频,已经在朋友圈读过几篇刷屏文,就觉得自己懂了。但你没真的动手,没让它替你干一件具体的活,没体会过那种"哦,原来是这样"的瞬间。
每次技术变革其实都是这样。蒸汽机出来时是这样,互联网普及时是这样,移动互联网普及时也是这样。慢的从来不是技术,慢的是听过两耳朵就觉得自己懂了的人。
而每一次切换之后,旧认知就变成一种隐形成本。你以为自己在用 AI,其实是在用 AI 的上一代。
如果你聊到这里还没真正用过一次智能体,建议很简单:今天就找一个最便宜的方案上手用。不用看视频、不用读教程,让它替你做一件你本来要自己做的事,看会发生什么。
参考资料
- Dartmouth workshop — Wikipedia
- Deep Blue versus Garry Kasparov — Wikipedia
- AlphaGo versus Lee Sedol — Wikipedia
- DeepID 与香港中文大学汤晓鸥团队人脸识别突破
- Microsoft researchers win ImageNet computer vision challenge
- ChatGPT — Wikipedia
- Sam Altman says ChatGPT has hit 800M weekly active users (TechCrunch)
- People cannot distinguish GPT-4 from a human in a Turing test (Cameron Jones, 2024)
- Large Language Models Pass the Turing Test (Jones & Bergen, 2025)
- Introducing computer use, a new Claude 3.5 Sonnet (Anthropic, 2024)
- Introducing Codex (OpenAI, 2025)
