AI 这个词，已经换了三次魂

最近跟朋友聊 AI，越聊越觉得不对劲。每个人都说自己懂，每个人都聊得起来，但聊到一半我经常发现，我们说的根本不是一个东西。

这让我想起一个经济学家的吐槽。他说经济学跟物理学不一样。你在饭桌上说自己是物理学家，对方一般会回"我不懂物理，最近有啥新进展？"然后认真听你讲。但你说自己研究经济学，对方会说"我不太懂经济学"，然后开始讲他对经济学的看法，一讲半个钟头。一桌人都在聊经济学，唯独经济学家自己没怎么开口。

AI 现在就是新的经济学。

一个词，换了三次魂

"Artificial Intelligence" 这个词是 1956 年达特茅斯会议上 John McCarthy 提出的。到现在快七十年，词没换过，但它背后到底指什么，已经悄悄换了好几次。

第一代：远方的智能传说

我读书那会儿，业内说 AI 主要指机器学习。天文学里找规律，金融里挖数据，给广告做点击预测。这些事离普通人很远，没人会在饭桌上聊。

大众对 AI 的最初印象来自两个事件。

1997 年 5 月 11 日，IBM 深蓝在第六局赢了卡斯帕罗夫，国际象棋世界冠军第一次输给电脑。那时候大家还是当一台超级算力机器看，跟所谓"通用智能"挂不上边。

真正的拐点是 2016 年 3 月，AlphaGo 在首尔 4-1 赢了李世石。围棋在中文世界的地位很特殊，它代表的是策略、全局、兵法。一个能下赢人类顶尖棋手的程序，一下让人产生联想：它围棋这么强，是不是别的领域也很强？是不是已经有了"通用智能"？

差不多同一时期，计算机视觉也突破了。2014 年 3 月，香港中文大学汤晓鸥团队的 DeepID 在 LFW 人脸识别基准上拿到 98.52% 的准确率，第一次超过人眼平均水平 97.53%。2015 年微软的 ResNet 在 ImageNet 上把分类错误率降到 4.94%，又一次超过人类。

人脸这件事很不一样。一只猫稍微动一下，你分不清是 A 猫还是 B 猫；但一个人五官稍微变一下，你立刻看得出来"这不是同一个人"。人对人脸的敏感度是天赋级的。计算机能在这件事上超过人，意义就大了。

围棋的策略加上视觉的感知，两件事撞在一起，民众情绪一下被点燃。

戏剧性的是，在 AlphaGo 之前，国内做视觉的公司其实日子并不好过。商汤 2014 年拿到 IDG 天使轮之后有过一段资金紧张的时间，外面的钱不太愿意进——一个看起来跟围棋没什么直接关系的事件，是 AlphaGo 把整个 AI 赛道一起带火之后，下一轮才顺利接上。从 2016 到 2018 年，AI 四小龙商汤、旷视、云从、依图融资拿到手软。

但热潮持续几年就降温了。

为什么？因为期待中的"泛化"没出现。AlphaGo 只能下围棋，让它干别的就废了。视觉公司想识别人脸就训一个人脸模型，想识别车就再训一个车模型，每多一个场景成本几乎线性增加。"重大投入产生通用智能"那个故事，在那一代技术里就不成立。

到 2020 年前后，情绪回到了商业化的锅碗瓢盆里。

第二代：ChatGPT 让 AI 长出了嘴

第二次大转变是 2022 年 11 月 30 日，OpenAI 发布 ChatGPT 3.5。

这次最大的不同在"语言"。AI 第一次能跟人聊得像那么回事。坐在屏幕另一头的，你有时候真分不清是人还是机器。

老一辈搞 AI 的人会马上想起图灵测试：人和 AI 双盲对话，让第三方猜哪个是机器。这是 1950 年图灵提出的判定通用智能的标准。原本以为要被通过得很久。

结果 2024 年加州大学圣迭戈分校 Cameron Jones 的研究里，GPT-4 在五分钟对话测试中被判为"是真人"的概率达到 54%，已经接近真人水平的 67%。2025 年的后续研究里，GPT-4.5 直接被认为通过了"原始图灵测试"。曾经被供奉的标准，现在已经没人提了，因为早就被默默跨过去。

ChatGPT 真正的不一样，是它把 AI 变成了"每个人都能亲手用"的东西。机器学习、AlphaGo 那一代，普通人是当新闻看的，评头论足是别人的事。ChatGPT 之后不一样了，到 2026 年 2 月已经有 9 亿人每周打开它聊一次。这个普及度跟以前完全是两件事。

所以过去两三年里，绝大多数人讲 AI 时——不管说的是 ChatGPT、DeepSeek、豆包还是 Kimi——指的都是这个东西：聊天机器人。

第三代：从嘴到手脚

但从去年年底到今年初，AI 的内涵又变了一次。

我最近聊天经常碰到一个情景。对方说"我懂啊我经常用，豆包 Kimi DeepSeek 我都用过"。这话过去几年都成立。现在不成立了。因为我说的 AI 已经不是那个东西。

新范式叫"智能体"（Agent）。

如果上一代 AI 是有嘴有脑、坐你对面陪聊的顾问，那这一代是有手有脚、能拿工具替你干活的同事。至少在数字世界里是这样。

引爆这次转变的标志事件是 2024 年 10 月 Anthropic 发布的 Claude Computer Use。AI 第一次能自己看屏幕、移动鼠标、点按钮、敲键盘。从那以后一年多时间里，编程智能体成了主战场。Claude Code 2024 年宣布、2025 年成熟，OpenAI 2025 年 4 月发布 Codex CLI、5 月接着发 Codex Cloud，国内 Kimi Code 等也都跟了上来。

最有意思的是泛化。原本编程智能体冲着"写代码"去的，结果做着做着发现，它能干的活远不止代码：查资料、批量处理文件、操作浏览器、调试软件、自动跑实验。电脑上 80% 到 90% 的任务它都能干，而且干得不算差。这一代终于兑现了上一代承诺过却没做到的"泛化"。

为什么很多人没注意到这次的 AI 跟上次的 AI 是两个东西？因为词没换，还是 AI 这两个字。但脑子里那个"AI"是聊天框，还是会自己干活的智能体，是天差地别的两件事。

我们到底在聊什么

回到最开始那个问题：今天讲 AI 的时候到底在讲什么？

我试着分了一下。

第一种，脑子里"AI = 豆包 / Kimi / DeepSeek 这种聊天框"。那是 2022 到 2024 那一代的认知。我们说的不是同一件事。

第二种，用过 OpenClaw、Hermes、KimiClaw 这种通过 IM 操控的智能体应用。我们说的至少在同一平面上，能聊到一起。

第三种，日常在用 Claude Code、Codex、Kimi Code 任意一个编程智能体。我们说的就是同一件事，可以非常精确地讨论它带来的变化。

反复强调这个，是因为这件事跟图灵测试很像。已经悄悄跨过去了，但很多人还停留在上一代的认知里，在讨论一个其实不存在的东西。

真正的壁垒不是技术

每次 AI 内涵切换，普通人体验它的方式也跟着变。

机器学习那一代，普通人完全没机会上手。门槛太高，要准备数据、配环境、调参数，对非专业的人完全不友好。对 AI 的印象只能从新闻里来。

ChatGPT 那一代，普及度天花板被打穿了。打开网页就能用，免费的，能"用"AI 了。那时候大家开始评头论足说"哪家更好哪家不行"，能评论是因为能用。

智能体这一代其实也一样。门槛很低，几十块钱一个月就能起步。我之前帮过几个在校大学生用 Claude Code，他们没什么基础，照样跑通了自己的项目。

那真正的壁垒在哪？我觉得就一个字：懒。

不是技术上的懒，是认知上的懒。已经听过别人说，已经刷过两条短视频，已经在朋友圈读过几篇刷屏文，就觉得自己懂了。但你没真的动手，没让它替你干一件具体的活，没体会过那种"哦，原来是这样"的瞬间。

每次技术变革其实都是这样。蒸汽机出来时是这样，互联网普及时是这样，移动互联网普及时也是这样。慢的从来不是技术，慢的是听过两耳朵就觉得自己懂了的人。

而每一次切换之后，旧认知就变成一种隐形成本。你以为自己在用 AI，其实是在用 AI 的上一代。

如果你聊到这里还没真正用过一次智能体，建议很简单：今天就找一个最便宜的方案上手用。不用看视频、不用读教程，让它替你做一件你本来要自己做的事，看会发生什么。