跳转到主内容
博客
AI 让无知变成了优势

AI 让无知变成了优势

23 岁的 Liam Price 让 GPT-5.4 Pro 在 80 分钟里破了 Erdős 困了人类 60 年的猜想,陶哲轩说大家在第一步就集体走偏了。同一周电梯里两个陌生人在谈裁员。AI 把过去最贵的资源给到了每个个体,问题只是你拿来给世界多加点东西,还是把交差做得更漂亮。

关嘉伟关嘉伟5 分钟阅读
分享:

今天我撞见了两件事,一件让我觉得这个时代有点不真实,一件让我觉得这个时代非常真实。

一、23 岁的门外汉破了一个 60 年的猜想

Liam Price,23 岁,没受过高级数学训练。一个礼拜前的周一下午,他随手把一道 Erdős 没解出来的问题扔给了 GPT-5.4 Pro。题目编号 #1196,关于"原始集合"的一个猜想,困了人类 60 年。一次会话,大约 80 分钟,模型给出了一份证明。

Cambridge 的本科生 Kevin Barreto 帮着整理。后来 Jared Lichtman 和陶哲轩参与简化,把 LLM 原始那份很糙的输出蒸出关键 insight。陶哲轩点评的那句话挺刺人的:

"这个题人类是看过的。看过它的人在第一步就集体走偏了。"

不是没人想过,是想过的人都用同一种方式想错了。LLM 走的那条路,在相邻的数学领域是常识,没人把它搬过来。

最近开始流行一个词,叫 vibe-math,氛围数学。意思就是你不太懂这个领域,把题扔进 ChatGPT,看它怎么瞎蒙。

同一周 GPT-5.4 Pro 还在 Mensa 挪威 IQ 测试上拿了 150 分,超过 99.96% 的人类。OpenAI 上一个最高分是 o3,136。一年跳了 14 分。

当 AI 稳定地超过 95% 的人类专家之后,"我什么都不懂、随便试试"反倒成了一种结构性优势。

二、为什么"懂行"反而是束缚

讲个我最近做项目的真实体感。

你让 AI 做项目评估,它列计划:第一步一到两周,第二步两到三周,加起来三个月。看上去合理,因为这是过去做这件事的人会写的时间轴。

但你真让它去执行那个计划,它几天就做完了。

它评估的时候模仿了人类的"先验",执行的时候根本就不是同一种生物。

回到 Liam Price 这个事。在他之前看过 Erdős #1196 的数学家都在做同一组开局动作,因为那组动作在过去 60 年一直被当成这类问题的"标准解法"。这就是先验。先验过去是好东西,是省时间的捷径。但工具底层一换,先验反而把你绑住了。

在一个领域深耕的人,对"成本"和"难度"是有直觉的——这事得多少人、多少钱、多少时间,他心里有谱。这种直觉决定了他愿不愿意去想一个问题。

想象一个明朝人,要构思一个登月计划。

得调动几个国家最顶尖的天文学、火箭学(这词他都没听过)人才远程协作,反复试错。光想到把信送到那些人手上、等他们回信,这事就构思不下去了。明朝人不是没本事,他是从 day 0 就放弃了思考。

你今天的"先验"也是一样的。某件事 ROI 太低,某件事得跨多少层组织,某件事算下来时间太长——所以你压根就不去想。

三、门外汉没这个负担

门外汉不知道难。

对他来讲,让 AI 解一个 60 年的数学猜想,跟让 AI 写自动化周报、画一张 PPT,主观难度差不多。反正都不会,反正都难。所以他都愿意试。试一试不花什么钱,token 烧一烧的事,万一中了呢?

中了一次,他就比深耕了一辈子的人多走了一截。

我之前写过 AI 放大的不是技能,是热情。那篇讲的是热情决定你愿不愿意持续投入。这次想补一刀:在你愿意之前,"你以为这件事难不难"先把大多数人筛掉了。门外汉绕过了这一关。

最近罗福莉跟张小珺聊了 3.5 小时,话题主要是 Pre-train 到 Post-train 的范式切换、组织怎么变。听下来有一种共通的体感:现在跑得快的,反而是包袱少、对"我知道这有多难"先验少的人。AI 把过去只有顶尖机构才调动得起来的资源,以几乎免费的方式塞给了个体。这种自由感放在历史里不多见。

四、电梯里的两个陌生人

得记一下今天另一件事。

晚上下楼吃饭,电梯里两个陌生人在聊。一个说"我心情不好,今天被裁了"。另一个回了一句"哦我也被裁了"。从 9 楼到 1 楼,几十秒的功夫。出电梯我还在算这个概率。

这是这个时代的另一面。有人用 AI 跨过了原本进不去的门槛,有人原本做得挺好的工作今天突然就没了。

两条路在企业层面已经看得很清楚。

沃尔玛 CEO 公开说,未来三年公司总人数基本不变。代价是要让 160 万员工全部接受 AI 培训,联合 Google 和 OpenAI 投了 10 亿美金做技能升级。意思是不裁,但每个人都得变。

字节是另一种打法。他们家自研的 AI IDE TRAE 内部月活早就过了百万,超过 80% 的工程师每天在用,抖音生活服务那条线 AI 写的代码已经占到 43%。还没到 100%,但方向清楚:能让 AI 写的就让它写,人腾出手做评审和判断。

两条路其实是一件事的两面:要么把每个人变成一个能用 AI 的"百倍员工",要么把不需要的环节直接砍掉。你在哪条路上,决定了你今天看到那条新闻是机会还是威胁。

五、两极分化的真相

回头看到的图景大概是这样。

小众领域在被打开。数学研究、生物医学、材料学、底层编程,这些原本要几十年 know-how 才敢碰的领域,门槛突然变低了。一个 23 岁的人破了一个 60 年的猜想。下一个可能是某个高中生在医学、在某种设备效率提升上做出非平凡的事。这种事过去只在科幻里。

大众领域则不再需要那么多人。周报、PPT、初阶代码、客服、基础文案,AI 都能做,做得还行,做得越来越快。需要的人会持续往下走。

最难受的是那种在大众领域已经做得很熟、又没动力进新领域的人。技能没问题,方向出了问题——AI 拿在手里,还是只在更顺地交差。

六、给世界多加点东西,还是把交差做得更漂亮

你能做的反应其实不复杂。挑一件你过去因为"听上去太难"而放弃过的事,把 AI 拉进来重做一次。

但选哪件事,是有差别的。

把周报写得更顺、把 PPT 画得更花、把已有流程跑得更省一点——AI 都帮得上忙。可这些事本质上还是交差。世上多一份漂亮周报跟少一份漂亮周报,对人类没什么区别。AI 在这种事上的边际产出,落到外面的世界里基本是零。

让世界真正多一点东西的事是另一类:解一个被卡了几十年的数学问题,做一个能解决某个真实问题的小工具,捅一捅一个你只是好奇但不在专业里的方向。23 岁的 Liam Price 能破 60 年的猜想;下一个让某种设备的性能跳 10%、让某个被忽视的人群拿到能用的工具的,未必不是某个普通人。

不必非要做出震动学界的事,中间地带很大。但你得选值得做的事——值得你身上最稀缺的那点时间和注意力。

我现在判断一件事值不值得做,标准跟以前不一样了。以前先问的是"能不能做成""能不能交差""有没有故事讲"。现在问得更直接:这件事如果做成了,世界是不是多了一点真东西?

AI 把过去最贵的资源以几乎免费的方式给到了每一个有好奇心的人。这件事最讽刺的地方是,绝大多数人拿到这份杠杆之后,第一反应是用它来更高效地交差,而不是去做点对人类真正有用的事。

把这份杠杆用在让世界多一点东西的方向上,比用在把交差做得更漂亮的方向上,重得多。

接住这种自由,比在乎被裁的概率更重要。


参考资料

推荐阅读

订阅博客更新

新文章发布时第一时间通知你,不会发送垃圾邮件。

仅用于博客更新通知,随时可以取消订阅。

评论

或匿名评论
0/2000