今天我撞见了两件事,一件让我觉得这个时代有点不真实,一件让我觉得这个时代非常真实。
一、23 岁的门外汉破了一个 60 年的猜想
Liam Price,23 岁,没受过高级数学训练。一个礼拜前的周一下午,他随手把一道 Erdős 没解出来的问题扔给了 GPT-5.4 Pro。题目编号 #1196,关于"原始集合"的一个猜想,困了人类 60 年。一次会话,大约 80 分钟,模型给出了一份证明。
Cambridge 的本科生 Kevin Barreto 帮着整理。后来 Jared Lichtman 和陶哲轩参与简化,把 LLM 原始那份很糙的输出蒸出关键 insight。陶哲轩点评的那句话挺刺人的:
"这个题人类是看过的。看过它的人在第一步就集体走偏了。"
不是没人想过,是想过的人都用同一种方式想错了。LLM 走的那条路,在相邻的数学领域是常识,没人把它搬过来。
最近开始流行一个词,叫 vibe-math,氛围数学。意思就是你不太懂这个领域,把题扔进 ChatGPT,看它怎么瞎蒙。
同一周 GPT-5.4 Pro 还在 Mensa 挪威 IQ 测试上拿了 150 分,超过 99.96% 的人类。OpenAI 上一个最高分是 o3,136。一年跳了 14 分。
当 AI 稳定地超过 95% 的人类专家之后,"我什么都不懂、随便试试"反倒成了一种结构性优势。
二、为什么"懂行"反而是束缚
讲个我最近做项目的真实体感。
你让 AI 做项目评估,它列计划:第一步一到两周,第二步两到三周,加起来三个月。看上去合理,因为这是过去做这件事的人会写的时间轴。
但你真让它去执行那个计划,它几天就做完了。
它评估的时候模仿了人类的"先验",执行的时候根本就不是同一种生物。
回到 Liam Price 这个事。在他之前看过 Erdős #1196 的数学家都在做同一组开局动作,因为那组动作在过去 60 年一直被当成这类问题的"标准解法"。这就是先验。先验过去是好东西,是省时间的捷径。但工具底层一换,先验反而把你绑住了。
在一个领域深耕的人,对"成本"和"难度"是有直觉的——这事得多少人、多少钱、多少时间,他心里有谱。这种直觉决定了他愿不愿意去想一个问题。
想象一个明朝人,要构思一个登月计划。
得调动几个国家最顶尖的天文学、火箭学(这词他都没听过)人才远程协作,反复试错。光想到把信送到那些人手上、等他们回信,这事就构思不下去了。明朝人不是没本事,他是从 day 0 就放弃了思考。
你今天的"先验"也是一样的。某件事 ROI 太低,某件事得跨多少层组织,某件事算下来时间太长——所以你压根就不去想。
三、门外汉没这个负担
门外汉不知道难。
对他来讲,让 AI 解一个 60 年的数学猜想,跟让 AI 写自动化周报、画一张 PPT,主观难度差不多。反正都不会,反正都难。所以他都愿意试。试一试不花什么钱,token 烧一烧的事,万一中了呢?
中了一次,他就比深耕了一辈子的人多走了一截。
我之前写过 AI 放大的不是技能,是热情。那篇讲的是热情决定你愿不愿意持续投入。这次想补一刀:在你愿意之前,"你以为这件事难不难"先把大多数人筛掉了。门外汉绕过了这一关。
最近罗福莉跟张小珺聊了 3.5 小时,话题主要是 Pre-train 到 Post-train 的范式切换、组织怎么变。听下来有一种共通的体感:现在跑得快的,反而是包袱少、对"我知道这有多难"先验少的人。AI 把过去只有顶尖机构才调动得起来的资源,以几乎免费的方式塞给了个体。这种自由感放在历史里不多见。
四、电梯里的两个陌生人
得记一下今天另一件事。
晚上下楼吃饭,电梯里两个陌生人在聊。一个说"我心情不好,今天被裁了"。另一个回了一句"哦我也被裁了"。从 9 楼到 1 楼,几十秒的功夫。出电梯我还在算这个概率。
这是这个时代的另一面。有人用 AI 跨过了原本进不去的门槛,有人原本做得挺好的工作今天突然就没了。
两条路在企业层面已经看得很清楚。
沃尔玛 CEO 公开说,未来三年公司总人数基本不变。代价是要让 160 万员工全部接受 AI 培训,联合 Google 和 OpenAI 投了 10 亿美金做技能升级。意思是不裁,但每个人都得变。
字节是另一种打法。他们家自研的 AI IDE TRAE 内部月活早就过了百万,超过 80% 的工程师每天在用,抖音生活服务那条线 AI 写的代码已经占到 43%。还没到 100%,但方向清楚:能让 AI 写的就让它写,人腾出手做评审和判断。
两条路其实是一件事的两面:要么把每个人变成一个能用 AI 的"百倍员工",要么把不需要的环节直接砍掉。你在哪条路上,决定了你今天看到那条新闻是机会还是威胁。
五、两极分化的真相
回头看到的图景大概是这样。
小众领域在被打开。数学研究、生物医学、材料学、底层编程,这些原本要几十年 know-how 才敢碰的领域,门槛突然变低了。一个 23 岁的人破了一个 60 年的猜想。下一个可能是某个高中生在医学、在某种设备效率提升上做出非平凡的事。这种事过去只在科幻里。
大众领域则不再需要那么多人。周报、PPT、初阶代码、客服、基础文案,AI 都能做,做得还行,做得越来越快。需要的人会持续往下走。
最难受的是那种在大众领域已经做得很熟、又没动力进新领域的人。技能没问题,方向出了问题——AI 拿在手里,还是只在更顺地交差。
六、给世界多加点东西,还是把交差做得更漂亮
你能做的反应其实不复杂。挑一件你过去因为"听上去太难"而放弃过的事,把 AI 拉进来重做一次。
但选哪件事,是有差别的。
把周报写得更顺、把 PPT 画得更花、把已有流程跑得更省一点——AI 都帮得上忙。可这些事本质上还是交差。世上多一份漂亮周报跟少一份漂亮周报,对人类没什么区别。AI 在这种事上的边际产出,落到外面的世界里基本是零。
让世界真正多一点东西的事是另一类:解一个被卡了几十年的数学问题,做一个能解决某个真实问题的小工具,捅一捅一个你只是好奇但不在专业里的方向。23 岁的 Liam Price 能破 60 年的猜想;下一个让某种设备的性能跳 10%、让某个被忽视的人群拿到能用的工具的,未必不是某个普通人。
不必非要做出震动学界的事,中间地带很大。但你得选值得做的事——值得你身上最稀缺的那点时间和注意力。
我现在判断一件事值不值得做,标准跟以前不一样了。以前先问的是"能不能做成""能不能交差""有没有故事讲"。现在问得更直接:这件事如果做成了,世界是不是多了一点真东西?
AI 把过去最贵的资源以几乎免费的方式给到了每一个有好奇心的人。这件事最讽刺的地方是,绝大多数人拿到这份杠杆之后,第一反应是用它来更高效地交差,而不是去做点对人类真正有用的事。
把这份杠杆用在让世界多一点东西的方向上,比用在把交差做得更漂亮的方向上,重得多。
接住这种自由,比在乎被裁的概率更重要。
参考资料
- Erdős Problem #1196 — primitive sets discussion thread
- Amateur armed with ChatGPT 'vibe-maths' a 60-year-old problem — Scientific American
- GPT-5.4 Pro solves Erdős Problem #1196 — Hacker News 讨论串
- GPT-5.4 Pro 在 Mensa 挪威拿到 IQ 150(CryptoSlate)
- AI IQ 测试榜单 2026(BinaryVerse AI)
- 沃尔玛三年人数不变、给 160 万员工做 AI 培训(Fortune)
- 字节 TRAE 一年 200 次更新、内部月活破百万(腾讯新闻)
- 罗福莉 × 张小珺 3.5 小时访谈 — 商业访谈录第 138 期
