Fable 5 出来第二天,我拿它去啃一个卡了两周的研究项目。
推理引擎性能优化,78 层的模型跑在硬件设备上,原始速度 10 token/s,想推到 100 tps以上。GPT 5.5 之前在这上面花了不少时间,没太大进展。
跑了 15 个小时,API 账单 420 美元。性能从 10 到 13 token/s,提了 30%。离 100 差得远,但动了。
两种打法
我在另一个 worktree 里同时让 GPT 5.5 做同一个项目,指令基本一样。两边的打法差异挺大的。
GPT 5.5 只拿了两层搭架子。模型一共 78 层,它先在两层上把链路跑通,然后就在那死磕,一个点做上百轮实验,局部速度抠到极致再放大。稳,慢,按路线图一步步来。
Fable 5 反过来。一两个小时摸完单层极限,直接拼 78 层,先搞出一个端到端的结果再说。
工程化确实强了一截,十几个小时从零搭出可跑的推理引擎,以前的模型做不到这个完成度。但 30% 的提升离目标太远,每次几百美元的节奏也磨不起。我后来切回了 GPT 5.5。
不过这篇想说的不是模型强不强的问题。
订阅和 API 之间差了一个数量级
Fable 5 发布后放进了 Pro 和 Max 订阅,按 Opus 4.8 两倍额度计费,限时两周。6 月 22 日之后移出订阅,继续用要按 API 费率买 usage credits。
API 价:输入 10 美元、输出 50 美元,每百万 token。
Max 20x 月费 200 美元,之前 Opus 4.8 做复杂任务一个Max20号够用了。Fable 5 按两倍算,烧得快,但你还能自己挑任务分配额度。移到 API 之后就是另一回事了:一个三小时的子任务 150 美元,整个项目跑完 420 美元。两个月 Max 月费。
从 Opus 4.5 到 4.6 到 4.8,每次升级,订阅计划调调额度比例,最好的模型始终在里面。200 块一个月你就能摸到。现在不是调比例了,是直接拿走。
大多数人一个任务烧不起几百美元。
反蒸馏
反蒸馏这事更拧巴。
不想被蒸馏,理解。Fable 5 内置了两层分类器,疑似蒸馏、网安、生化相关的请求,自动回退到 Opus 4.8。Anthropic 说 95% 以上不会触发。
实际呢。Reddit 和推特上一堆人在说,解读个血常规报告就被生化拦截了,问正常问题莫名被降级。蒸馏说白了就是密集使用模型,你接受了模型公开可用,这事就不可能完全堵住。拿不透明的分类器猜意图,猜错只是时间问题。
最坑的是降级是静默的。回答质量突然变差,你以为模型就这样,其实已经在跟 Opus 4.8 聊了。花着 Fable 5 的钱,拿 Opus 4.8 的东西,还不跟你说。我觉得这比定价问题更恶心。
另一边
OpenAI 最近做了点不一样的事。三月推了 Codex for Open Source,给 GitHub 上 1000 stars 以上项目的维护者六个月免费 Pro。给的是社区里写代码的个人,不是企业。
规模不算大。但方向是在让更多人用上好东西,不是把好东西藏起来。
两家 PK 正激烈,谁对谁错说不清楚。但一个把最好的模型从订阅里拿走,悄悄给用户降级;另一个给开源贡献者发免费账号。你说这两个信号一样吗。
世界正在十字路口上
Anthropic 骨子里有一股精英主义。AI 宪法、道德宪章,出发点不坏,但谁来定义什么叫负责任?始终是那一小撮人,做法自上而下。商业策略也走了同一条路:有预算的用最好的,没预算的用差一级的,中间差十倍。
你可以把最强的模型卖得贵。但让它留在订阅里,个人和小团队至少能自己分配额度来用。拿出来放到 API 通道,传递的信号就变了。
模型公司的定价,就是它对智能该怎么分配的态度。这个裂缝比 Anthropic 想的要大。
参考资料
- Anthropic, "Introducing Claude Fable 5 and Mythos 5", 2026-06-09
- Claude 官方定价:Fable 5 输入 50/M token;GPT-5.5 输入 30/M token
- Fable 5 订阅可用期:6 月 9 日至 22 日,此后需通过 usage credits 按 API 费率使用
- Fable 5 反蒸馏机制:两阶段分类器检测,触发后回退至 Opus 4.8,官方称触发率低于 5%
- Fortune, "Anthropic accused of secretly limiting Claude Fable 5 capabilities", 2026-06-10
- OpenAI, "Codex for Open Source" 计划,2026-03-07,为 1000+ stars 项目维护者提供 6 个月免费 Pro 账号
- SWE-bench Pro 评测:Fable 5 得分 80%,GPT-5.5 得分 58.6%
