AI 不是许愿池：两个我最近搞不定的事

之前聊 AI coding，聊的多半是它能干什么、干得有多漂亮。今天换一面，记录两个最近我没搞定的事：一个勉强收了尾，另一个直接搁置。

一、Claude Code 修不好自己家的插件

Claude Code 有个挂在 Chrome 上的官方插件，让 agent 能直接操作浏览器。我挺依赖这个功能，做实验、查资料、看视觉交互，经常用到。

前段时间它突然连不上了。每次启动都失败。

当时的第一反应是——这不就是它自己家的产品吗？让它自己修呗。Opus 4.6，effort 拉到 high，让它去想办法。

然后就开始了一场三四个小时的原地打转。

它每隔一阵就跟我说"我发现了重要线索"，改一通代码，然后告诉我"到这里了你得重启一下 session"。我重启，打开，还是不行。又一轮假设、又一轮改、又一轮"这次重启就好了"。中间它还让我把浏览器插件的 console 日志返给它——一给它，方向就开始围着日志里几行无关紧要的 warning 转，越走越歪。

我开始觉得有点好笑。它修的是自己家的 CLI 和自己家的插件，纯软件问题，没有外部变量。理论上这应该是它最擅长的场景。但它就是在原地画圈，每一圈都长得差不多。

最后我拦下来一次，说你别自己瞎想了，去 GitHub 上搜一下有没有人遇到过一样的问题。它翻了一圈，很快找到答案：Claude Desktop 和 Claude Code 的 CLI 都注册了同一个 extension ID 的 native messaging host，Desktop 赢了，CLI 就再也拿不到连接。按社区给的思路走，二十分钟收尾结束。

这事让我有点意外的不是"它搞不定"——搞不定很正常。是它从头到尾没想过"这个问题可能不是我这个会话闭门能解的"。它默认自己能从头把答案推出来，推不出来就让你重启。如果不是我主动让它去搜社区，它可能还要再耗我半天。

我后来想过一下原因。Agent 在一个会话里是孤立的，它不容易主动承认自己卡住了。人会，人碰到同样的坑反复踩，第一反应是去 Google、去 issue、去同事那问一嘴。AI 得你点它。

二、小红书的软限流

另一个事更干脆，就是彻底搞不定，也不打算继续搞了。

过去几周我一直想把博客里已有的文章分发到小红书上。自己手工发了几篇，流量是零。我就想，要不让 Claude Code 陪我设计一轮实验——选题、标题、封面、发布节奏都认真过一遍，比我自己瞎发一定更系统。结果还是零。

反复查下来，原因基本只有一个：新号被软限流了。平台不告诉你账号有问题，它就是把你的曝光死死压在一两百以下，搜索也搜不到。你以为自己在发内容，其实是在跟一堵看不见的墙说话。

这事有它的道理。小红书注册门槛低、发帖门槛也低，机器人和营销号是个常年的大麻烦。2026 年的《社区公约 2.0》又新增了一条针对纯 AI 生成未标注内容的限流规则。从平台角度看，新号冷启动阶段保守推流是合理的自我保护。但对我这种只想把存量思考做二次分发的人，就是一堵绕不过的墙——除非养号、除非按它那套节奏慢慢来。

我没继续折腾。投产比太差，同时它让我重新确认了一件其实我心里早就有的事：

当初从个人网站开始，是对的。

网站是通用互联网环境，没人在那给我限流。文章写得有点意思，朋友会读、会转，偶尔还有陌生人看完发邮件给我。这半年下来积累的文章其实是一份可以往不同方向分发的思想库——前段时间一篇搬到知乎的文章反响不错，一大堆人收藏讨论，那是搬运的附带收获，不是一开始就冲着那个地方去写的。

小红书、抖音那种平台是另一种游戏。你不是在一个开放的互联网里写东西，你是在一个封闭的、有推荐算法做裁决权的场里参赛。规则是人家定的，规则对新玩家也极度不友好。有选择的话，先把自己的地盘立起来再去别人场上打怪，这个顺序比反过来健康得多。

失败才是工作的主旋律

讲这两个例子，不是说 AI 不行。恰恰相反。

我们很容易把 AI 想得特别神：给它任务，它就"啪"地给你一个成品。那种期待更像许愿，不像用工具。真实的工作从来不是这样的。真实的工作里，大部分时间都在失败。试一个方向不行，换一个思路还是不行，绕两圈偶尔撞上一个能跑通的。成功是少数，失败是日常。

AI 没改变这个底色。它改的是两件事：

尝试的面变宽了。 同样的时间，我能同时开三四条线去试，哪怕每条都可能失败。
反馈变快了。 如果没有 Claude Code，前面那个 Chrome 插件的问题我一晚上可能都卡在最初的错误假设里。现在是它帮我在几小时里把几种可能都走了一遍，逼着我往"这问题不该我闭门想"的方向去。

换句话说，AI 不是成功制造机，它是失败加速器。听上去没那么性感，但这是它最值钱的地方。失败的周期从几天缩到几小时，一年下来你做的实验数量是原来的十倍以上，采样多了，自然更容易撞到成功。

过去三个月的模型变化也值得记一下

这波体感跟过去三个月模型迭代的节奏分不开。我的时间线是这样的：

2025 年 12 月末：开始认真用 Claude Code，Sonnet 4.5，用了没几天因为一些账号原因中断了。
2026 年 1 月末：Moonshot 发布 Kimi K2.5，我临时切过去。意外地好用，比那时候的 Codex 5.2 体感要强。拿它做了几个小项目，预期不高但基本都跑通了。
2 月初：Anthropic 发布 Opus 4.6。有一个我之前用 K2.5 折腾两三天、每次都卡在最后一步的小 demo，切到 Opus 4.6 一次过。这种时刻你才体感到所谓"模型变强"不是榜单多几个点的事，是你原本搞不定的突然就能搞定了。
2 月中下：GLM-5 和 MiniMax M2.5 陆续出来，我在外面出差期间用过一段，性价比不错。
3 月初：OpenAI 发布 GPT-5.4 并同步更新了 Codex。有一个 Opus 4.6 绕了半天的小插件问题，我丢给新版 Codex 跑了三个小时，搞定了。
现在（4 月中）：新一代模型又在路上。

整个节奏给我的感觉是，当前你卡住的那些问题，往往等个一两个月，下一代模型一出来就不再是问题了。这不是叫你躺平等模型，是说不要因为今天搞不定就灰心放弃。你可以多让它跑，也可以先搁一阵再回来。

最后

我想讲的其实是一种更诚实的期待。

如果你指望 AI 把你的工作从"以失败为主"变成"以成功为主"，你会失望。任何工具都做不到这件事。工作的底色就是失败。

但如果你把它当成一个能让你更快失败、同时开多条线试水的搭档，你对它就会平和很多。它有限，你也有限，但你们凑一起能做的事比各自单独多很多。

AI 真正值钱的地方在于加速失败。这话听上去反直觉，用一阵就懂了。

AI 不是许愿池：两个我最近搞不定的事

一、Claude Code 修不好自己家的插件

二、小红书的软限流

失败才是工作的主旋律

过去三个月的模型变化也值得记一下

最后

参考资料

推荐阅读

订阅博客更新

评论