跳转到主内容
博客

AI 不是许愿池:两个我最近搞不定的事

一个是 Claude Code 修不好自己家的 Chrome 插件,绕了四个小时;一个是小红书怎么发都被软限流。AI 没把工作从失败变成成功,它只是让失败跑得更快——这反而是它最值钱的地方。

关嘉伟关嘉伟5 分钟阅读
分享:

之前聊 AI coding,聊的多半是它能干什么、干得有多漂亮。今天换一面,记录两个最近我没搞定的事:一个勉强收了尾,另一个直接搁置。

一、Claude Code 修不好自己家的插件

Claude Code 有个挂在 Chrome 上的 官方插件,让 agent 能直接操作浏览器。我挺依赖这个功能,做实验、查资料、看视觉交互,经常用到。

前段时间它突然连不上了。每次启动都失败。

当时的第一反应是——这不就是它自己家的产品吗?让它自己修呗。Opus 4.6,effort 拉到 high,让它去想办法。

然后就开始了一场三四个小时的原地打转。

它每隔一阵就跟我说"我发现了重要线索",改一通代码,然后告诉我"到这里了你得重启一下 session"。我重启,打开,还是不行。又一轮假设、又一轮改、又一轮"这次重启就好了"。中间它还让我把浏览器插件的 console 日志返给它——一给它,方向就开始围着日志里几行无关紧要的 warning 转,越走越歪。

我开始觉得有点好笑。它修的是自己家的 CLI 和自己家的插件,纯软件问题,没有外部变量。理论上这应该是它最擅长的场景。但它就是在原地画圈,每一圈都长得差不多。

最后我拦下来一次,说你别自己瞎想了,去 GitHub 上搜一下有没有人遇到过一样的问题。它翻了一圈,很快找到答案:Claude Desktop 和 Claude Code 的 CLI 都注册了同一个 extension ID 的 native messaging host,Desktop 赢了,CLI 就再也拿不到连接。按社区给的思路走,二十分钟收尾结束。

这事让我有点意外的不是"它搞不定"——搞不定很正常。是它从头到尾没想过"这个问题可能不是我这个会话闭门能解的"。它默认自己能从头把答案推出来,推不出来就让你重启。如果不是我主动让它去搜社区,它可能还要再耗我半天。

我后来想过一下原因。Agent 在一个会话里是孤立的,它不容易主动承认自己卡住了。人会,人碰到同样的坑反复踩,第一反应是去 Google、去 issue、去同事那问一嘴。AI 得你点它。

二、小红书的软限流

另一个事更干脆,就是彻底搞不定,也不打算继续搞了。

过去几周我一直想把博客里已有的文章分发到小红书上。自己手工发了几篇,流量是零。我就想,要不让 Claude Code 陪我设计一轮实验——选题、标题、封面、发布节奏都认真过一遍,比我自己瞎发一定更系统。结果还是零。

反复查下来,原因基本只有一个:新号被软限流了。平台不告诉你账号有问题,它就是把你的曝光死死压在一两百以下,搜索也搜不到。你以为自己在发内容,其实是在跟一堵看不见的墙说话。

这事有它的道理。小红书注册门槛低、发帖门槛也低,机器人和营销号是个常年的大麻烦。2026 年的《社区公约 2.0》又新增了一条针对纯 AI 生成未标注内容的限流规则。从平台角度看,新号冷启动阶段保守推流是合理的自我保护。但对我这种只想把存量思考做二次分发的人,就是一堵绕不过的墙——除非养号、除非按它那套节奏慢慢来。

我没继续折腾。投产比太差,同时它让我重新确认了一件其实我心里早就有的事:

当初从个人网站开始,是对的。

网站是通用互联网环境,没人在那给我限流。文章写得有点意思,朋友会读、会转,偶尔还有陌生人看完发邮件给我。这半年下来积累的文章其实是一份可以往不同方向分发的思想库——前段时间一篇搬到知乎的文章反响不错,一大堆人收藏讨论,那是搬运的附带收获,不是一开始就冲着那个地方去写的。

小红书、抖音那种平台是另一种游戏。你不是在一个开放的互联网里写东西,你是在一个封闭的、有推荐算法做裁决权的场里参赛。规则是人家定的,规则对新玩家也极度不友好。有选择的话,先把自己的地盘立起来再去别人场上打怪,这个顺序比反过来健康得多。

失败才是工作的主旋律

讲这两个例子,不是说 AI 不行。恰恰相反。

我们很容易把 AI 想得特别神:给它任务,它就"啪"地给你一个成品。那种期待更像许愿,不像用工具。真实的工作从来不是这样的。真实的工作里,大部分时间都在失败。试一个方向不行,换一个思路还是不行,绕两圈偶尔撞上一个能跑通的。成功是少数,失败是日常。

AI 没改变这个底色。它改的是两件事:

  • 尝试的面变宽了。 同样的时间,我能同时开三四条线去试,哪怕每条都可能失败。
  • 反馈变快了。 如果没有 Claude Code,前面那个 Chrome 插件的问题我一晚上可能都卡在最初的错误假设里。现在是它帮我在几小时里把几种可能都走了一遍,逼着我往"这问题不该我闭门想"的方向去。

换句话说,AI 不是成功制造机,它是失败加速器。听上去没那么性感,但这是它最值钱的地方。失败的周期从几天缩到几小时,一年下来你做的实验数量是原来的十倍以上,采样多了,自然更容易撞到成功。

过去三个月的模型变化也值得记一下

这波体感跟过去三个月模型迭代的节奏分不开。我的时间线是这样的:

  • 2025 年 12 月末:开始认真用 Claude Code,Sonnet 4.5,用了没几天因为一些账号原因中断了。
  • 2026 年 1 月末:Moonshot 发布 Kimi K2.5,我临时切过去。意外地好用,比那时候的 Codex 5.2 体感要强。拿它做了几个小项目,预期不高但基本都跑通了。
  • 2 月初:Anthropic 发布 Opus 4.6。有一个我之前用 K2.5 折腾两三天、每次都卡在最后一步的小 demo,切到 Opus 4.6 一次过。这种时刻你才体感到所谓"模型变强"不是榜单多几个点的事,是你原本搞不定的突然就能搞定了。
  • 2 月中下GLM-5MiniMax M2.5 陆续出来,我在外面出差期间用过一段,性价比不错。
  • 3 月初:OpenAI 发布 GPT-5.4 并同步更新了 Codex。有一个 Opus 4.6 绕了半天的小插件问题,我丢给新版 Codex 跑了三个小时,搞定了。
  • 现在(4 月中):新一代模型又在路上。

整个节奏给我的感觉是,当前你卡住的那些问题,往往等个一两个月,下一代模型一出来就不再是问题了。这不是叫你躺平等模型,是说不要因为今天搞不定就灰心放弃。你可以多让它跑,也可以先搁一阵再回来。

最后

我想讲的其实是一种更诚实的期待。

如果你指望 AI 把你的工作从"以失败为主"变成"以成功为主",你会失望。任何工具都做不到这件事。工作的底色就是失败。

但如果你把它当成一个能让你更快失败、同时开多条线试水的搭档,你对它就会平和很多。它有限,你也有限,但你们凑一起能做的事比各自单独多很多。

AI 真正值钱的地方在于加速失败。这话听上去反直觉,用一阵就懂了。


参考资料

推荐阅读

订阅博客更新

新文章发布时第一时间通知你,不会发送垃圾邮件。

仅用于博客更新通知,随时可以取消订阅。

评论

或匿名评论
0/2000