最近跟不少朋友聊天,聊到 AI agent 的时候我有个习惯,会掏手机远程连到电脑上,把过去 24 小时正在跑的几个 agent 打开给他们看。这个围绕某个目标已经自动跑了十几个小时,那个在做实验调参数。
大家看完以后反应挺一致的:原来已经到这个程度了,跟自己之前想的不一样。
接下来的反应就很有意思了。
一、"帮我给老板讲讲"
朋友们看完以后,第一句话基本都是这类:
"能不能来给我们老板讲讲?"
"我想带我们技术负责人过来看看。"
"你能给我们做个培训分享吗?"
没毛病。你觉得这事重要,想把最相关的人拉进来,这个动机很好。
但回头看我们公司自己 AI agent 渗透进来的过程,说实话,真正推动变化的不是哪堂课、哪次分享。
是某个人自己先做起来了,在他手头的事情里搞出了一个让周围人觉得"不对劲"的变化。
一个做销售的人,突然技术搞得很专业,像工程师一样,本职出单效率还特别高。一个做行政或 HR 的,发现她竟然也能搞技术、做 marketing,在原来的岗位上搞出了产品级的东西。周围人开始觉得奇怪——你怎么不太像原来那个销售、那个行政了?
到这一步,好奇的人自然就来了。同事、上级、朋友,变化就发生在他们身边,他们看得到,这时候你讲什么他们才真的能收进去。然后从你这里传导到另一个同事,再影响另一个,再扩散开。
想靠"我去促成一个机会,让老板听一堂课"来推动——坦白说很难。除非那个老板本人第一天就自己上手用了。因为现在对 AI 能做什么、不能做什么的认知,全来自于亲手摸到边界,不是听来的。
这事有数据佐证。BCG 2025 年初的报告说,75% 的高管把 AI 列为前三优先级,但只有四分之一真正拿到了显著价值。McKinsey 那边更直白——70% 的员工直接跳过公司提供的正式 AI 培训视频,靠自己摸索和同事之间口耳相传来学。
培训能传递的信息量就那么多。而更可怕的是,一个自己没深度用过 AI 的人如果去制定政策,很容易走两个极端:要么异想天开,以为 AI 什么都能干,定了一堆不切实际的 KPI,底下人苦不堪言,而且他觉得这很简单;要么完全不屑一顾,"又是泡沫又来一遍",然后错过了真正的窗口。
所以第一个误区,也是我觉得最大的一个:不要总想从别人身上出发。自己先做。
二、博士水平的 AI 在写周报
第二个事我觉得挺可惜的。
不少头部公司给员工提供的 AI 基础设施非常好,最顶尖的模型,不限用量,政策也宽松。但大多数人拿到以后,下意识就从最常规的任务入手——开会总结、汇报材料、周报月报——做完也就停了。
不是说这些不该做,AI 在这些事上确实好用。但止步于此,说实话很浪费。
你如果沿着公司的价值链往深处看,最痛的环节——可能是 marketing,可能是 sales,可能是产品本身,也可能是技术研发——AI 是不是也能做点事?你不一定是那个领域的专家,但你对行业的理解加上 AI 的执行力,是有可能在那些节点上搞出东西的。
想想看。一个博士水平的 AI,你让它每天写周报,它就老老实实写周报——你安排什么它干什么,很听话。但你让它去研究前沿的数学、生物、医学,去做实验和推演,它也做得很好。一个是文员的价值,一个是科学家的价值。中间差的可不是一点半点。
Worklytics 的数据说,一个组织里真正深度使用 AI 的 power user 大概只占两到三成。剩下的人手里握着一模一样的工具,只用来做最浅的事。BCG 2025 年 10 月的报告也说,74% 的企业在扩大 AI 应用范围的过程中卡住了。不是工具不行,是用的人只用了它一个角。
三、光有长期没有短期,坚持不下去
这个问题比前两个隐蔽。
用 AI 一段时间以后,很多人会经历一条心态曲线:一开始"竟然这么强",然后慢慢变成"我到底该做什么"。方向看起来很多,都能做,但具体做什么、怎么持续下去,反而最难。
我自己踩过这个坑。
AI agent 确实能做很了不起的事,但它不是许愿机。一些比较大的方向,agent 也得烧大量 token,花很长时间,反复实验去探索、去调方向,才可能出结果。也可能出不了——你已经走到知识的边界了,往前探本来就不容易。如果你全押在这类项目上,中间很容易热情消磨殆尽。搞了半天看不到成果,别人问你在干嘛也说不清楚。
所以得搭配着来。
短期要有正反馈很快的事。我自己最短的反馈链来自数字身份的经营,做官网 SEO 优化,有人循着搜索找过来了;写博客,有人觉得有收获,愿意分享和互动。中间穿插一些拿 AI 帮朋友做的小项目——帮人装小龙虾、给人做游戏,都是见效很快的事。
中期要有能沉淀下来的产品。AIMA 这套东西,拿去给潜在合作伙伴讲,有人愿意装、愿意推广,这是一种比"我搞了个实验"更结实的正反馈。
长期那些深水区的探索,则安静地跑着。
Kotter 变革管理八步里有一条叫"制造短期胜利",道理一样:短期成果撑住信心,你才有底气继续啃硬骨头。如果过程中还能带来一些收入,把 token 成本 cover 掉,那正循环就更稳了。
四、提示词是过去式了
最后一个,也是我觉得很多人还卡在上面的。
大家一说到用 AI,还是很关注提示词,觉得得把 prompt 研究透才行。
两年前这么想没问题。现在不是了。
现在的模型你给个目标,两句话,它就能去跑很复杂的任务。prompt 早就不是瓶颈了。
瓶颈在 harness。怎么给 agent 搭一个适合它干活的环境。
你要想的事变了:工作目录的文档结构怎么设计?怎么给它提供实验用的机器?什么时候去看看它有没有走偏?什么时候该让它换个方向或者换个方法?怎么做定期总结和归档?
Karpathy 2025 年初提了"vibe coding"——用自然语言随手让 AI 写代码,很自由。一年之后他自己复盘,说行业已经从 vibe coding 走到了"agentic engineering",价值从语法和实现层往上走,走到了判断力、品味和管理能力上。Shopify 的 Tobi Lutke 提了另一个词叫"context engineering"——不是怎么写好一句 prompt,而是怎么用对的信息去填满 agent 的上下文窗口。
说白了,AI 就是你的一个数字员工。你跟一个员工协作,不会觉得最重要的事是研究怎么给他写第一封邮件吧?那封邮件只是其中很小的一环。你真正需要想的是怎么给他配一套合适的工作环境和指导方式,发挥你对方向的把控,也发挥他的执行力,规避掉他容易犯的错。
把思路从"怎么写好一句话"转到"怎么管好一个数字员工",跟 AI 协作的感觉会完全不一样。
回头看,这四件事其实是一回事。
自己先做,别等别人。做了以后别停在舒适区,沿着价值链往深处看。给自己安排好节奏,短期反馈别断。然后把注意力从 prompt 转到环境和协作方式上来。
做出来的变化,不用你去推,它自己就会传导。
参考资料
- BCG, From Potential to Profit: Closing the AI Impact Gap, January 2025.
- McKinsey, Superagency in the Workplace: Empowering People to Unlock AI's Full Potential at Work, 2025.
- Tobi Lutke (Shopify CEO), Internal Memo on AI Usage Expectations, April 2025.
- Andrej Karpathy, Sequoia AI Ascent 2026: From Vibe Coding to Agentic Engineering, April–May 2026.
- Tobi Lutke & Andrej Karpathy on "Context Engineering," 2025.
- BCG, The Widening AI Value Gap, October 2025.
- Worklytics, AI Adoption Benchmarks 2025, Q3 2025.
- McKinsey, The State of AI in 2025, March 2025.
- John P. Kotter, Leading Change: Generate Short-Term Wins.
