前几天在调研文生视频模型,发现一件事跟我原本的认知差别挺大的:在文生图和文生视频这两个方向上,中国公司在开源社区的存在感远没有语言模型那么强。
我一直以为中国模型在各条线上都已经占了主导。结果一看,不是那么回事。这让我回头梳理了一遍这三年开源社区的变化。
模型开源不是软件开源
先说一个很多人可能没想过的事。
软件开源,源代码放出来,拿到了就没什么秘密了,你可以从头造一个一样的。模型不是。模型开源出来的多数情况下就是权重和推理脚本,训练方法、训练数据、工程细节这些核心东西,通常不公开。
你拿到权重能干什么?部署推理,做微调。想从零复现?几乎不可能。所以模型的「开源」和软件的「开源」从一开始就不是一回事。
这就引出了一个早年大家吵了很久的问题:既然模型开源跟软件开源不一样,那模型开源到底图什么?
软件开源最大的好处是社区共建,全世界的开发者一起改 bug、加功能。但模型开源之后,真正有能力参与模型研发的人和机构太少了。你得有大量算力,得有数据,得有训练基础设施。绝大多数人拿到权重也只能跑跑推理。
当时李彦宏说开源大模型没有意义,我一度觉得他说的有道理。社区共建这个最大的驱动力不成立,那开源图什么?
后来的事情回答了这个问题。
LLaMA 的天下
2022 年底 ChatGPT 出来,大模型进了公众视野。在这之前,开源世界挺单调的。OpenAI 的 GPT-2 在 2019 年完全开源,到了 GPT-3 就变成申请制 API 访问了。我记得当时参加黑客松想用 GPT-3,结果发现得发邮件申请才能拿到 API。本质上已经闭源了。
2023 年开源社区基本是 Meta 的 LLaMA 在主导。LLaMA 1 是2023年2月,LLaMA 2 是7月。每次 LLaMA 发新版,国内就有一批模型跟着宣布升级,这就是当时说的「百模大战」,节奏被 LLaMA 牵着走。
中国模型在这个阶段开源,说白了就是推广。开出来的都是比较小的型号。智谱的 GLM-6B 是最早的代表,很多人接触大模型私有化部署就是从它开始的。我记得当时有个朋友在选模型,我还纳闷怎么选了个中国模型,他说是清华做的,口碑还不错。百川开源了 14B,李开复创办的零一万物在 2023 年 11 月开源了 Yi-34B,那个时间段算是中国开源模型里体量比较大的一个。上海人工智能实验室也在持续做 InternLM(书生)系列。
大家的策略都一样:小的开源做推广,大的不开源做商业化。
千问进场
2024 年这个平衡被千问打破了。
2024 年中开始阿里的千问密集发力,从十几 B 到 72B,各种体量效果都不错,全部开源。原来大家默认大模型不开源,突然有人把效果很好的大模型直接放出来了。
LLaMA 虽然在国际上影响力大,但中文能力一直不行,实际用还得二次训练。千问中文场景下几乎可以直接用,很快就把 LLaMA 在中文开源社区的位置替掉了。
到 2024 年底,千问系列已经是中文开源模型的事实标准。闭源模型第一次感受到了来自开源的压力。
DeepSeek 把桌子掀了
千问是在现有规则内做到了最好。DeepSeek 是直接把规则改了。
DeepSeek 从 2024 年入局,路线很简单:出来就开源,技术报告写得极其透彻。2024 年底 V3 发布,几千亿参数,效果极好,发布即开源。那个时间点很少有人见过这种体量的模型直接放出来。
但真正炸开的是 2025 年 1 月的 R1。
OpenAI 在 2024 年 9 月刚推出 O1 推理模型,DeepSeek 的 R1 春节前就出来了。推理能力跟当时最顶尖的闭源模型非常接近,虽然没有完全持平,但差距小到让人意外。然后发布第一天就完全开源。
原来大家维持的是一套「小的开源、大的闭源」的秩序。DeepSeek 开源出来的东西比很多公司最好的闭源模型还好,这套秩序一下就崩了。
LLaMA 4 是另一个注脚。Meta 憋了很久训了个超大模型想夺回开源社区的位置,2025 年 4 月推出来,翻车了。效果远不如预期,还爆出了跑分作弊的事。后来 Yann LeCun 自己承认「results were fudged」,Zuckerberg 对整个 GenAI 团队失去了信心。LLaMA 4 基本没人用,LLaMA 系列在开源社区的地位到此结束。
Day-0 开源变成了行规
DeepSeek 之后,中国的模型公司一个接一个转向了 day-0 开源,最好的模型发布当天就开源。
Kimi 在 2025 年 7 月开源了 K2,万亿参数的 MoE 模型。MiniMax 开源了 M2.5。智谱在持续迭代 GLM 系列。一波接一波,开源模型的水平越来越高。
今天你去看语言模型的国际开源社区,排行榜上几乎全是中国模型。千问、DeepSeek、GLM、MiniMax、Kimi,海外模型的存在感已经很弱了。
DeepSeek 做的事情不是贡献了一个模型。它改了整个行业的出牌方式。
但风向又在变
不过这波 day-0 开源的热度正在降温。
DeepSeek 上一次开源是 V3.2,2025 年 12 月的事,到现在四个多月了。V4 传了很久,没出来。在这段空窗期里,大家的策略又开始松动了。
千问 3.6 Plus 在 2026 年 3 月底发布,没有开源,API-only。这是千问系列第一次旗舰模型不开源。智谱的 GLM-5.1 也是先闭源发布,虽然这两天刚宣布要开源权重。不少公司的多模态模型最新版也不再开源了。
似乎回到了当年那个问题:开源图什么?当竞争压力减小,答案可能又会变。
文生图和文生视频还在等
回到最开始让我意外的那个发现。
文生图的开源社区至今还是海外模型在主导。大家用得最多的是 Stability AI 的 Stable Diffusion 系列和 Black Forest Labs 的 FLUX 系列。中国模型有一些进展,千问出了 Qwen-Image,腾讯有混元图像 3.0,智谱有 GLM-Image。但跟语言模型的情况比差太远了。
文生视频也是。阿里最后一次开源的文生视频模型是 2025 年 7 月的 Wan 2.2,快 9 个月了没有新东西出来。最近热度比较高的开源文生视频模型是 LTX-2,来自以色列公司 Lightricks,2026 年 1 月开源了权重。
这跟语言模型完全是两个世界。语言模型这边中国模型已经铺满了整个开源社区,文生图和文生视频那边还更像 2023 年的样子:海外模型主导,中国模型零星出现。
在等什么
大家在等 DeepSeek V4。
但等的不只是一个模型。DeepSeek 之前证明过一件事:一个足够强的模型在发布当天完全开源,会连带改变一整个行业的策略走向。这件事在语言模型上发生过,在文生图和文生视频上还没有。
我有时候半开玩笑地想,可能就是需要 DeepSeek 再出手一次。但话说回来,DeepSeek 自己也四个多月没出新模型了。
