开源社区的 DeepSeek 时刻

前几天在调研文生视频模型，发现一件事跟我原本的认知差别挺大的：在文生图和文生视频这两个方向上，中国公司在开源社区的存在感远没有语言模型那么强。

我一直以为中国模型在各条线上都已经占了主导。结果一看，不是那么回事。这让我回头梳理了一遍这三年开源社区的变化。

模型开源不是软件开源

先说一个很多人可能没想过的事。

软件开源，源代码放出来，拿到了就没什么秘密了，你可以从头造一个一样的。模型不是。模型开源出来的多数情况下就是权重和推理脚本，训练方法、训练数据、工程细节这些核心东西，通常不公开。

你拿到权重能干什么？部署推理，做微调。想从零复现？几乎不可能。所以模型的「开源」和软件的「开源」从一开始就不是一回事。

这就引出了一个早年大家吵了很久的问题：既然模型开源跟软件开源不一样，那模型开源到底图什么？

软件开源最大的好处是社区共建，全世界的开发者一起改 bug、加功能。但模型开源之后，真正有能力参与模型研发的人和机构太少了。你得有大量算力，得有数据，得有训练基础设施。绝大多数人拿到权重也只能跑跑推理。

当时李彦宏说开源大模型没有意义，我一度觉得他说的有道理。社区共建这个最大的驱动力不成立，那开源图什么？

后来的事情回答了这个问题。

LLaMA 的天下

2022 年底 ChatGPT 出来，大模型进了公众视野。在这之前，开源世界挺单调的。OpenAI 的 GPT-2 在 2019 年完全开源，到了 GPT-3 就变成申请制 API 访问了。我记得当时参加黑客松想用 GPT-3，结果发现得发邮件申请才能拿到 API。本质上已经闭源了。

2023 年开源社区基本是 Meta 的 LLaMA 在主导。LLaMA 1 是2023年2月，LLaMA 2 是7月。每次 LLaMA 发新版，国内就有一批模型跟着宣布升级，这就是当时说的「百模大战」，节奏被 LLaMA 牵着走。

中国模型在这个阶段开源，说白了就是推广。开出来的都是比较小的型号。智谱的 GLM-6B 是最早的代表，很多人接触大模型私有化部署就是从它开始的。我记得当时有个朋友在选模型，我还纳闷怎么选了个中国模型，他说是清华做的，口碑还不错。百川开源了 14B，李开复创办的零一万物在 2023 年 11 月开源了 Yi-34B，那个时间段算是中国开源模型里体量比较大的一个。上海人工智能实验室也在持续做 InternLM（书生）系列。

大家的策略都一样：小的开源做推广，大的不开源做商业化。

千问进场

2024 年这个平衡被千问打破了。

2024 年中开始阿里的千问密集发力，从十几 B 到 72B，各种体量效果都不错，全部开源。原来大家默认大模型不开源，突然有人把效果很好的大模型直接放出来了。

LLaMA 虽然在国际上影响力大，但中文能力一直不行，实际用还得二次训练。千问中文场景下几乎可以直接用，很快就把 LLaMA 在中文开源社区的位置替掉了。

到 2024 年底，千问系列已经是中文开源模型的事实标准。闭源模型第一次感受到了来自开源的压力。

DeepSeek 把桌子掀了

千问是在现有规则内做到了最好。DeepSeek 是直接把规则改了。

DeepSeek 从 2024 年入局，路线很简单：出来就开源，技术报告写得极其透彻。2024 年底 V3 发布，几千亿参数，效果极好，发布即开源。那个时间点很少有人见过这种体量的模型直接放出来。

但真正炸开的是 2025 年 1 月的 R1。

OpenAI 在 2024 年 9 月刚推出 O1 推理模型，DeepSeek 的 R1 春节前就出来了。推理能力跟当时最顶尖的闭源模型非常接近，虽然没有完全持平，但差距小到让人意外。然后发布第一天就完全开源。

原来大家维持的是一套「小的开源、大的闭源」的秩序。DeepSeek 开源出来的东西比很多公司最好的闭源模型还好，这套秩序一下就崩了。

LLaMA 4 是另一个注脚。Meta 憋了很久训了个超大模型想夺回开源社区的位置，2025 年 4 月推出来，翻车了。效果远不如预期，还爆出了跑分作弊的事。后来 Yann LeCun 自己承认「results were fudged」，Zuckerberg 对整个 GenAI 团队失去了信心。LLaMA 4 基本没人用，LLaMA 系列在开源社区的地位到此结束。

Day-0 开源变成了行规

DeepSeek 之后，中国的模型公司一个接一个转向了 day-0 开源，最好的模型发布当天就开源。

Kimi 在 2025 年 7 月开源了 K2，万亿参数的 MoE 模型。MiniMax 开源了 M2.5。智谱在持续迭代 GLM 系列。一波接一波，开源模型的水平越来越高。

今天你去看语言模型的国际开源社区，排行榜上几乎全是中国模型。千问、DeepSeek、GLM、MiniMax、Kimi，海外模型的存在感已经很弱了。

DeepSeek 做的事情不是贡献了一个模型。它改了整个行业的出牌方式。

但风向又在变

不过这波 day-0 开源的热度正在降温。

DeepSeek 上一次开源是 V3.2，2025 年 12 月的事，到现在四个多月了。V4 传了很久，没出来。在这段空窗期里，大家的策略又开始松动了。

千问 3.6 Plus 在 2026 年 3 月底发布，没有开源，API-only。这是千问系列第一次旗舰模型不开源。智谱的 GLM-5.1 也是先闭源发布，虽然这两天刚宣布要开源权重。不少公司的多模态模型最新版也不再开源了。

似乎回到了当年那个问题：开源图什么？当竞争压力减小，答案可能又会变。

文生图和文生视频还在等

回到最开始让我意外的那个发现。

文生图的开源社区至今还是海外模型在主导。大家用得最多的是 Stability AI 的 Stable Diffusion 系列和 Black Forest Labs 的 FLUX 系列。中国模型有一些进展，千问出了 Qwen-Image，腾讯有混元图像 3.0，智谱有 GLM-Image。但跟语言模型的情况比差太远了。

文生视频也是。阿里最后一次开源的文生视频模型是 2025 年 7 月的 Wan 2.2，快 9 个月了没有新东西出来。最近热度比较高的开源文生视频模型是 LTX-2，来自以色列公司 Lightricks，2026 年 1 月开源了权重。

这跟语言模型完全是两个世界。语言模型这边中国模型已经铺满了整个开源社区，文生图和文生视频那边还更像 2023 年的样子：海外模型主导，中国模型零星出现。整个开源社区正在经历一场「短视频式」的爆发，但这种爆发目前主要发生在语言模型和软件工具领域。

在等什么

大家在等 DeepSeek V4。

但等的不只是一个模型。DeepSeek 之前证明过一件事：一个足够强的模型在发布当天完全开源，会连带改变一整个行业的策略走向。而从商业角度看，模型公司的终局是云公司——模型开源背后的生意远比想象中大。这件事在语言模型上发生过，在文生图和文生视频上还没有。

我有时候半开玩笑地想，可能就是需要 DeepSeek 再出手一次。但话说回来，DeepSeek 自己也四个多月没出新模型了。