昨天 DeepSeek 融资的新闻出来,我朋友圈刷到的时候愣了一下。
外界讨论的是 3000 亿人民币的估值,是中国大基金牵头、腾讯阿里跟投的阵容,是这家公司成立以来第一次开口融资。这些都很重要。但我反复看了几遍新闻,真正震到我的是另一组数字:DeepSeek 这一轮内部出资 200 亿,按这个估值跟外部投资者一起进了同一轮。而梁文锋持股近 90%。
我在 AI 行业从业这些年,没见过这种操作。
一、自己买自己的蛋糕
打个比方就清楚这事有多反常。
你有一块蛋糕,自己做了几年,员工跟着一起做了几年。某一天市场说要给这块蛋糕估个价,估出来 3000 亿。所有人都很高兴,因为每个人手里那点份额突然值钱了。
正常情况下,这时候创始人会松一口气:之前砸的钱不算了,外部资金按高估值进来了,公司有现金,员工期权有了锚点。
但梁文锋多做了一件事。他在自己定的 3000 亿估值上,又掏了 200 亿,跟外部投资者一起买。
他自己认 3000 亿这个价,且愿意再加一仓。换成股东大会上的客气话就是"我很看好公司",但客气话用不上真金白银的 200 亿。
来源也耐人寻味。梁文锋之前没融过资,公司前几年所有的钱都是他自己砸的。这种创始人通常对外部资本有戒心,第一次开口往往是因为现金不够用了。但 DeepSeek 不缺钱,幻方光是 2025 年的管理规模就超过 700 亿,光这一家私募给他个人的分红就够烧很多年研究费用。
这一轮真正的目的,是给员工的期权一个被市场认可的价格锚点。模型行业现在挖人挖得凶,没有清晰估值就没法用股权留人。融资是为这个,但创始人自己跟投 200 亿,已经远超过这个目的。这是用钱说出来的一句话:我自己认这个价,且我愿意继续在这个价上加仓。
二、第一次听到这家公司
时间倒回 2023 年底。
那会儿大模型最热的标签是"四小虎""六小虎",智谱、月之暗面、百川、MiniMax、零一万物、阶跃星辰,江湖排名变着花样讲。投资人和媒体都在这个名单里转。我那时候在智谱,整个圈子谁也没听过 DeepSeek。
直到有一天一个朋友在朋友圈问我:你听过 DeepSeek 没?听说成本优势挺夸张的。
我去翻了下这家公司的资料。它脱胎于一家叫幻方量化的私募基金,2023 年 5 月才正式成立做大模型。最早出来的版本效果上没特别出彩。他们本来想做的是效果,结果效果没达到预期,但 MoE 架构意外地把成本降了一个数量级。然后做了一件挺意外的事:既然成本低,那就直接降 API 价格。
这是圈子里第一次听到 DeepSeek 名字的时间点。不是因为模型多惊艳,是因为价格便宜,而且训练成本数据写在论文里,技术圈一看就知道这真是有东西。
三、当时全国能拿出万卡集群的没几家
还有一件事让人意外。
2023 年是中美芯片战最紧的时候。A100 早就被列入限制清单,市面上的存量越来越少。我那会儿在智谱,能直观感受到 A100 是稀缺资源。当时国内能拿出真正万卡级 A100 集群的玩家不多。商汤算一个,到 2022 年财报披露时是 27000 张 GPU,A100 储备过万。
然后 DeepSeek 那边的数字浮出水面:幻方 2021 年就投了 10 亿元搞"萤火二号",已经搭起 10000 张 A100 的集群。等于在大模型还没成为主流议题的时候,他们就已经备好了今天打大模型的硬件底座。
圈子里开始重视这家公司,是从这个时间点开始的。一家做量化私募的,跑去囤 A100 万卡,搞自研深度学习平台。这不是普通的二级市场玩家会做的事。
四、价格屠夫
2024 年 5 月,V2 发布。
价格表出来那一刻,所有人都意识到事情不一样了。输入 1 元每百万 tokens、输出 2 元每百万 tokens,大概只有当时 GPT-4 Turbo 的 1%。这不是降价,是把价格拉到了另一条赛道。
后面的连锁反应很快。智谱把 GLM-4-Plus 降了 90%,从 50 元一路砍到 5 元;字节豆包直接报到 0.0008 元每千 tokens,号称行业最低;阿里通义、百度文心也跟着下调。整整一个月,行业的定价基线被重写。
这场价格战和大家以前见过的不一样。以前模型公司降价是跟随 OpenAI,OpenAI 怎么降大家就怎么降。这一次是中国一家此前没什么名气的公司,定下了一个比 OpenAI 低两个数量级的锚,把整个国内市场拽到了完全不同的成本曲线上。
五、低调到反常
DeepSeek 在很多地方都不像一家典型的中国 AI 公司。
它在杭州,不在北京。它没有任何政府背景,也没去拿地方扶持。CEO 不出来路演、不接受采访、不发朋友圈。融资之前也没积累 VC 关系,员工招聘靠技术圈口碑,不靠猎头。
最有意思的是它招的岗位。当时圈里流传一个名字叫"数据百晓生",岗位要求是:对各种领域有强烈兴趣、自驱力强、对 AGI 实现有热情。学历背景没特别要求,Python 会读文件调 API 就够了,明确写着"不要求算法推导和手写代码"。这个岗位本质上是教 AI 怎么更像人,所以反而更看重通识、好奇心。当时我有一个做产品经理的朋友,看了岗位描述跟我说他想去试试,最后没录上。
我自己那时候也一度想去。这家公司身上有种神秘感,来自一种少见的纯粹:闷头做技术,不搞别的。后来一直也没太合适的契机,但保持着关注。
六、V3 到 R1,把行业拉回了主线
2024 年 12 月,V3 发布。
效果直接到了开源模型的顶尖水平。然后没等多久,2025 年 1 月 20 号,R1 上线,并且直接放出了 APP。这是 DeepSeek 第一次有 to C 产品,恰好赶在春节前。
接下来一周大家都看到了。R1 在春节期间登顶各大应用商店,海外媒体集体报道,OpenAI 那边的人在 X 上反复点评。整个 2025 年上半年的 AI 议程被这一件事改写。
但 R1 真正的影响不是它火本身。是它把一批在被资本和市场逼着"强行商业化"的中国大模型公司,拉回了"先把模型做好"这条主线。
DeepSeek 之前,中国的大模型公司大部分都在闭源。逻辑是:开源会被白嫖,影响商业化。R1 直接证明了这个逻辑站不住。一个完全开源的模型可以同时拥有最好的技术影响力和最广的用户基础,商业化是迟早会跟上来的事。
到 2025 年中段,Kimi 开源了 K2、智谱开源了 GLM-4.5、MiniMax 开源了 M2.1、千问继续 day-0 开源,一群之前坚持闭源的公司全部转向。市场上不再有人讨论"开源还是闭源"这个问题,转成了"你的模型够不够好"。
DeepSeek 没有发布会,没有大喊大叫,但它出手一次,行业的出牌方式就变了。
七、xAI 是另一个剧本
可能有人会说:理想主义的 AI 公司不止 DeepSeek 一家,xAI 不也是吗?
xAI 起步的时候,使命也是用 AI 寻找真理,叙事跟 DeepSeek 有几分像。它也是创始人自己出钱、自己组队、自己叫板大厂。但今天再看这家公司,故事完全不一样了。
2026 年 2 月,SpaceX 宣布收购 xAI,按 SpaceX 1 万亿、xAI 2500 亿美元的估值合并,整体估值 1.25 万亿美元。3 月,xAI 当年的 11 位联合创始人全部离职。5 月,xAI 作为独立公司不再存在,并入 SpaceX 之后改名 SpaceXAI。马斯克把 22 万张 GPU 中的大部分转手租给了 Anthropic。
这是另一种合理的剧本:足够大的算力,足够强的资本叙事,最后被并入更大的母体。如果你看 xAI 现在的产品节奏和研究强度,已经不像当初那个"为研究而研究"的样子了。
不是说 xAI 走错了,是说理想主义并不会自动走到 DeepSeek 这条路上。一家公司能不能在融资上百亿之后还保持研究优先、产品克制,是个独立选择,而且越往后越难做。
DeepSeek 的反差就在这。它走到了估值 3000 亿这个量级,融资规模约合 70 亿美元,市场关注度跟全球前几名的 AI 公司没差。但梁文锋还是不出来。最近 V4 Preview 的发布说明里,他用了荀子《非十二子》的一句:"不诱于誉,不恐于诽,率道而行,端然正己"。这话他不是说出来做公关的,是他这几年的行为本身就是这样。
八、极客精神
中国 AI 行业不缺技术人,缺的是带着以技术改变世界为执念躬身做事的人。
王坚是上一个这样的代表。他不是计算机科班出身,1990 年拿的是杭州大学心理学博士,1993 到 1998 年还在做浙大心理系主任。但 2009 年他作为阿里软件 CTO,从零开始主持研发飞天云操作系统。当时没什么人相信中国能从底层做出云操作系统,他埋头做了下去。最后阿里云从一行行代码写到几百亿生意,2019 年他以民营企业出身的第一个中国工程院院士身份当选。
我对极客精神的理解,不是技术多硬,是相信技术能让世界变好,并且愿意躬身去做。
DeepSeek 让我敬佩的,是它在 70 亿美元融资量级上还能保留这件事。所有人都已经被催着商业化、被催着去成为热点、被催着退出的当下,还有人愿意把研究本身当作目的。
中国应该有更多这样的团队。不一定都做大模型,做什么都行,关键是在自己干的事上有这种纯度。
那 200 亿不是钱的问题。它是一个声明:这家公司还要继续走研究这条路,且我自己愿意继续陪它走下去。
无论这家公司最终是成是败,无论 V4 V5 接下来表现如何,只要这种声明还在做,这种状态还在保持,就值得每个人去关注它。
Respect。
参考资料
- DeepSeek 50 亿起投,最新估值高达 3000 亿(投资界)
- DeepSeek to soon close first external fundraising at US$50b valuation(SCMP)
- DeepSeek could hit $45B valuation from its first investment round(TechCrunch)
- China's Chip Fund in Talks to Lead DeepSeek Funding(Bloomberg/FT)
- Tencent to back DeepSeek in 50B valuation(TFN)
- DeepSeek 融资,梁文锋的"现实主义"转身(钛媒体)
- 手握万块 A100 芯片,量化巨头幻方发布通用大模型(华尔街见闻)
- 幻方 AI DeepSeek 模型背后的万卡集群建设
- 解码 DeepSeek 模式:幻方量化十年孵化出 OpenAI"杀手"(腾讯新闻)
- 创大模型价格新低!DeepSeek API 价格战(证券时报)
- 大模型"价格战"仍在继续 智谱旗下大模型降价最高逾 90%(财联社)
- DeepSeek - Wikipedia 模型时间线
- Change Log | DeepSeek API Docs
- DeepSeek V4 问世,引用《荀子》自勉(腾讯新闻)
- DeepSeek "不诱于誉不恐于诽"解读(腾讯新闻)
- SpaceX 收购 xAI,合并估值 1.25 万亿美元(澎湃)
- 马斯克解散 xAI,并入 SpaceX 并出租 22 万张 GPU(新浪财经)
- DeepSeek "数据百晓生"岗位招聘详情
- 年薪 154 万,DeepSeek 豪掷千金全网求简历(澎湃)
- 浙大心理与行为科学系杰出系友王坚博士当选中国工程院院士
- 王坚(信息技术专家)- 维基百科
- SenseCore 商汤大装置 — A100 储备与万卡集群(智东西)
