过去 15 个月,DeepSeek 几乎在主流视野里隐身了。
在这段大模型行业每隔几个月就要通过新品发布自证一次的狂飙期里,DeepSeek 显得格格不入。他们没有推出新一代模型,也没跟进频繁的功能补丁,甚至没去凑行业里任何一个热闹。
但舆论从未放过它。
质疑、猜测与传闻交织成网,如影随形。
有人判断它已掉队,有人揣测它在等待救命钱,更有人断言,DeepSeek 彻底错失了 AI 竞赛最关键的窗口期。
在那个更新频率即实力的丛林法则里,沉默往往被直接等同于落后。
直到今天,DeepSeek 拿出了 V4。
一、名气有多大,质疑就有多惨
DeepSeek真正的问题,从来不是技术,而是节奏。
2025年1月,DeepSeek R1横空出世,英伟达市值单日蒸发近6000亿美元,华尔街把这件事叫做AI界的斯普特尼克时刻。全球下载量*,就连OpenAI CEO Sam Altman都说令人印象深刻,硅谷的工程师们彻夜研读技术报告。
那个冬天,DeepSeek是中国科技史上最快进入全球视野的公司之一。
可紧接着,是漫长的静默。
从 R1 到 V4,中间整整 15 个月,DeepSeek 的版本号像是凝固了。
外界坐不住了,开始自发为它编写剧本。 2025 年二季度,QuestMobile 的数据给出了残酷的侧写,DeepSeek月均下载量从 8000 万跌至 2000 万。
与此同时,竞争对手的评测刷榜从未停歇,国产最强的标签被轮番争抢,DeepSeek 似乎成了那个过气的英雄。
紧随其后的是关于融资的传闻,估值从 100 亿美元跳涨到 200 亿美元,阿里、腾讯入局的消息传得有鼻子有眼。梁文锋过去对外部资金的克制立场,被外界解读为“迫于生计的松动”。
这套叙事逻辑很顺滑。用户流失、友商倒逼、资金承压,DeepSeek 大抵是撑不下去了。
这种逻辑里藏着一个默认的偏见。如果一家 AI 公司超过三个月没搞出大动静,就是在原地踏步。
DeepSeek 显然不打算接受这种定义。
二、15个月,外界发生了什么
过去15个月,DeepSeek确实慢。尤其是放在整个行业的狂飙背景下,显得更刺眼。
OpenAI融资的节奏快到荒诞。
2025年9月完成400亿美元融资,估值1570亿美元。七个月后,再次完成1220亿美元融资,投后估值8520亿美元。两轮加起来超过1600亿美元,不到一年。GPT-4o mini、o3、GPT-5,模型迭代速度按月计。
Anthropic的节奏类似。Claude 3系列到Claude 3.5系列,再到Opus 4.6、Sonnet 4.7,每一轮发布都伴随着密集的评测轰炸和媒体报道。
国内更像一场接力赛。阿里千问密集推出Qwen 2.5系列、QwQ推理模型,今年四月72小时内连发三款战略级模型。月之暗面的Kimi持续迭代,估值从不到百亿涨到180亿美元。
就在DeepSeek V4发布的同一周,马斯克的SpaceX宣布有权以600亿美元收购AI编程初创公司Cursor,那家公司2025年2月年化收入才突破20亿美元,从零到被600亿估值盯上,不过两年。
整个行业形成了一套不成文的逻辑:不更新等于落后,没融资等于出局。
在这个全员加速的跑道上,DeepSeek 的闭关,像是一种对时代节奏的无声对抗。
三、沉默的另一面
V4 技术报告里藏着过去这段时间的部分答案。
架构层面重新设计了注意力机制。在token维度进行压缩,结合DSA稀疏注意力,既实现了全球*的长上下文能力,又大幅降低了计算和显存需求。1M超长上下文,现在成为所有官方服务的标配。
Agent能力做了专项优化,针对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流框架进行适配。
公告里有一句话值得注意:DeepSeek-V4已成为公司内部员工使用的Agentic Coding模型,使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式。
意思直白是说,DeepSeek自己先用,确认好用了,才拿出来给公众看。
把这些选择放在一起,方向很集中,压缩计算成本,把长上下文变成标配,优化Agent协同,用Flash版降低推理门槛。它在解决的问题是怎么用,而不是有多强。
在一个还在不断刷新"最强模型"的行业里,这是一种克制的路线。
更值得玩味的是关于硬件的深层适配。在过去这段时间里,DeepSeek 实现了对华为昇腾(Ascend)芯片的*压榨。
这是一个极其关键的信号。
在大模型被算力卡脖子的常态下,DeepSeek 并没有选择把未来押注在单纯的 H100 堆叠上,而是走通了一条国产软件+国产算力的深度协同路径。
这不仅仅是出于成本考量,更是一种底层的技术主权,证明了即便在非顶配算力环境下,通过算法的*优化,依然能跑出世界级的性能。
在出口管制持续收紧的背景下,不依赖英伟达的完整技术栈路径,对整个中国AI产业的意义远超DeepSeek本身。
DeepSeek 用 15 个月证明了一件事,它拒绝参与过程的可见性竞赛。它不要过程的繁荣,只要结果。
梁文锋在极少数场合说过一句话,大意是:我们不做用来讲故事的产品,我们做技术本身。
这不是被迫的选择,更像主动的取舍。
四、那16个字
在技术参数堆满的DeepSeek官方推文中, 末尾有 16 个字:
“不诱于誉,不恐于诽,率道而行,端然正己。”
这出自《荀子·非十二子》。完整原文是:是以不诱于誉,不恐于诽,率道而行,端然正己,不为物倾侧。
荀子当时的语境,是在痛斥那些追逐名声、随波逐流的人。他认为,真正的羞耻是不把事情做好,而不是不被看见。
用来翻译DeepSeek这十五个月,相当精准。
2025年初,DeepSeek处于"誉"的极端,全球最热的AI公司,硅谷朝圣对象,中国科技的象征。在这个位置上,最危险的是被自己的名声带着跑,不为了维持热度而急着交出一份平庸的卷子。
随后的一年,是"诽"的阶段。用户流失数据、落后论、神坛跌落的标题,每一条都在暗示它需要回应,需要反驳,需要解释。
DeepSeek都没有站出来。
那16个字放在V4公告的结尾,语气平静,没有攻击性,没有说教,但信息量很足。
翻译成直白的话是:我知道你们说了什么,但你们的话,无法改变我的方向。
这不是凡尔赛,也不像是姿态管理。
在今天,这是一个承受了十五个月空窗期的公司,在交卷的时候,顺手说了一句两千多年前就有人说过的话:我走我的路。
大模型行业有一种根深蒂固的焦虑,仿佛必须时刻在场才算存在。
而梁文锋和 DeepSeek 用 15 个月的消失,完成了一次对这种焦虑的拒绝。
V4 只是结果。
至于那个漫长、枯燥、充满质疑的过程,梁文锋没打算解释。












