DeepSeek 的 10 万亿美元大战略

DeepSeek 可能是当下最被低估的战略玩家。

当智谱、月之暗面、MiniMax 纷纷推出编程订阅、多模态模型、语音视频功能时，DeepSeek 却像个"怪胎"：不做 Harness，不碰多模态，连语音模型都没有，却乐此不疲地开源自己的"独家秘方"。

这看起来像是烧钱，但 GDP（@bookwormengr）的分析揭示了一个更宏大的图景：DeepSeek 的目标不是几亿美元的订阅收入，而是撬动一个 10 万亿美元的中国 AI 硬件生态圈，并让自己顺势进入万亿美元市值俱乐部。

技术创新的"英雄之旅"

DeepSeek 的每一步技术选择都在为这盘大棋铺路：

混合专家模型（MoE）：当所有人卷稠密模型时，DeepSeek 选择了更难训练的 MoE，训练成本直降 40-50%。

GRPO 算法：从第一性原理出发，用全新的强化学习算法替代成本极高的 PPO。

MLA 系列注意力机制：多头潜在注意力、DSA、CSA、HCA 等魔改技术，把 KV 缓存砍掉 90% 以上。在 100 万上下文长度下，DeepSeek V4 只需要 5.48GB HBM，而 GLM5 需要 60GB，Qwen3-235B 需要 89GB。

Engram 印迹模块：用内存换算力，把 N-gram 升级为 O(1) 查找的条件内存，大幅节省计算量。

mHC 修正超连接：解决大模型训练稳定性难题，在几乎不增加算力开销（仅 6.7%）的情况下，让 27B 模型在复杂推理测试中暴涨 7.2 分。

这些创新不是孤立的。它们共同指向一个目标：在缺乏 EUV 光刻机的条件下，用算法创新弥补硬件劣势，让国产 GPU/ASIC 变得"够用、好用"。

DeepSeek 的 KV 缓存压缩技术直接催生了一个新市场：

NAND 闪存：长江存储（YMTC）成为全球 3D NAND 巨头。DeepSeek 的缓存转存技术让 SSD 成为 HBM 的廉价替代品，为国产存储芯片创造了庞大需求。

LPDDR 内存：长鑫存储（CXMT）的 LPDDR 速度仅落后国际顶尖水平半代，容量密度落后一代。DeepSeek 的 Engram 模块需要海量内存空间，正好消化国产 LPDDR 产能。

这是经典的"用空间换时间"——读取存储的成本远低于计算成本。当国产 GPU 在 FLOPs 上注定长期落后时，用充足的 NAND 和 LPDDR 来弥补，是扬长避短的绝配。

OpenAI 曾与 AMD、Cerebras 签署对赌协议：随着采购规模达到特定里程碑，OpenAI 能以极低价格获得股票认股权证。AMD 授予了 OpenAI 高达 1.6 亿股普通股的认股权证。

DeepSeek 很可能正在与国内存储、ASIC、CPU、网络协议栈厂商签署类似的利益绑定协议。通过深度联合调优，帮助本土硬件在运行顶尖 AI 工作负载时平替甚至超越西方硬件。

这不是卖软件订阅，是扶持生态、切蛋糕、进万亿俱乐部。

DeepSeek 的开源不是情怀，是生态建设的必要手段：

所有反常举动串联起来，只有一个解释：DeepSeek 在下一盘 10 万亿美元的大棋。