Overview

DeepSeek(深度求索)是中国量化私募幻方量化旗下的 AI 研究团队,2023 年底以开源大模型进入公众视野。其核心标签是以极低成本训练出接近或比肩顶级闭源模型的性能,2025 年初的 DeepSeek-V3/R1 曾引发全球市场对英伟达高端 GPU 需求逻辑的剧烈重估。公司未融资、未上市,商业模式以 API 服务和开源生态为主,在投资语境下的重要性主要体现为中国 AI 技术路线的验证者全球算力需求叙事的压力测试工具

Landscape

DeepSeek 的核心驱动变量围绕技术迭代节奏算力效率边界地缘政治约束三条线展开。

技术迭代与模型能力是其存在感的来源。2026 年 4 月 25 日发布的 DeepSeek-V4 系列 包含两款 MoE 模型:DeepSeek-V4-Pro1.6T 总参数 / 49B 激活)和 DeepSeek-V4-Flash284B 总参数 / 13B 激活),均支持 1M 上下文长度与最大 384K 输出长度。架构上首创结合 CSA(压缩自注意力)与 HCA(混合上下文注意力)的混合注意力机制及 mHC 技术,官方称推理与长上下文效率较前代大幅提升。V4-Pro-Max 模式在 Agentic Coding 基准测试中取得顶级表现,官方定位为「当今最佳开源模型」。API 兼容 OpenAI 与 Anthropic 格式,并提供思考/非思考模式切换。原有模型名 deepseek-chatdeepseek-reasoner 将于三个月后停用,显示产品线的明确升级换代。

多模态能力出现实质性突破。2026 年 4 月 30 日,DeepSeek 开始灰度测试「识图模式」,作为与「快速模式」「专家模式」并列的独立入口,支持上传图片进行深度图像分析与描述,而非简单 OCR。2026 年 5 月 1 日,DeepSeek 发布多模态技术报告,披露视觉原语思考代码,为灰度测试中的识图模式提供了方法论层面的技术背书,表明其视觉理解能力并非简单的模型拼接或外包方案,而是原生架构的一部分。这一进展验证了此前 Landscape 中传闻的视觉模型方向,将竞争维度从纯文本扩展至视觉理解领域。若该功能全面开放并与 V4 系列的推理能力结合,DeepSeek 将切入图像/视频理解、文档解析、视觉 Agent 等增量场景,直接挑战 GPT-4V、Gemini 等多模态闭源模型的定价权。但当前为灰度测试阶段,实际性能、API 开放节奏及定价策略尚不明确,需观察正式版发布后的市场反馈。

这一发布直接冲击 NVDA 主导的「算力即护城河」叙事:若 1.6T 参数的 MoE 模型能以远低于 GPT-4/GPT-5 级别的训练成本达到顶级性能,则市场对每美元算力产出的预期将被系统性上修,高端 GPU 的不可替代性边际下降。但分歧在于,效率提升是否等同于总需求萎缩——历史经验(如移动互联网时代的云计算)显示,成本下降往往触发应用爆发,最终扩大总算力消耗。当前市场对此无定论,可观测的验证条件是:光模块 等 AI 基础设施的订单增速是否在未来 2-3 个季度出现结构性放缓,抑或因推理需求扩张而维持韧性。

定价策略与生态扩张是新增的关键变量。DeepSeek 于 2026 年 4 月 26 日宣布 全系列 API 输入缓存命中价格降至原有价格的 1/10,V4-Pro 在此基础上叠加限时 2.5 折(原定于 5 月 5 日结束),最终缓存命中价低至 0.025 元/百万 Tokens(V4-Flash 为 0.02 元/百万 Tokens)。2026 年 4 月 29 日,DeepSeek 宣布将 2.5 折优惠延长至 5 月 31 日,这一调整具有双重信号:一是成本结构优势的可持续性超预期——若折扣可维持五周以上而非最初的一周,则其推理效率的叙事可信度显著增强,而非短期营销噱头;二是主动价格战的战略决心,以更长窗口期锁定开发者迁移成本。同日,阶跃星辰 开放平台发布 Step Plan 智能路由方案,将轻任务分配至自研 Step 3.5 Flash、复杂推理交由 DeepSeek V4 Pro,无需手动切换且统一支持多模态调用,额度复用现有体系。这是国内头部模型平台首次将 DeepSeek 模型作为默认复杂推理层嵌入自身产品架构,表明 DeepSeek 正从「被接入的第三方选项」向「基础设施层默认组件」演进。此前 OpenClaw 已发布 v2026.4.24 引入 V4 系列并优化 Agent 功能,工具链的密集适配节奏持续。2026 年 5 月 4 日,OpenClaw 发布 v2026.5.2,重写插件架构并优化 V4 系列接入性能,同时新增 xAI Grok 4.3 支持,显示其将 DeepSeek 与闭源模型并列为核心基础设施的持续投入。同日,商汤科技 SenseNova 平台推出 Token Plan 服务,将 DeepSeek-V4-Flash 纳入免费公测档位(每 5 小时 150 次调用),与自有 6.7 Flash-LiteU1 Fast 模型并列,并通过 Hermes Agent 与 OpenClaw 快速接入。这是继阶跃星辰后第二家国内头部 AI 平台将 DeepSeek 模型嵌入官方服务矩阵,且以「免费公测」形式降低开发者试用门槛,进一步加速生态渗透。但需注意,5 月 31 日后的定价是否恢复原价或仅部分回调,仍是观察其真实成本结构的关键窗口;若再次延长或转为常态折扣,则对闭源厂商定价压力的结构性将大幅上升。

供应链自主化出现新进展。根据官方文档,DeepSeek V4 的细粒度专家并行(EP)方案同时在英伟达 GPU 和华为昇腾 NPU 上完成验证。这意味着其训练/推理框架已具备跨平台部署能力,降低了对单一芯片供应商的依赖。若昇腾 NPU 的量产与集群效率经实际验证,则 NVDA 在中国 AI 市场的「不可替代性」叙事将进一步承压,AMD 及国产芯片的替代空间打开。但当前昇腾的实际性能与 CUDA 生态成熟度差距仍大,跨平台优化是否仅为「可用」而非「高效」,需观察实际部署案例。

地缘政治与供应链约束构成上行风险。美国对华 AI 芯片出口管制持续收紧,4 月 22 日美国众议院外交事务委员会通过《硬件技术控制多边协同法案》等多项出口管制法案。DeepSeek 的训练基础设施依赖 AMD、华为昇腾等替代方案或存量 NVIDIA 芯片。V4 系列的发布及昇腾 NPU 验证表明其至少在当前约束下仍具备迭代能力,但若未来管制扩大至云算力租赁或模型权重分发,其开源生态的可持续性将面临考验。此外,中国宏观政策对平台经济与科技创新的态度(中国宏观)也影响其长期运营环境。

市场当前的事实分歧集中于:一方认为 DeepSeek 代表了 AI 模型的「边际成本趋零」趋势,将压缩所有闭源厂商的定价权和算力产业链的利润率;另一方认为其效率突破恰恰验证了 Scaling Law 的另一种表达——即通过架构创新(MoE、注意力机制优化)而非单纯堆叠晶体管来实现性能跃升,最终仍需先进制程与封装能力支撑,NVDA 的 CUDA 生态与 CoWoS 产能仍是瓶颈。双方的事实依据分别是:DeepSeek 的 API 定价持续低于 OpenAI 同级模型且主动发起限时折扣、缓存命中价降至 0.025 元/百万 Tokens,且折扣期从一周延长至五周以上(成本侧证据),以及其训练集群仍依赖大量 GPU/ASIC、昇腾 NPU 验证尚处早期(供给侧证据)。

可观测的变化条件包括:(1)5 月 31 日后 V4-Pro API 定价是否回调及回调幅度——验证成本优势的真实边界;(2)DeepSeek-V4 的实际采纳率——第三方平台接入数量、API 调用量增速,特别是是否出现更多如阶跃星辰 Step Plan、商汤 Token Plan 级别的深度整合;(3)闭源厂商的定价反应——OpenAI GPT-5.5 系列是否跟进下调 API 价格或缓存定价;(4)算力产业链订单——光模块、HBM、先进封装等环节的 2026 年 Q2-Q3 指引是否下调;(5)昇腾 NPU 实际部署规模——是否有公开的大型集群训练/推理案例;(6)地缘政策变动——美国是否将 DeepSeek 列入实体清单或限制其模型下载;(7)多模态视觉模型进展——灰度测试的识图模式何时全面开放、是否支持 API 调用、定价策略如何,技术报告中的视觉原语思考代码是否转化为可量化的性能优势,以及是否发布独立视觉模型扩展至视频理解领域。