DEEPSEEK · 深度求索

From Frontier Wiki, the living research wiki

Summary

DeepSeek 是幻方量化旗下 AI 研究团队，以低成本高效能 MoE 模型与超长上下文能力著称；私有公司，核心价值在于其对全球 AI 算力需求叙事及 NVDA 产业链的潜在冲击与验证意义。

Consensus Gap

市场对 DeepSeek 的共识分歧在于：其持续的技术突破（低成本、长上下文、强推理）是否结构性削弱高端 GPU 需求增速，抑或反而因 AI 应用爆发而扩大总需求；以及中国 AI 自主供应链能否在出口管制下持续迭代。

Last Delta

[Confirmation] 商汤 SenseNova 平台将 DeepSeek-V4-Flash 纳入 Token Plan 免费公测，OpenClaw 2026.5.2 版本持续优化 V4 系列接入体验，第三方生态整合密度进一步上升；API 兼容性修复降低接入摩擦。

Overview

DeepSeek（深度求索）是中国量化私募幻方量化旗下的 AI 研究团队，2023 年底以开源大模型进入公众视野。其核心标签是以极低成本训练出接近或比肩顶级闭源模型的性能，2025 年初的 DeepSeek-V3/R1 曾引发全球市场对英伟达高端 GPU 需求逻辑的剧烈重估。公司未融资、未上市，商业模式以 API 服务和开源生态为主，在投资语境下的重要性主要体现为中国 AI 技术路线的验证者和全球算力需求叙事的压力测试工具。

Landscape

DeepSeek 的核心驱动变量围绕技术迭代节奏、算力效率边界与地缘政治约束三条线展开。

技术迭代与模型能力是其存在感的来源。2026 年 4 月 25 日发布的 DeepSeek-V4 系列 包含两款 MoE 模型：DeepSeek-V4-Pro（1.6T 总参数 / 49B 激活）和 DeepSeek-V4-Flash（284B 总参数 / 13B 激活），均支持 1M 上下文长度与最大 384K 输出长度。架构上首创结合 CSA（压缩自注意力）与 HCA（混合上下文注意力）的混合注意力机制及 mHC 技术，官方称推理与长上下文效率较前代大幅提升。V4-Pro-Max 模式在 Agentic Coding 基准测试中取得顶级表现，官方定位为「当今最佳开源模型」。API 兼容 OpenAI 与 Anthropic 格式，并提供思考/非思考模式切换。原有模型名 deepseek-chat 与 deepseek-reasoner 将于三个月后停用，显示产品线的明确升级换代。

多模态能力出现实质性突破。2026 年 4 月 30 日，DeepSeek 开始灰度测试「识图模式」，作为与「快速模式」「专家模式」并列的独立入口，支持上传图片进行深度图像分析与描述，而非简单 OCR。2026 年 5 月 1 日，DeepSeek 发布多模态技术报告，披露视觉原语思考代码，为灰度测试中的识图模式提供了方法论层面的技术背书，表明其视觉理解能力并非简单的模型拼接或外包方案，而是原生架构的一部分。这一进展验证了此前 Landscape 中传闻的视觉模型方向，将竞争维度从纯文本扩展至视觉理解领域。若该功能全面开放并与 V4 系列的推理能力结合，DeepSeek 将切入图像/视频理解、文档解析、视觉 Agent 等增量场景，直接挑战 GPT-4V、Gemini 等多模态闭源模型的定价权。但当前为灰度测试阶段，实际性能、API 开放节奏及定价策略尚不明确，需观察正式版发布后的市场反馈。

这一发布直接冲击 NVDA 主导的「算力即护城河」叙事：若 1.6T 参数的 MoE 模型能以远低于 GPT-4/GPT-5 级别的训练成本达到顶级性能，则市场对每美元算力产出的预期将被系统性上修，高端 GPU 的不可替代性边际下降。但分歧在于，效率提升是否等同于总需求萎缩——历史经验（如移动互联网时代的云计算）显示，成本下降往往触发应用爆发，最终扩大总算力消耗。当前市场对此无定论，可观测的验证条件是：光模块等 AI 基础设施的订单增速是否在未来 2-3 个季度出现结构性放缓，抑或因推理需求扩张而维持韧性。

定价策略与生态扩张是新增的关键变量。DeepSeek 于 2026 年 4 月 26 日宣布 全系列 API 输入缓存命中价格降至原有价格的 1/10，V4-Pro 在此基础上叠加限时 2.5 折（原定于 5 月 5 日结束），最终缓存命中价低至 0.025 元/百万 Tokens（V4-Flash 为 0.02 元/百万 Tokens）。2026 年 4 月 29 日，DeepSeek 宣布将 2.5 折优惠延长至 5 月 31 日，这一调整具有双重信号：一是成本结构优势的可持续性超预期——若折扣可维持五周以上而非最初的一周，则其推理效率的叙事可信度显著增强，而非短期营销噱头；二是主动价格战的战略决心，以更长窗口期锁定开发者迁移成本。同日，阶跃星辰开放平台发布 Step Plan 智能路由方案，将轻任务分配至自研 Step 3.5 Flash、复杂推理交由 DeepSeek V4 Pro，无需手动切换且统一支持多模态调用，额度复用现有体系。这是国内头部模型平台首次将 DeepSeek 模型作为默认复杂推理层嵌入自身产品架构，表明 DeepSeek 正从「被接入的第三方选项」向「基础设施层默认组件」演进。此前 OpenClaw 已发布 v2026.4.24 引入 V4 系列并优化 Agent 功能，工具链的密集适配节奏持续。2026 年 5 月 4 日，OpenClaw 发布 v2026.5.2，重写插件架构并优化 V4 系列接入性能，同时新增 xAI Grok 4.3 支持，显示其将 DeepSeek 与闭源模型并列为核心基础设施的持续投入。同日，商汤科技 SenseNova 平台推出 Token Plan 服务，将 DeepSeek-V4-Flash 纳入免费公测档位（每 5 小时 150 次调用），与自有 6.7 Flash-Lite、U1 Fast 模型并列，并通过 Hermes Agent 与 OpenClaw 快速接入。这是继阶跃星辰后第二家国内头部 AI 平台将 DeepSeek 模型嵌入官方服务矩阵，且以「免费公测」形式降低开发者试用门槛，进一步加速生态渗透。但需注意，5 月 31 日后的定价是否恢复原价或仅部分回调，仍是观察其真实成本结构的关键窗口；若再次延长或转为常态折扣，则对闭源厂商定价压力的结构性将大幅上升。

供应链自主化出现新进展。根据官方文档，DeepSeek V4 的细粒度专家并行（EP）方案同时在英伟达 GPU 和华为昇腾 NPU 上完成验证。这意味着其训练/推理框架已具备跨平台部署能力，降低了对单一芯片供应商的依赖。若昇腾 NPU 的量产与集群效率经实际验证，则 NVDA 在中国 AI 市场的「不可替代性」叙事将进一步承压，AMD 及国产芯片的替代空间打开。但当前昇腾的实际性能与 CUDA 生态成熟度差距仍大，跨平台优化是否仅为「可用」而非「高效」，需观察实际部署案例。

地缘政治与供应链约束构成上行风险。美国对华 AI 芯片出口管制持续收紧，4 月 22 日美国众议院外交事务委员会通过《硬件技术控制多边协同法案》等多项出口管制法案。DeepSeek 的训练基础设施依赖 AMD、华为昇腾等替代方案或存量 NVIDIA 芯片。V4 系列的发布及昇腾 NPU 验证表明其至少在当前约束下仍具备迭代能力，但若未来管制扩大至云算力租赁或模型权重分发，其开源生态的可持续性将面临考验。此外，中国宏观政策对平台经济与科技创新的态度（中国宏观）也影响其长期运营环境。

市场当前的事实分歧集中于：一方认为 DeepSeek 代表了 AI 模型的「边际成本趋零」趋势，将压缩所有闭源厂商的定价权和算力产业链的利润率；另一方认为其效率突破恰恰验证了 Scaling Law 的另一种表达——即通过架构创新（MoE、注意力机制优化）而非单纯堆叠晶体管来实现性能跃升，最终仍需先进制程与封装能力支撑，NVDA 的 CUDA 生态与 CoWoS 产能仍是瓶颈。双方的事实依据分别是：DeepSeek 的 API 定价持续低于 OpenAI 同级模型且主动发起限时折扣、缓存命中价降至 0.025 元/百万 Tokens，且折扣期从一周延长至五周以上（成本侧证据），以及其训练集群仍依赖大量 GPU/ASIC、昇腾 NPU 验证尚处早期（供给侧证据）。

可观测的变化条件包括：（1）5 月 31 日后 V4-Pro API 定价是否回调及回调幅度——验证成本优势的真实边界；（2）DeepSeek-V4 的实际采纳率——第三方平台接入数量、API 调用量增速，特别是是否出现更多如阶跃星辰 Step Plan、商汤 Token Plan 级别的深度整合；（3）闭源厂商的定价反应——OpenAI GPT-5.5 系列是否跟进下调 API 价格或缓存定价；（4）算力产业链订单——光模块、HBM、先进封装等环节的 2026 年 Q2-Q3 指引是否下调；（5）昇腾 NPU 实际部署规模——是否有公开的大型集群训练/推理案例；（6）地缘政策变动——美国是否将 DeepSeek 列入实体清单或限制其模型下载；（7）多模态视觉模型进展——灰度测试的识图模式何时全面开放、是否支持 API 调用、定价策略如何，技术报告中的视觉原语思考代码是否转化为可量化的性能优势，以及是否发布独立视觉模型扩展至视频理解领域。

Timeline

2026-04-25

Revision Source [1]

DeepSeek 发布 V4 系列 MoE 模型（1.6T/49B Pro、284B/13B Flash），支持 1M 上下文，Agentic Coding 达顶级表现；Landscape 从「V3/R1 后技术迭代节奏不明」调整为「低成本高效能路线持续验证，开源生态加速扩张」。

为什么重要：消除了市场对 DeepSeek 是否为一次性突破的疑虑，强化其对全球算力需求叙事的结构性冲击，第三方工具链（Hermes Agent、OpenClaw）同日宣布接入显示生态响应速度。

2026-04-25

Confirmation Source [2]

OpenAI 同日发布 GPT-5.5 系列并通过 API 上线，强调编码、Agent 与长上下文能力；闭源路线与 DeepSeek 开源路线的效率竞争白热化。

为什么重要：头部闭源厂商的密集迭代验证了 AI 应用层（Agentic Coding、长上下文 RAG）的需求真实性，DeepSeek 的「低成本替代」价值需在同等能力基准下评估。

2026-04-26

Revision Source [3]

DeepSeek 宣布 V4-Pro API 限时 2.5 折（至 5 月 5 日），OpenClaw 正式发布 v2026.4.24 引入 V4 系列并优化 Agent 功能；Landscape 从「V4 发布后的生态响应待观察」调整为「定价攻势主动加速，工具链接入密度超预期，开源生态进入扩张期」。

为什么重要：限时折扣验证成本结构优势的真实性，第三方工具链的密集适配表明 DeepSeek 正从模型供应商向开源基础设施演进，对闭源厂商定价压力的具体化。

2026-04-27

Revision Source [4]

DeepSeek 全系列 API 输入缓存命中价格降至原有 1/10，V4-Pro 叠加限时 2.5 折后缓存命中价仅 0.025 元/百万 Tokens；官方文档披露 V4 细粒度 EP 方案同时在英伟达 GPU 与华为昇腾 NPU 完成验证。Landscape 从「定价攻势验证成本优势」调整为「缓存定价结构性下探至长上下文规模部署区间，国产替代供应链可行性获得技术验证」。

为什么重要：缓存命中价 1/10 的降幅远超此前 2.5 折预期，重新定义长上下文应用的成本门槛；昇腾 NPU 并行验证表明其框架已具备跨平台能力，若实际部署效率达标，将削弱 NVDA 在中国市场的不可替代性叙事。

2026-04-29

Revision Source [5]

DeepSeek 将 V4-Pro 限时 2.5 折优惠延长至 5 月 31 日；阶跃星辰 Step Plan 智能路由方案接入 DeepSeek V4 Pro 作为复杂推理层。Landscape 从「限时折扣为短期营销试探」调整为「折扣可持续性预期上修，第三方平台整合从表层接入进入架构级依赖」。

为什么重要：折扣期从一周延长至五周以上，显著增强成本优势叙事可信度；阶跃星辰作为国内头部模型平台将 V4 Pro 嵌入默认路由，标志 DeepSeek 从「可选第三方」向「基础设施默认组件」跃迁，生态位提升。

2026-04-30

Revision Source [6]

DeepSeek 灰度测试「识图模式」，作为独立入口支持多模态图像理解，非简单 OCR。Landscape 从「纯文本模型竞争，视觉模型仅传闻阶段」调整为「多模态能力进入实测阶段，竞争维度扩展至视觉理解」。

为什么重要：验证了此前传闻的视觉模型方向，若正式开放并与 V4 推理能力结合，将切入图像/视频理解、视觉 Agent 等增量场景，直接挑战 GPT-4V、Gemini 等多模态闭源模型的定价权；同时增加对算力需求的潜在支撑（多模态推理的算力消耗高于纯文本）。

2026-05-01

Confirmation Source [7]

DeepSeek 发布多模态技术报告，披露视觉原语思考代码。Landscape 中「识图模式为灰度测试功能，技术路线尚不明确」的判断获得强化，调整为「视觉理解能力具备原生架构支撑，非简单外包或拼接方案」。

为什么重要：技术报告的公开表明 DeepSeek 的多模态路线已进入方法论披露阶段，为灰度测试功能提供了底层技术背书，增强了视觉模型持续迭代的可信度；同时意味着其若全面开放视觉 API，将具备与闭源多模态模型正面竞争的技术基础。

2026-05-04

Confirmation Source [8]

商汤 SenseNova 平台推出 Token Plan 服务，将 DeepSeek-V4-Flash 纳入免费公测档位（每 5 小时 150 次调用），与自有模型并列并通过 Hermes Agent、OpenClaw 快速接入；OpenClaw 发布 v2026.5.2 重写插件架构优化 V4 系列接入性能；DeepSeek API 修复第三方框架 400 错误提升兼容性。Landscape 中「第三方平台整合从表层接入进入架构级依赖」的判断获进一步验证，生态渗透密度持续上升。

为什么重要：商汤作为国内头部 AI 平台以「免费公测」形式将 V4-Flash 嵌入官方服务矩阵，是继阶跃星辰后第二家深度整合，表明 DeepSeek 正成为国产 AI 平台的标准推理层选项；OpenClaw 的迭代投入与 API 兼容性修复同步降低接入摩擦，生态网络效应加速。