Overview

NVIDIA 是一家无晶圆厂半导体公司,设计 GPU 及相关系统软件。过去十年,它从游戏显卡供应商演变为 AI 数据中心的核心基础设施平台,FY2026 全年 Data Center 收入达 1937 亿美元,占总收入逾九成。对投资者而言,NVDA 是当前市场上对 AI 基础设施支出敞口最大、流动性最好的标的,也是 AI 产业链景气度的晴雨表。


Landscape

NVIDIA 的估值逻辑已从"显卡周期"切换到"AI factory 平台"。 投资者不再只关注单季度 GPU 出货量,而是在给一个由硬件、网络、内存和软件栈共同构成的生态系统定价。Blackwell/Rubin 架构的核心不是单卡性能提升,而是整柜交付、NVLink 互联、Spectrum-X 网络和 CUDA 软件栈把客户锁进系统级采购,切换成本随每一代新架构持续上升

这套生态的供应链高度集中。先进制程和 CoWoS 先进封装依赖 台积电 独家提供,HBM 供应由三星、SK Hynix 和美光分担——这两个节点的产能扩张节奏直接决定 NVDA 的交付能力。多头认为供应瓶颈本身构成护城河:即便 Advanced Micro Devices 推出竞争力产品,同样受制于相同的供应链约束,短期内难以抢占大规模份额。Advanced Micro Devices 的机会主要在开放生态和性价比敏感的推理负载,而非训练端的高端系统。

AI 算力需求由训练和推理两端共同驱动。训练端,frontier model 的参数规模仍在扩张,算力消耗以每年数倍速度增长;推理端,随着 AI 应用从实验走向生产部署,推理侧需求开始形成独立增量。多头的核心叙事是:云厂商(微软谷歌亚马逊Meta)加上主权 AI 和企业部署,形成多层需求叠加,足以支撑数年高速增长。

Sharon AI 与 NVIDIA 的 72MW、六年期 AI 基础设施协议为这条需求叙事补充了非 hyperscaler 样本:专业 AI 云 / 企业算力服务商正在以长约方式采购 NVIDIA 系统,但其最终强度仍取决于交付节奏、预付款安排和下游客户 ROI。

2026 年 4 月底云厂商 Q1 业绩进一步强化了这一叙事。谷歌 云订单积压超 $4600亿,环比近翻倍,资本开支同比增长 107% 且指引 2027 年继续显著上升;亚马逊 AWS 订单积压从 $2440亿 跃升至 $3640亿,Bedrock 客户支出环比增 170%微软 下半年资本开支隐含年化 $2360亿,高于此前市场对 2027 财年的预期。TrendForce 最新预测将这一叙事推进到部署层面:北美五大 CSP 2026 年 AI 推理算力将同比增长约 122%,训练算力增长超 56%,且这五大客户将占 NVDA GB/VR 系列服务器全球需求逾六成——订单积压正转化为大规模机柜级部署,推理成为独立高增引擎

产能限制将持续至 2026 年以后。——MSFT Q3 FY2026 管理层

三家公司共同传递的信号是:capex 上行、云收入加速、订单积压增强——AI 基础设施需求获直接验证,产能瓶颈而非需求不足是当前主要约束。TrendForce 数据进一步确认,这种需求不仅是"承诺"而是"正在兑现的部署"。

空头的论点集中在 AI capex 的 ROI 上。云厂商以多季度前置方式采购 GPU,当前高需求部分来自供应短缺时期的恐慌性囤货;如果 AI 应用变现速度慢于 GPU 折旧压力的上升,capex 收紧将直接影响 NVDA 订单能见度。与此同时,谷歌 TPU、亚马逊 Trainium、微软 Maia 等大客户自研 ASIC 正在侵蚀特定推理工作负载,Broadcom 和 Marvell 为超大规模客户提供的定制方案长期来看会压缩 NVDA 的可寻址市场边界。值得注意的是,微软 不含 OpenAI 的订单增长约 7%,但包含 OpenAI 后反而下降约 6%,引发部分需求是否流向 亚马逊 或其他供应商的讨论;Meta 虽上调 capex,但缺乏直接证明 AI 投入回报的指标,市场对其 AI 叙事认可度仍低于其他三家。

新兴替代架构正在推理延迟敏感场景崭露头角。 CoreWeave 的竞争对手 Cerebras 凭借 wafer-scale engine(WSE-3)架构在 "fast tokens" 场景获得突破——其单片晶圆级芯片通过超大片上 SRAM 消除 HBM 带宽瓶颈,在单用户交互性(tokens/sec/user)上显著优于传统 GPU 集群。2026 年 5 月,Cerebras 披露与 OpenAI 签订 750MW 推理算力大单(2028 年前交付),并计划 IPO,标志其从边缘验证进入主流供应链。这一模式的核心假设是:当模型能力越过一定阈值后,开发者愿意为更快响应支付显著溢价(如 Anthropic Opus 4.6 fast 定价为普通模式 6 倍),推理经济学从吞吐量最大化转向交互性最优化。NVDA 的应对包括 2025 年 12 月收购 Groq($20亿+ 对价),以及 Blackwell 架构对低延迟推理的优化,但 GPU 的 HBM 存算分离架构在物理层面仍面临 SRAM 方案的延迟挑战。Cerebras 的规模化约束在于:晶圆级制造的良率控制、封装散热、以及非 LLM 工作负载的通用性局限;若其能在 750MW 级别证明可靠交付,推理市场的竞争格局将从 "NVDA 独占" 转向 "分层分化"。

HBM 供应链格局出现结构性变化信号。 ISSCC 2026 披露的三星 HBM4 技术细节显示,其采用 SF4 逻辑基板 die 搭配 1c DRAM core die 的架构实现 13Gb/s/pin 速率,VDDQ 从 HBM3E 的 1.1V 降至 0.75V已满足 Rubin 平台的电压与带宽要求。这一技术路径使三星在 HBM4 代际首次具备与 SK Hynix 正面竞争的性能基础,可能打破后者在 HBM3E 时代的 dominance。但三星的激进节点选择伴随成本与良率风险:SF4 基板 die 成本高于 SK Hynix 采用的 台积电 N12 方案和美光的内部 CMOS 技术,且其 1c 前端制程良率 2025 年仅约 50%,虽在改善但仍拖累 HBM4 毛利。对 NVDA 而言,三星 HBM4 竞争力提升意味着 HBM 供应从"单源主导"向"双强竞争"演进,长期可降低供应链集中度风险、增强议价能力;但短期需验证三星能否在 Rubin 量产窗口前实现良率与产能的可靠爬坡,否则 NVDA 仍面临 HBM 瓶颈与三星高端 die 成本转嫁的两难。

客户端 AI 计算成为新的平台延伸方向。 2026 年 6 月 Computex 上,NVDA 与 微软 联合宣布基于 RTX Spark/Blackwell 架构的三层 PC 产品家族(笔记本、台式机、工作站),采用与 台积电 3nm 工艺、NVLink-C2C 互联的统一 SoC 设计,最高配置达 128GB 统一内存和 1 petaflop FP4 性能。这是 NVDA 首次将数据中心级 AI 计算架构系统性地推向客户端,试图复制 CUDA 生态在 PC 端的锁定效应。但该产品家族短期内对财务贡献有限:消费级 PC GPU 市场容量远低于数据中心,且 OEM 散热设计差异可能导致性能分化,与 DGX Spark 的统一参考平台体验不同。更值得关注的是 LPX 机架从 1OU 调整为 2OU 的物理变化——NVDA 未解释第二层 housing 的内容,可能暗示 Groq 收购后的低延迟推理硬件整合,或是 Rubin 量产阶段的机柜级设计迭代。

当前多空分歧的核心不在于 AI 需求是否存在,而在于需求曲线的形状——是类似互联网基础设施的长周期平台迁移,还是典型的前置采购周期后将面临消化期。多头短期主导,云厂商 Q1 数据叠加 TrendForce 部署预测强化这一叙事,但 Cerebras 等替代架构的崛起为空头提供了"技术范式转移"的新论据。证伪条件:若未来 2-3 个季度云厂商 capex 指引放缓、订单积压转化不及预期、AI 应用收入未能跟上硬件投入增速,或 fast inference 架构在主流场景验证规模化可行性,周期见顶或竞争侵蚀叙事将快速回归。2027 年资本开支路径、ROI 转化、推理架构竞争格局,以及 HBM 供应双强格局的实际兑现进度,是下一个验证窗口。