# 📄 Google TPUv7: The 900lb Gorilla In the Room

> 来源: SemiAnalysis | Nov 28, 2025 > 解读: ChAI v1.1


一、核心摘要 (TL;DR)

  • TPU 正在挑战 Nvidia 的垄断地位 — Gemini 3 和 Claude 4.5 Opus 都主要在 TPU/Trainium 上训练
  • Anthropic 与 Google 签署了 100 万 TPU 的大单 — 约 $52B 总价值($10B 硬件购买 + $42B 云租赁)
  • OpenAI 还没部署 TPU 就已经省了 30% — 仅仅是竞争威胁就让他们从 Nvidia 拿到了折扣
  • Google 开始作为硬件厂商直接卖 TPU 系统 — 不只是云租赁,是真正的 merchant silicon vendor
  • Nvidia 开始防守 — 专门发 PR 回应,用股权投资而不是降价来保护客户关系


二、核心论证

TPU 的战绩

作者开篇就强调:世界上最好的两个模型——Claude 4.5 Opus 和 Gemini 3——主要在 TPU 和 Trainium 上训练。

Gemini 3 完全在 TPU 上训练,证明了:

  • TPU 可以完成最难的预训练任务
  • 相比之下,OpenAI 自 2024 年 5 月 GPT-4o 以来,没有完成过一个成功的大规模预训练

> "The TPU platform has passed that test decisively."

Anthropic 的 100 万 TPU 大单

这是 Google 商业化 TPU 的标志性事件:

交易结构:

  • 40 万 TPUv7 Ironwood:直接购买,~$10B
  • 60 万 TPU:通过 GCP 云租赁,~$42B RPO
  • 基础设施供应商:TeraWulf, Cipher Mining(加密矿企转型)
  • 运营方:Fluidstack

为什么 Anthropic 选择 TPU:

  • 芯片性能强 + 系统设计优秀 = TCO 优势
  • Anthropic 有前 DeepMind TPU 人才
  • 多元化供应商,降低对 Nvidia 的依赖

"还没用 TPU 就省了 30%"

这是全文最有力的论点:

> "OpenAI hasn't even deployed TPUs yet and they've already saved ~30% on their entire lab wide NVIDIA fleet."

仅仅是 TPU 竞争的威胁,就让 OpenAI 从 Nvidia 拿到了折扣。TPU 的 perf/TCO 优势强到"还没开机就已经产生价值"。

Nvidia 的防守策略

Nvidia 的应对方式:

  • 发 PR 安抚投资者:"我们遥遥领先"
  • 用股权投资(而不是降价)来保护大客户
  • 避免降价,因为那会伤害毛利率

作者认为"circular economy"(Nvidia 投资 AI 创业公司,创业公司买 Nvidia GPU)的批评有一定道理,但核心是 Nvidia 想保护毛利。

Google 的瓶颈:电力

即使 TPU 供应链顺畅,Google 部署速度也受限于电力。

解决方案:

  • 用 Fluidstack(Neocloud)作为中间商
  • 与加密矿企(TeraWulf, Cipher Mining)合作——它们有现成的电力协议
  • "Hyperscaler backstop"模式:Google 提供信用担保,Neocloud 签数据中心租约

这对 Neocloud 和加密矿企转型是巨大机会。

系统重于芯片

SemiAnalysis 2.5 年前就说过:

> "Systems matter more than microarchitecture."

Google 的 TPU 芯片在纸面上可能不如 Nvidia,但系统级工程让整体 TCO 可以持平甚至更优。

而且,Google 从 TPU v2 (2017) 就开始做跨机架互连(ICI),是 NVLink 之外唯一的竞争者。


三、作者立场(SemiAnalysis,已熟悉)

  • 早在市场共识之前就预测了 TPU 大单(有收费产品的利益相关)
  • 明确看多 Google/TPU 供应链
  • 对 Nvidia "circular economy" 批评有一定认同

  • 四、对 Chao 的价值

    📡 战略信号

  • AI 算力格局正在从 Nvidia 垄断走向多元竞争
- TPU 证明了自己 - Trainium 也在崛起 - 🎯 关注点:这对 Nvidia 估值和供应链有什么影响?

  • "竞争本身就是价值"
- OpenAI 省 30% 的故事说明:即使不切换,有替代选项也有谈判筹码 - 🎯 关注点:其他大模型公司会如何利用这个?

  • 加密矿企转型 AI 基础设施是真实趋势
- TeraWulf, Cipher Mining 已经签约 - 电力是核心资产 - 🎯 关注点:还有哪些矿企有转型潜力?

  • Neocloud 模式在演变
- "Hyperscaler backstop" 解决了融资期限错配问题 - Jensen 投资的 Neocloud(CoreWeave 等)可能被 TPU 机会排斥 - 🎯 关注点:Neocloud 行业会如何分化?

🔧 工作流启发

  • "Systems matter more than microarchitecture" — 分析硬件公司时,不能只看芯片参数
  • SemiAnalysis 的机构产品模式 — 他们提前几个月就预测了这些大单,说明深度供应链跟踪的价值

🧠 认知冲突

关于 Nvidia 的护城河

  • CUDA 生态依然强大
  • 但当最好的模型都在 TPU 上训练时,"CUDA moat" 的叙事还能撑多久?
  • ❓ Nvidia 的护城河是在加深还是在被侵蚀?


ChAI 🧠 | 2026-02-02 16:05