# 📄 Google TPUv7: The 900lb Gorilla In the Room
> 来源: SemiAnalysis | Nov 28, 2025 > 解读: ChAI v1.1
一、核心摘要 (TL;DR)
- TPU 正在挑战 Nvidia 的垄断地位 — Gemini 3 和 Claude 4.5 Opus 都主要在 TPU/Trainium 上训练
- Anthropic 与 Google 签署了 100 万 TPU 的大单 — 约 $52B 总价值($10B 硬件购买 + $42B 云租赁)
- OpenAI 还没部署 TPU 就已经省了 30% — 仅仅是竞争威胁就让他们从 Nvidia 拿到了折扣
- Google 开始作为硬件厂商直接卖 TPU 系统 — 不只是云租赁,是真正的 merchant silicon vendor
- Nvidia 开始防守 — 专门发 PR 回应,用股权投资而不是降价来保护客户关系
二、核心论证
TPU 的战绩
作者开篇就强调:世界上最好的两个模型——Claude 4.5 Opus 和 Gemini 3——主要在 TPU 和 Trainium 上训练。
Gemini 3 完全在 TPU 上训练,证明了:
- TPU 可以完成最难的预训练任务
- 相比之下,OpenAI 自 2024 年 5 月 GPT-4o 以来,没有完成过一个成功的大规模预训练
> "The TPU platform has passed that test decisively."
Anthropic 的 100 万 TPU 大单
这是 Google 商业化 TPU 的标志性事件:
交易结构:
- 40 万 TPUv7 Ironwood:直接购买,~$10B
- 60 万 TPU:通过 GCP 云租赁,~$42B RPO
- 基础设施供应商:TeraWulf, Cipher Mining(加密矿企转型)
- 运营方:Fluidstack
为什么 Anthropic 选择 TPU:
- 芯片性能强 + 系统设计优秀 = TCO 优势
- Anthropic 有前 DeepMind TPU 人才
- 多元化供应商,降低对 Nvidia 的依赖
"还没用 TPU 就省了 30%"
这是全文最有力的论点:
> "OpenAI hasn't even deployed TPUs yet and they've already saved ~30% on their entire lab wide NVIDIA fleet."
仅仅是 TPU 竞争的威胁,就让 OpenAI 从 Nvidia 拿到了折扣。TPU 的 perf/TCO 优势强到"还没开机就已经产生价值"。
Nvidia 的防守策略
Nvidia 的应对方式:
- 发 PR 安抚投资者:"我们遥遥领先"
- 用股权投资(而不是降价)来保护大客户
- 避免降价,因为那会伤害毛利率
作者认为"circular economy"(Nvidia 投资 AI 创业公司,创业公司买 Nvidia GPU)的批评有一定道理,但核心是 Nvidia 想保护毛利。
Google 的瓶颈:电力
即使 TPU 供应链顺畅,Google 部署速度也受限于电力。
解决方案:
- 用 Fluidstack(Neocloud)作为中间商
- 与加密矿企(TeraWulf, Cipher Mining)合作——它们有现成的电力协议
- "Hyperscaler backstop"模式:Google 提供信用担保,Neocloud 签数据中心租约
这对 Neocloud 和加密矿企转型是巨大机会。
系统重于芯片
SemiAnalysis 2.5 年前就说过:
> "Systems matter more than microarchitecture."
Google 的 TPU 芯片在纸面上可能不如 Nvidia,但系统级工程让整体 TCO 可以持平甚至更优。
而且,Google 从 TPU v2 (2017) 就开始做跨机架互连(ICI),是 NVLink 之外唯一的竞争者。
三、作者立场(SemiAnalysis,已熟悉)
- 早在市场共识之前就预测了 TPU 大单(有收费产品的利益相关)
- 明确看多 Google/TPU 供应链
- 对 Nvidia "circular economy" 批评有一定认同
- AI 算力格局正在从 Nvidia 垄断走向多元竞争
四、对 Chao 的价值
📡 战略信号
- "竞争本身就是价值"
- 加密矿企转型 AI 基础设施是真实趋势
- Neocloud 模式在演变
🔧 工作流启发
- "Systems matter more than microarchitecture" — 分析硬件公司时,不能只看芯片参数
- SemiAnalysis 的机构产品模式 — 他们提前几个月就预测了这些大单,说明深度供应链跟踪的价值
🧠 认知冲突
关于 Nvidia 的护城河:
- CUDA 生态依然强大
- 但当最好的模型都在 TPU 上训练时,"CUDA moat" 的叙事还能撑多久?
- ❓ Nvidia 的护城河是在加深还是在被侵蚀?
ChAI 🧠 | 2026-02-02 16:05