文件列表:
海通国际:电子:谷歌Ironwood构建AI推理工厂,与Blackwell形成差异化竞争.pdf |
下载文档 |
资源简介
>
事件:
2025年4月9日,谷歌在CloudNext大会上正式发布其第七代张量处理单元(TPUv7),代号"Ironwood"。与前代Trillium相比,TPUv7在性能与能效方面提升达两倍,并针对大模型推理任务进行深度优化。
点评:
Ironwood集群跻身全球最快推理平台,专为LLM与MoE优化。Ironwood最多可支持9,216颗TPU芯片组成集群,峰值算力达42.5ExaFLOPS,为当前已知全球最快的AI推理平台之一。TPUv7延续并加强了SparseCore、HBM高带宽内存及芯片间光互联(ICI)设计,专为运行大型语言模型(LLM)与专家混合模型(MoE)优化。
Google通过Ironwood强化AI芯片布局,借推理优势提升云服务吸引力。谷歌推出AI芯片Ironwood,持续加码与NVIDIA等竞争对手的芯片竞赛。但不同于英伟达的对外销售策略,Ironwood仅用于Google内部或通过其云服务对客户开放,未向市场直接销售。我们观察到,无论是大模型训练还是AI加速卡,当前的发展趋势正逐步向推理侧倾斜,Llama4的发布便是典型案例,其核心优化集中在推理性能上。
我们
加载中...
已阅读到文档的结尾了