随着谷歌第七代张量处理单元(TPU)“铁木”(Ironwood)的推出及其商业化策略的转变,人工智能(AI)计算市场正迎来一场深刻的变革。谷歌正逐步从主要面向内部用户转向积极向第三方客户提供其定制化AI芯片,直接挑战英伟达(NVIDIA)在该领域的长期主导地位。这一战略调整已对AI计算服务的价格形成压力,促使市场竞争日益激烈。
代号为“铁木”的TPUv7于2025年4月在谷歌云Next大会上首次亮相,预计将于2025年第四季度全面上市。该芯片专为大规模AI训练和推理工作负载设计,在理论计算能力和内存带宽方面已大幅拉近与英伟达Blackwell系列旗舰图形处理器(GPU)的差距。 行业分析机构SemiAnalysis的研究表明,从总拥有成本(TCO)角度衡量,谷歌TPUv7相较于英伟达GB200系统具有显著优势。据内部评估,谷歌自用TPUv7的TCO比英伟达GB200服务器低约44%;即便是外部客户通过谷歌云平台租赁,其成本也可比直接采购英伟达GB200系统低30%至50%。
此番策略转变的标志性事件之一是,AI研发公司Anthropic与谷歌签署了一项价值数百亿美元的协议,计划在2026年前部署多达100万颗谷歌TPU,以获得超过1吉瓦(GW)的计算能力。 这项合作涵盖了Anthropic直接购买部分TPU硬件(其中约40万颗TPUv7“铁木”芯片预计由博通直接提供,价值约100亿美元)以及通过谷歌云平台租赁剩余部分。 Anthropic首席财务官Krishna Rao指出,此次扩展将为其下一代Claude模型的研发、测试和部署提供必要的计算资源,同时强调公司采纳多元化计算策略,整合了谷歌TPU、亚马逊Trainium和英伟达GPU。
市场影响已显现。SemiAnalysis的报告揭示,OpenAI曾通过暗示可能转向使用TPU或其他替代方案,成功地与英伟达谈判,为其英伟达硬件集群争取到了大约30%的成本折扣。 这一事例凸显了谷歌TPU在推动AI算力市场形成竞争态势中的作用。
为进一步推广TPU,谷歌正着力优化其软件生态系统。公司致力于为流行的PyTorch框架提供原生支持,并与vLLM等推理库进行集成,旨在降低开发者从现有GPU平台迁移至TPU的门槛,从而消除软件兼容性方面的顾虑。
面对谷歌的挑战,英伟达亦积极筹备反击。其下一代“Vera Rubin”超级芯片预计将于2026年下半年开始出货,随后更强大的“Vera Rubin Ultra”版本计划于2027年下半年推出。这些新芯片将集成CPU和GPU,并采用HBM4高带宽显存。 与此同时,谷歌自身的TPUv8项目面临延期,但据报道正寻求与博通和联发科等合作伙伴共同开发新版本,以期在激烈的AI芯片竞争中保持领先地位。
此次谷歌TPU的商业化举措,预示着AI计算领域将不再由单一巨头独占鳌头,而是走向一个多方竞争、技术革新加速的时代。