简体中文
关闭
AI新闻中心

谷歌发布第八代TPU:专为“代理时代”AI量身打造

#大模型动态 时间2026-04-24 09:29:56


谷歌近日正式推出第八代张量处理单元(TPU),这是其AI硬件发展的重要里程碑。这两款新芯片——TPU 8tTPU 8i——分别针对模型训练和推理场景进行了深度优化,旨在应对即将到来的代理时代Agentic EraAI应用需求。

什么是代理时代

与传统生成式AI主要处理单一任务不同,代理时代AI系统将由多个专业化智能体组成,能够自主规划、协作执行复杂多步骤工作流。这种转变对底层硬件提出了全新要求:既需要极高的训练效率来快速迭代模型,也需要强大的推理能力来支持同时运行大量轻量级代理。谷歌认为,传统单一架构芯片已难以高效满足这一需求,因此推出了双芯片设计方案。

TPU 8tTPU 8i的技术亮点

TPU 8t专为前沿模型训练设计,可将训练周期从数月缩短至数周。其服务器集群(称为“pod”)包含9600颗芯片,配备2PB共享高带宽内存,单pod可提供121 FP4 EFlops算力,接近上一代Ironwood3倍。芯片还实现了97%有效计算率,大幅减少等待和资源浪费,并支持自动故障处理和实时遥测。

TPU 8i则专注于推理场景,优化了多代理并行运行时的效率。单pod包含1152颗芯片(远超上一代),每颗芯片配备384MB片上SRAM,支持更长上下文窗口的模型。这两款芯片首次采用谷歌自研Axion ARM CPU作为主机,每两颗TPU搭配一颗CPU,整体能效比上一代提升一倍。

能效与系统级优化

谷歌强调,新TPU并非孤立硬件,而是与数据中心基础设施深度协同。通过将网络与计算集成在单芯片上,并优化pod布局,单位电力下的算力输出提升了6倍。同时,第四代液冷系统采用智能阀门,根据负载动态调节水流,进一步降低能耗。

这两款芯片均支持JAXPyTorchvLLM等主流框架,并将首先用于谷歌自家Gemini代理系统,同时向第三方开发者开放。

行业影响与竞争格局

此次发布正值AI代理应用从概念走向落地的关键节点。谷歌希望通过专用硬件,降低训练和推理成本,加速代理生态发展。同时,这也被视为对NVIDIA等竞争对手的直接回应。消息发布后,NVIDIA股价出现小幅波动,但随后迅速回升。

对开发者而言,新TPU意味着更快的模型迭代速度和更低的运行成本,有望推动更多创新代理应用落地。然而,专家指出,AI基础设施的持续扩张仍将面临算力、内存和能源等多重资源挑战。

总体来看,谷歌第八代TPU的推出,标志着AI硬件正从通用加速走向场景专用优化。随着代理时代加速到来,类似针对性硬件设计将成为行业主流。谷歌此举不仅巩固了其在AI基础设施领域的领先地位,也为全球开发者提供了更强大的工具选择。

相关标签:

分享本文
谷歌发布第八代TPU:专为“代理时代”AI量身打造

谷歌发布第八代TPU:专为“代理时代”AI量身打造

谷歌近日正式推出第八代张量处理单元(TPU),这是其AI硬件发展的重要里程碑。这两款新芯片——TPU 8t和TPU 8i——分别针对模型训练和推理场景进行了深度优化,旨在应对即将到来的“代理时代”(A...

评论

0 条
暂无评论,快来抢沙发。

Copyright © 2026 IAICA 版权所有  隐私政策 用户协议 Cookie说明 备案号:沪ICP备11018632号-8

18351659883