中央消息 (中央社记者张欣瑜拉斯维加斯22日专电)AI代理时代来临,看准推论成为未来最大运算需求,Google今天发布第8代AI芯片TPU,有别于上一代芯片,新一代共有2款产品,TPU 8t专攻训练,大幅缩短模型训练时间,而TPU 8i专攻推论,可减少数据访问延迟。 人工智能(AI)从对话时代走入代理时代(Agentic Era),推论(Inference)市场需求不断扩大。AI领导者Google今天在拉斯维加斯云端技术大会(Google Cloud Next),一如市场预期,发布新一代自研芯片TPU(Tensor Processing Unit,张量处理单元)。 新一代TPU共有「2款」,包括专门用于训练的TPU 8t与专门用于推论的TPU 8i。 相较前一代的Ironwood TPU,2款芯片在每瓦性能上最高提升达2倍。 会议正式开始前,Google在开放给媒体的专场活动上展示历代TPU。从2015年推出的第一代芯片,到今年揭晓的2款、在AI代理时代打造的客制化芯片,现场镁光灯闪不停。 Google的AI与基础设施首席首席技术官瓦达特(Amin Vahdat)表示,Google创新速度不断加快,从3年一代、2年一代、到1年一代。他也指出:「Google团队在2年前就意识到,1年1颗芯片是不够的;这是我们第一次尝试推出2颗高性能、专门化的AI芯片」。 用于训练的TPU 8t在大规模训练下,性价比提升达2.8倍;内存配置方面,它采用216GB高带宽内存(HBM),并搭载128MB静态随机访问内存(SRAM)。 单一TPU 8t超级运算集群(Superpod)可扩展至9600颗芯片。 Google同时发布名为Virgo的网络架构,对于使用TPU 8t训练超大型模型至关重要。 推论用的TPU 8i拥有更高的内存带宽,能显著降低推论延迟,它配备288 GB HBM 、搭载384 MB SRAM,突破因数据频繁搬移而导致延迟与高能耗的「内存墙」瓶颈。 值得注意的是,TPU 8i采用名为Boardfly的全新网络拓扑设计,提升芯片间通信效率。 瓦达特指出,Google的2款新芯片今年稍晚将开放给云端客户使用。 Google TPU过往多与博通(Broadcom)合作开发,外传联发科拿下新一代推论芯片大单。Google回应中央社提问表示,不便对外公开讨论供应链合作伙伴的相关细节。(编辑:张芷瑄)1150422 选择与事实站在一起,您的每一份赞助,都是守护新闻自由的力量 下载中央社「一手新闻」APP,即时掌握最新消息 本网站之文本、图片及影音,非经授权,不得转载、公开播送或公开传输及利用。