谷歌、英特尔纷纷推AI芯片,科技巨头欲挑战英伟达市场统治

谷歌推出基于ARM架构的定制CPU“Axion”,性能比通用ARM芯片高30%。
点击收听本新闻
听新闻

谷歌表示,新处理器将于2024年晚些时候上市。

谷歌表示,新处理器将于2024年晚些时候上市。

人工智能热潮加剧,科技巨头正在寻找人工智能所需的稀缺芯片,摆脱依赖,加速竞争。

谷歌正在制造基于ARM架构的定制CPU“Axion”,支持其数据中心的人工智能工作,让云计算变得更便宜。当地时间4月9日,在拉斯维加斯举行的Cloud Next大会上,谷歌表示,新处理器将于2024年晚些时候上市。

据路透社报道,基于ARM架构的Axion CPU,性能比通用ARM芯片高30%,比英特尔和AMD生产的当前一代x86芯片高出50%。谷歌计划“很快”使用Axion来支持谷歌云上的YouTube广告等服务。

谷歌试图减少对英特尔和英伟达等的依赖,追赶亚马逊和微软等竞争对手。亚马逊网络服务公司2018年推出了ARM芯片Graviton。就在谷歌宣布推出ARM处理器的几个月前,微软公布了为其云基础设施设计的定制芯片。据The Verge报道,微软已经开发了人工智能定制芯片来训练大模型,并为云和人工智能工作负载定制了基于ARM的CPU。

谷歌也在更新其TPU人工智能芯片,周二,谷歌TPU v5p芯片通过谷歌云服务上线。谷歌TPU芯片作为英伟达GPU的替代品用于人工智能加速任务,尽管开发者只能通过谷歌云平台访问它们而不能直接购买。

谷歌云副总裁兼计算和机器学习基础设施总经理马克·洛迈耶(Mark Lohmeyer)表示,TPU v5p是下一代加速器,专门用于训练一些规模最大、要求最高的生成式人工智能模型。单个TPU v5p pod包含8960个芯片,是TPU v4 pod上芯片数量的两倍多。

英特尔也公布了新的人工智能芯片细节,以对抗英伟达的统治地位。当地时间4月9日,在Intel Vision 2024大会上,英特尔推出用于AI训练和推理的Gaudi 3加速器,采用5纳米工艺。Gaudi 3将带来4倍的BF16 AI计算能力提升和1.5倍的内存带宽提升,预计可大幅缩短70亿和130亿参数Llama2模型以及1750亿参数GPT-3模型的训练时间。英特尔表示,Gaudi 3芯片比英伟达上一代H100 GPU训练特定大语言模型的速度快50%。在英特尔测试的一些模型上,它的推理速度比H100芯片更快。

英特尔在Meta开源的Llama模型和阿布扎比支持的Falcon模型上测试了该芯片。英特尔表示,Gaudi 3可以训练或部署大模型,包括文生图模型Stable Diffusion和Open AI旗下用于语音识别的Whisper模型等。该芯片比英伟达芯片的功耗更低。

据路透社报道,Gaudi 3芯片预计今年第二季度向超微电脑(Supermicro)和惠普企业(Hewlett Packard Enterprise)等服务器制造商提供。

过去一年,GPU是人工智能企业的首选高端芯片。英伟达凭借其GPU在人工智能芯片市场上占据约80%的份额。今年3月,英伟达在其GTC大会上推出了H100的继任者,即用于运行人工智能模型的新一代人工智能芯片B200和GB200。

英特尔至强(Xeon)软件副总裁达斯•卡姆豪特(Das Kamhout)表示,确实希望Gaudi 3芯片与英伟达最新芯片相比具有极致的竞争力。“从我们具有竞争力的价格、独特的开放式集成网络、使用行业标准以太网等方面来看,我们相信这是一个强大的产品。”

打开APP阅读更多精彩内容