几天前,AMD宣布推出基于CDNA 2架构的Instinct MI200系列计算卡,这是第一款采用MCM多芯片封装的GPU,是首款百亿亿级的GPU加速器。更出人意料的是,AMD现在还公布了与竞争对手英伟达A100计算卡之间的对比测试数据。虽然硬件公司在一些活动上展示性能优势的PPT并不少见,但官网上公开详实的实际对比测试数据却不多,这说明了AMD对自己的这款产品在性能方面非常有信心。
AMD Instinct MI200系列计算卡搭载了代号Aldebaran的GPU,拥有580亿个晶体管,采用台积电6nm工艺制造,搭配了128GB的HBM2e显存(总带宽3.2 TB/s),TDP为560W。该系列有Instinct MI250和Instinct MI250X两款产品,分别有208个CU(13312个流处理器)和220个CU(14080个流处理器)。
其GPU中的小芯片辅以XGMI内部互联设计,均具有VCN 2.6控制器,还使用了2.5D Elevated Fanout Bridge(EFB)封装技术。此外,GPU里的两个小芯片通过AMD Infinity Fabric技术连接,提供高达100 GB/s的双向带宽。这属于第三代nfinity Fabric技术,可管理多达8条Infinity Fabric链路,将Instinct MI200系列计算卡和第三代EPYC处理器相连,实现CPU和GPU内存一致性,最大限度提高系统吞吐量。对比上一代基于CDNA架构的Instinct MI100,基于CDNA 2架构的Instinct MI200系列计算卡在性能上提升幅度非常大。
显然,AMD Instinct MI200系列计算卡是主要针对HPC和AI工作负载设计的。AMD官方公布的对比测试里,涉及了处理代数、物理学、宇宙学、分子动力学和粒子相互作用等项目,许多是被广泛使用并具有行业认可的测试,例如LAMMPS和OpenMM。
不过值得留意的是,AMD缺乏关于AI基准测试的项目。在纸面上,AMD Instinct MI200系列计算卡在传统的HPC和矩阵工作负载中会有更高的性能,而英伟达应该在AI方面仍然会有些优势。
从这些基准测试结果来看,AMD Instinct MI250X对比NVIDIA A100占据了绝对的性能优势,是对方的1.4倍到3.05倍之间,可以说Instinct MI250X是目前世界上性能最强的HPC计算卡。考虑到AMD Instinct MI250X比NVIDIA A100晚了一年半左右才推出,加上采用了新的架构和使用了更多的ALU,有这样的测试结果也是很自然的事情。
再过几个月,英特尔将推出Ponte Vecchio,这款英特尔技术集大成者应该会有相当强悍的性能,不知道届时实际情况会如何。