英伟达宣布升级DGX Station/SuperPod,并展示BlueField-3/4 DPU

在GTC 2021技术大会上,英伟达宣布将升级DGX Station和DGX SuperPod,前者相当于一台微型超算,后者面向密集型AI研发。

全新的DGX Station A100 320配置了四块80GB HBM2e显存的A100 GPU,每块带宽为2TB/s。这样的产品也不是为了打游戏,主要面向AI研究和内容创建,使用水冷散热的方式为EPYC CPU和A100 GPU散热,运行的时候噪音也只有37分贝,可以提供2.5 petaFLOPS的浮点性能。

DGX SuperPod和DGX Station一样,升级了GPU,同样使用了A100 GPU,实际上DGX SuperPod就是配备了至少20套DGX Station A100系统和NVIDIA InfiniBand解决方案的AI超算,同时配置了BlueField-2 DPU。只不过BlueField-2 DPU是可以卸载的,其作用是减轻数据中心CPU的网络,存储,安全性和虚拟化负载。

英伟达已经宣布会推出两款新的DPU,分别是BlueField-3和BlueField-4,前者会在2022年上市,后者则是2024年。BlueField-3完全向下兼容BlueField-2,意味着未来使用BlueField-2的系统可以进行替换,其拥有220亿个晶体管,采用16个Cortex-A78核心,以400Gbps的速率,对网络流量进行保护、卸载和加速,将配备Mellanox的400Gbps以太网或Infiniband网卡连接。BlueField-4的速率将提高到800Gbps,算力达1000TOPS,拥有640亿个晶体管。

从技术角度来说,DPU与英伟达本身的产品线关系不大,是由Mellanox的工程师研发。在英伟达看来,DPU在未来将和CPU、GPU一样有前途。英伟达在HPC和数据中心领域投入了大量的精力,随着这些系统逐渐变得负责,对数据处理的要求更加精细,DPU能更好地释放CPU和GPU的性能。

或许不是每位用户都需要A100 GPU那么强悍的性能,英伟达还推出了两款同样是Ampere架构的Tensor Core GPU,分别是A30和A10。前者采用的是GA100核心,配置了24GB HBM2显存,采用双槽设计,TDP为165W,后者采用GA102核心,配置了24GB GDDR6显存,采用单槽设计,TDP为150W。

打开APP阅读更多精彩内容