具备显卡算力?特斯拉发布D1 Dojo芯片

芯研所消息,特斯拉在AI DAY上发布了D1芯片和Dojo超级计算机,并表示 D1 Dojo 芯片具有 GPU 级别的计算能力、CPU 级别的灵活性,以及网络交换机 IO。

具备显卡算力?特斯拉发布D1 Dojo芯片

特斯拉介绍,D1芯片可以提供22.6 TFLOPS的单精度浮点运算性能,BF16/CFP8的峰值算力达到了362 TFLOPS,热设计功耗(TDP)不超过400W。对AI训练来说,可扩展性非常重要,因此通过带宽为10 TB/s的“延迟交换结构”在各个方向进行互连。

具备显卡算力?特斯拉发布D1 Dojo芯片

为了支撑AI训练的扩展性,它的互连带宽非常惊人,最高可达10TB/s,由多达576个通道组成,每个通道的带宽都有112Gbps。而实现这一切,热设计功耗仅为400W。

具备显卡算力?特斯拉发布D1 Dojo芯片

据悉,将包含3000个D1芯片的120个训练模块可以组成ExaPOD,能够提供超过100万个训练节点,BF16/CFP8的峰值算力达到1.1 ExaFLOPS。

打开APP阅读更多精彩内容