@Rick老张有话说:清华大学的突破,用4090显卡就能跑满血deepseek大模型,背后是对显卡芯片底层浮点运算能力的调取,这是一个绕过英伟达CUDA释放显卡能力的好办法。

打开凤凰新闻客户端 提升3倍流畅度