相信大伙儿都已经关注到了,就在昨天,NVIDIA 解禁了秒天秒地的 RTX 5090,还不清楚的同学可以看下咱们昨天的文章:
彻底改变游戏规则,RTX 5090详细性能正式解禁
综合来说,RTX 5090 在性能提升上只能算是差强人意。
那这次 50 系的升级就没有什么令人称道的地方吗?
也有,那就是这次大肆宣扬的 DLSS4.0 了。与其说是 50 系显卡发布,不如说是 DLSS4.0 发布。
因为除了 90 档,其他的新显卡继任者传统性能提升实在是有限。但 DLSS4.0 的确改写了接下来的显卡发展方向。
与之前的打补丁不同,DLSS4.0 算是彻底推倒重来了,因为 DLRR 光线重建、DLSR 超分辨率、DLAA 抗锯齿以及帧生成之前都依赖于传统 CNN(卷积神经网络)模型,这个模型需要依赖 GPU 当中的光流单元。
CNN 模型是通过分析局部的上下文、追踪连续帧画面当中容易变化的区域,来预测、生成新的画面帧。
而 MFG「多帧生成」再依赖这种模型就显得力不从心了,原因是毕竟依赖特有硬件,所以在算法和模型上很难再有质的突破。
NVIDIA 在这次引入了全新的 Transformer 模型,依赖 Tensor core 算力,用 AI 模型的思路去做到以上的这些。
并且这个模型是所有的 RTX GPU 共享,也就是 20 系也能吃上。
相较于原来的 CNN 模型,在识别上面 Transformer 会更加精准,用例子来形容的话,CNN 模型就类似原来的传统语音助手,只能识别特定的区域画面,在超出模型范围上面就容易翻车了。
而 Transformer 模型参数量是 CNN 的 2 倍,就类似今天的 AI 助手,可以通过自注意力操作(Self-Attention),来评估整个画面、多个帧画面中每个像素的相对重要程度。所以在质量纹理效果以及边缘过渡平滑上面强了不少。
最后是 Transformer 模型以及提升的第 5 代 Tensor core 带来的MFG(多帧生成),在 50 系显卡上面独占。
帧生成画面速度提升 40%,硬件显存占用也少了 30%,并且一次就可以为原始渲染帧多生成 3 帧。
不仅如此,DLSS4.0 可以仅凭画面的 1/16 从而补全画面。依靠原来的超分率技术的结合,可以把帧率最高提升 8 倍。
但玩游戏的同学都知道,插帧到底不是原始帧,所以在游戏交互的时候就会出现不可避免的操作延迟感,所以 NVIDIA 也带来了全新的 Reflex 2。
直接说区别,在传统的 Reflex 和 DLSS3.0 中,依赖 CPU Pacing 技术控制帧画面显示,而由于 CPU和 GPU 的信号交互延迟,会随着帧数增加导致两帧之间节奏不一致,给人的直观感受就是卡顿。
在 DLSS4.0 中,这个活儿就交给显卡来干了,引入 Flip Metering 的 DSC 新硬件来专门干这件事,CPU 只需要下发一帧渲染帧给显卡,然后就不会再和 GPU 同步,显卡插帧完成以后可以直接输出到显示器,这样带来的感受就是没那么卡顿了。
而至于操作延迟部分,在传统 Reflex 压缩渲染队列基础之上,Reflex 2 在最终帧形成的时间差上,用键盘鼠标输入端传进的信号来用AI模型进行改写还没渲染完的最终帧,用这种方式来进一步降低延迟。
看到这儿可能有同学举手了,说的这么好,那我们老显卡用不上有啥用啊?
倒也不一定。
在最近对 NVIDIA 应用深度学习研究副总裁 Bryan Catanzaro 的采访中;
他表示因为新的 DLSS4.0 采用了新的 Transformer 模型,衍生出了多帧生成,未来可以看看能不能够在旧的 GPU 中挤一挤相关的技术。但这需要强大的数据以及庞大的工作量来支撑。
中译中的意思是,更换了模型原因,新技术理论上是可以下放的,但需要大量适配工作,并且效果因为 Tensor core 算力差别和最近的硬件区别,所以效果还可能不尽如人意。
所以这事儿有没有后续,就看老黄良心有多少了。