在有限的运算资源下追求流畅的画面和画质,是增强游戏体验的简洁明了的手段。但如果仅依靠提升硬件性能显然并不划算,从GeForce RTX系列GPU开始,深度学习超采样DLSS开始逐渐变成3A游戏,乃至许多追求画质效果独立游戏的标配,在配置不变,相近画质下,获得近乎翻倍的帧率提升。
如同DLSS中的“Deep Learning”词汇一样,技术是会不断进步的。就在今晚,NVIDIA正式解禁了NVIDIA DLSS 2.3版本,解决了更多画面细节处理的问题。只需要将驱动更新至496.70版本以后。
有意思的是,驱动中还更新了一个图像缩放技术NVIDIA Image Scaling,以下简称NIS。在算法上,NIS更近似于AMD FSR,属于图像缩放算法的范畴,因此适配性也更强,支持的范围扩展到了Maxwell架构GPU,也就是GeForce GTX 900系。
是的,在一次驱动更新中,NVIDIA不仅带来了DLSS 2.3,还更新了图像缩放技术NVIDIA Image Scaling。在仅仅更新驱动的前提下,DLSS 2.3和NIS会带来什么样的效果?现在就让我们来尝试一番。
DLSS 2.3:进阶的深度学习超采样
毋庸置疑的是,DLSS 2.3更新花费了NVIDIA更多的资源和精力,也是此次驱动更新的重点。按照官方描述,更新内容包括:
-接近现实且更清晰的高分辨率细节
-一直在提升的人工智能模型
-更准确的原画面还原
-高质量线条
-画面上更清晰的屏幕文本内容
-减少运动伪影
-对比原画面也不输的稳定闪烁
-避免锐化后瑕疵
-有效利用像素,用更少的像素做更多的事情
没有错,在一次小版本更新中,NVIDIA为DLSS 2.3加入了足够丰富的内容。而NVIDIA也强调了DLSS与传统图像缩放算法的区别。比如AMD FSR中出现的质量、平衡、性能等缩放术语直接与图像质量挂钩,但DLSS在这三档设置上表现出的质量近乎相同,而是采样数量和获取信息量不同的差别。
因此在本质上,DLSS与普通的图像缩放算法也有着有明显的差别。DLSS使用了一种空间与时间结合的办法,它对一个物体的的了解来自于多个帧的对比。这有点像相机的胶卷曝光,当捕捉的时间越长,获取的细节就越多,对应的,需要的Tensor Core算力也会增多。
针对每一帧不同的物体,DLSS会收集到不同的信息将其完善,通过多帧积累已完成对物体运动矢量的跟踪。其中AI算法将会决定从关键帧中提取什么样的信息,智能的结合在一起,已获得完整且准确的渲染图像。
举个例子。在1440p分辨率的质量模式中,DLSS会采集超过600万的像素并最终输出350万像素。在这个过程中,AI Network(人工智能网络)会通过不断学习,寻找更好的方式生成最终图像,并追求与原图相当。在卷积自动编码器的作用下,DLSS的人工智能网络能够做到16K分辨率的图像收集,并最终决定如何从低分辨率输入转向高分辨率超采样输出的过程。
相比之下,图像缩放算法中的空间放大则是使用固定的算法,生硬的将原本220万像素输入,输出成350万像素。简单的说就是通过空间标识仅对单个点附近的低分辨率像素进行采样,让后放大、锐化。但锐化的部分无法在高分辨率下还原低分辨率的部分细节,只能在细节上降低部分细节的对比度。事实上,传统图像缩放算法就是通过降低渲染分辨率,牺牲了图像的质量来换取性能提升。
DLSS另一个优势则是运动感知。它可以通过系统的前帧反馈和移动对象的运动矢量,以动态的减少缩放比例。而固定的图像缩放算法的空间标识缺乏时间反馈,在放大锐化之后,会导致画面出现诸多不稳定因素。在DLSS 2.3中,NVIDIA能够进一步的让DLSS智能的使用运动矢量来减少重影和提高图像质量。例如《Control》中女主的马尾,在早期的DLSS中会呈现奇妙的离散状态,DLSS 2.3则已经得到了解决。
快速移动且无法预判的尘粒也是曾经难以处理的难点,同样在DLSS 2.3中得以优化。
另外早期版本的DLSS在处理《Control》中处于暗处的风扇叶片旋转时会留下大量的细微颗粒,以及部分运动对象会被忽略。而在新版DLSS 中,不仅消除了了风扇噪点,风扇叶片也更为清晰可见。
NIS:全局游戏通用的万金油
496.70版本新驱动中的另一个更新,就是万金油NVIDIA Image Scaling(NIS)了。这是一套基于通用的传统图像缩放算法,或者说空间缩放算法升级而来,并放在了NVIDIA控制面板,或者GeForce Experience的设置面板中。
事实上这套技术在2019年就已经被放入NVIDIA控制面板,当下的图像算法技术也非常普遍,包括AMD FSR、英特尔XeSS技术等等。可以这么理解,NVIDIA Image Scaling(NIS)相当于2019年图像缩放技术的基础上,根据近几年在游戏中的经验,升级后的新算法。新增内容包括4个方向的缩放和自适应锐化,与之前的空间算法相比也有十足的进步,并且支持Maxwell架构以后,也就是GeForce GTX 900系列以后的所有GPU。
值得注意的是,NVIDIA Image Scaling(NIS)是不需要游戏本身支持的,它是一套通用的计算方式,只需要使用GeForce GTX 900系列以后的GPU,不管什么游戏,甚至是诸如Maya、D5渲染器之类的专用软件,NVIDIA Image Scaling(NIS)同样适用。
NVIDIA Image Scaling(NIS)最大的好处是直接放到了驱动中,任何显示都可以经过NIS处理。同时NIS本身也获得了MIT的开源授权,以及对跨平台GPU的支持。同时,NIS SDK也被作为开源允许游戏制作组加入游戏中,因此自带NIS SDK理论上也应该可以支持近期的AMD和Intel独立显卡。
仍然需要再次强调,NVIDIA DLSS与NVIDIA Image Scaling(NIS)等图像缩放算法之间存在深刻的差异。这是在于DLSS是对画面中物体的理解,运算方式更为复杂。而图像缩放算法则不需要知道画面中表达了什么内容,只需要联系之前画面,从而进行机械性的补偿。
即便如此,NVIDIA Image Scaling(NIS)仍然有很多可圈可点之处。由于多年在游戏领域耕耘,NVIDIA积累了大量游戏画面优化的经验,在同等渲染分辨率下,即便是NIS也已经有了能够战胜AMD FSR的实力。所以NIS的推出更像是NVIDIA在传统图像缩放算法向AMD秀肌肉的举动。
实际效果亦是如此。在4K分辨率下,分别使用AMD FSR和NIS优化77%渲染分辨率的画面,无论是在《众神陨落》还是在《生化危机8》中,都能够看出NIS能够给出更清晰的纹理细节。
而如本章节开头所说,现在启动NIS的方法非常简单,在完成更新之后,在GeForce Experience的设置面板-常规下找到图像缩放,选择对应的渲染分辨率和锐化程度即可。
如果没有安装GeForce Experience,也可以通过NVIDIA控制面板-管理3D设置-全局设置中找到第一项图像缩放功能,开启以后即可。
如果勾选覆盖显示器,一旦NIS能够顺利开启,屏幕左上角会显示NIS的标识,这时候将游戏中的渲染分辨率降低,当NIS为绿色,则代表NIS已经顺利启动;NIS为蓝色,则代表NIS只启动了锐化,没有启动缩放功能。
实践出真章
光看NVIDIA宣传效果显然是不够的,既然DLSS 2.3进行了大量升级,NVIDIA Image Scaling(NIS)针对传统图像缩放算法进行了优化,这里不妨让我们找来一些支持AMD FSR和DLSS的游戏,做一些横向对比。
测试的平台包括:
CPU:Core i9-12900K
GPU:GeForce RTX 3090
MB:ROG MAXIMUS Z690 Extreme
RAM:Crucial DDR5-4800 32GB x2
SSD:Plextor M10PGN 2TB
这里我们主要讨论不同算法下画面呈现的效果为主,输出画面最终会呈现到4K分辨率的屏幕上,因此也以最终输出为4K分辨率为目标。
由于采用GeForce Experience本身在软件层面进行底层录制会损失实际的展现效果,这里我们引用了英特尔NUC 11 Compute Element作为视频采集盒。NUC 11 Compute Element本身内置了一块圆刚OC513EC采集卡进行录制,配置为Core i7-1185G7,16GB RAM和1TB SSD,用于支持录制内容。
在视频的逐帧对比上,使用了NVIDIA Image Comparison & Analysis Tool(NVIDIA ICAT)进行逐帧对比,同来更细致的挖掘DLSS 2.3、NIS以及FSR之间的区别。这里我们进行逐一比较。
《死亡循环(DEATHLOOP)》是目前同时支持DLSS 2.3和FSR的游戏之一,这里我们分别在图形设置中使用AMD FSR最高画质模式、NVIDIA DLSS性能模式,以及使用默认选项,在GeForce Experience中开启77% NIS。三个场景均使用2K渲染分辨率,并最终输出4K屏幕。
能噶偶看到在开头一幕场景中,AMD FSR远处灯塔并不能清晰看全,NIS则比FSR清楚,但能明显看得出有些锐化过头,位于中间的NVIDIA DLSS过度最为自然。
在部分场景中,事实上我们还遇到了FSR算法存在问题,存在灯泡闪烁和莫名光斑的情况,而NVIDIA DLSS没有遇到类似的问题。
可以看到,DLSS 2.3无论在何种情况下细节掌控力都明显优于FSR和NIS,而来自NVIDIA的NIS依靠着更优秀的算法优化,在FSR的地盘上同样也提供了优与FSR的画质。如果分辨率相当,我们建议按照如下顺序进行选择,以确保最优画质。
DLSS > NIS > FSR
同时也不要忘了DLSS本身是拥有Tensor Core硬件加持的,在实际游戏帧率上也比后两者略胜一筹。
写在最后:N卡算法胜利
一番对比下来你会发现,硬件加持永远能带来更好的效果。NVIDIA DLSS就是很好的例子,利用Tensor Core的人工智能网络加速,在降低GPU运算压力的同时还能获得同等、甚至更好的画质。特别是在DLSS 2.3版本中,拖影产生的位移、火焰的运动矢量造成的AI补充不稳定,均在DLSS 2.3中得到解决,曾经“开启DLSS会降低画质”的吐槽变成了过去时。
不仅如此,在新驱动中我们也见证了NVIDIA Image Scaling(NIS)利用传统图像缩放算法优化的可能性,只需要GeForce GTX 900系列以后的显卡,你就能获得接近同等画质下获得更高的帧率,并且是免费的。
显然NVIDIA的496.70驱动已经给我们带来了不小的惊喜,在驱动升级之后,兴许曾经许多我们对游戏帧率不满意的游戏现在变得更为流畅。同样我们也看到一场基于传统图像缩放算法的比较已经悄然展开,AMD FSR、Intel XeSS、NVIDIA Image Scaling剑拔弩张。
只不过,从画质和流畅的角度来看,最终的赢家仍然是NVIDIA DLSS。