GeForce RTX 3050天梯榜首发评测：入门级显卡也能流畅光追( 二 )

文章图片
大家都知道在Turing架构中， NVIDIA整数型（INT32）和单精度浮点型（FP32）两种不同的数据类型交给两种不同的ALU进行计算。不过现代游戏应用中最为常见的还是FP32 ，因此为了提高计算效率NVIDIA在NVIDIAAmpere架构上引入了可同时支持INT32或FP32两种数据类型的新ALU 。也就是说，现在有两条不同的数据路径，一条能够同时处理整数或者单精度浮点，另一条则单纯处理处理单精度浮点计算。

文章图片
负责进行实时光线追踪运算的专用硬件单元RTCore在NVIDIAAmpere架构上也更新到了第二代，最主要是增加了动态模糊的加速运算支持。 NVIDIA在其中新加入的插值算法可以在保证动态模糊精确性的同时提高了实时光线追踪效率，官方表示最高可达8倍于上代的速度。另外在基础的BVH计算上，第二代RTCore也可以比第一代快2倍。

文章图片
TensorCore这个负责运行AI计算的硬件单元在NVIDIAAmpere架构上也升级到了第三代。其实之前发布的A100计算卡上已经用上了新的第三代TensorCore ，它能够提供比第二代TensorCore高出4倍的效能，不过游戏卡上面的TensorCore进行了一定的精简，其FP16FMA计算的吞吐量只有GA100核心中的TensorCore的一半。

文章图片
而第三代TensorCore带来的更强劲AI运算有些什么用呢?答案就是DLSS 。 DLSS的全称是DeepLearningSuperSampling ，翻译成中文就是深度学习超级采样，它的作用是通过降低游戏内的渲染分辨率，同时以拉伸来提高显示分辨率，例如1080P的渲染分辨率以及4K（2160P）的显示分辨率，来达成提升帧数的目的。

文章图片
此外，将不同类型的计算交给不同的单元去处理是从NVIDIAVolta架构就开始采纳的一种理念，当时引入的TensorCore分流了很多AI相关的运算，而在其后引入的RTCore又将实时光线追踪相关的计算给分流了。但在Turing架构GPU上做不到全部运算都能够并行执行，到了Ampere架构上， NVIDIA提升了GPU内部各种单元之间的并行性，现在传统计算单元、RTCore和TensorCore这三大单元可以同时工作，在原本基础上继续缩短帧渲染时间。

文章图片
再之后就是HDMI2.1这个备受期待的新输出端口了。在HDMI2.1之下，显卡可以用单线材做到8K60Hz或者4K120Hz的输出。对于想用大尺寸电视打游戏的玩家来说是一个不错的福音。
NVIDIAReflex
伴随RTX30系显卡一同发布的，有一个对于电竞游戏，或者更仔细地说对于电竞选手来说很重要的新东西，那就是NVIDIAReflex 。那么这个NVIDIAReflex到底是什么东西呢？其实它是分为两部分的，一部分是硬件，一部分是软件。

文章图片
硬件部分是ReflexLatencyAnalyzer ，它其实可以视作为LDAT的一个进阶版本，是直接预安装在显示器里的，可以用来测量玩家从点击鼠标直到画面出现变化之间的时间差，也就是整套系统的所有延迟。

文章图片
而软件部分则是NVIDIAReflexSDK 。这个NVIDIAReflexSDK的作用是降低以及测量渲染延迟的，开发者可以直接整合到游戏内。而在开启其低延迟模式后，可以让CPU与显卡同步，大幅度减少渲染序列，从而降低渲染延迟。