英伟达|NVIDIA要和Intel、AMD开战，欲扶持ARM对抗X86

NVIDIA能不能收购ARM还是未知之数，不过其已经迫不及待利用ARM做抓手，来打击做x86 CPU的Intel和AMD了。在最新公开资料中， NVIDIA晒出了配备ARM处理器（Ampere Altra）和A100 GPU加速卡的平台和x86处理器平台的性能差异，基于MLPerf最新的1.1基准。

可以看到，在深度学习推荐模型DLRM、自然语言处理网络BERT、会议识别RNN-T、医学图像划分3D U-Net、图像分类的ResNet-50等负载中，与x86表现不相上下，甚至在3D U-Net单项中还实现反超。参与对比的还有高通AI100、Intel至强8380（Ice Lake）等。
加速卡方面，如果以A30为标准，离线环境下， A100在大多数工作负载下的处理速度都是A30的2倍左右；在服务器环境下，基于x86的A100对会议识别RNN-T的处理速度接近A30的3倍。
据了解， MLPerf是当前全球最具影响力的AI计算基准评测组织，由图灵奖得主大卫·帕特森（DavidPatterson）联合谷歌、斯坦福、哈佛大学等单位共同成立，每年组织全球AI训练和AI推理性能测试并发榜。
此外， NVIDIA下一代显卡RTX 40系列的频率将有所提升。
【英伟达|NVIDIA要和Intel、AMD开战，欲扶持ARM对抗X86】AMD RDNA2架构的一大特点就是高能效、高频率， RX 6000系列加速频率没有一个低于2.1GHz ， RX 6700 XT甚至达到了2669MHz 。 NVIDIA Ampere的频率则低得多，加速最高也不到1.8GHz ，但是下一代Ada Lovelace将有所不同。
据最新曝料， Ada Lovelace架构大核心代号AD102 ，频率将不低于2.2GHz 。曝料者没说是基准还是加速频率，但显然应该是后者。 AD102核心预计有18432个流处理器，对比GA102核心增加超过70％，理论上FP32浮点计算性能可达81TFlops ，对比RTX 3090 32TFlops增加足足1.25倍。事实上， RTX 3090相比于RTX 2080 Ti的浮点计算性能就增加了1.5倍，但这只是理论性能，实际游戏性能提升幅度大约在50-60％。这么算下来， AD102核心的游戏性能有望增加40％以上，依然很猛。另外， AD102核心仍然坚持384-bit GDDR6X显存，暂时还没有GDDR7 。