英伟达|NVIDIA要和Intel、AMD开战,欲扶持ARM对抗X86

NVIDIA能不能收购ARM还是未知之数 , 不过其已经迫不及待利用ARM做抓手 , 来打击做x86 CPU的Intel和AMD了 。 在最新公开资料中 , NVIDIA晒出了配备ARM处理器(Ampere Altra)和A100 GPU加速卡的平台和x86处理器平台的性能差异 , 基于MLPerf最新的1.1基准 。
可以看到 , 在深度学习推荐模型DLRM、自然语言处理网络BERT、会议识别RNN-T、医学图像划分3D U-Net、图像分类的ResNet-50等负载中 , 与x86表现不相上下 , 甚至在3D U-Net单项中还实现反超 。 参与对比的还有高通AI100、Intel至强8380(Ice Lake)等 。
加速卡方面 , 如果以A30为标准 , 离线环境下 , A100在大多数工作负载下的处理速度都是A30的2倍左右;在服务器环境下 , 基于x86的A100对会议识别RNN-T的处理速度接近A30的3倍 。
据了解 , MLPerf是当前全球最具影响力的AI计算基准评测组织 , 由图灵奖得主大卫·帕特森(DavidPatterson)联合谷歌、斯坦福、哈佛大学等单位共同成立 , 每年组织全球AI训练和AI推理性能测试并发榜 。
此外 , NVIDIA下一代显卡RTX 40系列的频率将有所提升 。
【英伟达|NVIDIA要和Intel、AMD开战,欲扶持ARM对抗X86】AMD RDNA2架构的一大特点就是高能效、高频率 , RX 6000系列加速频率没有一个低于2.1GHz , RX 6700 XT甚至达到了2669MHz 。 NVIDIA Ampere的频率则低得多 , 加速最高也不到1.8GHz , 但是下一代Ada Lovelace将有所不同 。
据最新曝料 , Ada Lovelace架构大核心代号AD102 , 频率将不低于2.2GHz 。 曝料者没说是基准还是加速频率 , 但显然应该是后者 。 AD102核心预计有18432个流处理器 , 对比GA102核心增加超过70% , 理论上FP32浮点计算性能可达81TFlops , 对比RTX 3090 32TFlops增加足足1.25倍 。 事实上 , RTX 3090相比于RTX 2080 Ti的浮点计算性能就增加了1.5倍 , 但这只是理论性能 , 实际游戏性能提升幅度大约在50-60% 。 这么算下来 , AD102核心的游戏性能有望增加40%以上 , 依然很猛 。 另外 , AD102核心仍然坚持384-bit GDDR6X显存 , 暂时还没有GDDR7 。
- 为什么科学家用昆虫翅膀的起源质疑进化论?达尔文到底是对是错?
- NVIDIA|GTX 1630最新发布时间曝光:6月28日 定价1000元
- 小米Civi,推荐给喜欢高颜值外观的自拍达人
- GeForce|英伟达GeForce RTX 4090系列渲染图曝光:FE版将超过三槽规格
- 世界上最孤独的“手”,他握住一棵树长达50年,却从来没有松过手
- NVIDIA的DLSS技术已经深受玩家和开发者认可|性能2倍于DLSS!AMD游戏神技FSR 2.0正式支持Xb
- OPPO|OPPO真香千元机,骁龙778G+五千电池官方降至1299,好评率高达97%
- NVIDIA|曝NVIDIA新卡GTX 1630下周发布:1000元价格感人
- 世界智能大会|AMD7000系列V-CacheCPU与可能达到6GHz的Intel第13代抗衡
- 身份证|?电竞内存与普通内存有什么不同?金百达海力士上手体验
