
文章图片

文章图片

文章图片
【输入法|搅局GDC GTC AMD提前推出Instinct MI210加速器】
【锚思科技讯】本周将举行GDC和GTC , 英特尔和NVIDIA都会带来自己的全新GPU或相关技术 。 今天 , AMD也加入到了这场游戏当中 , 推出其MI200加速器系列的PCIe版本MI210 。
MI210是AMD最新一代基于GPU的加速器的第三个也是最后一个成员 , 它与MI250和MI250X一起在去年11月首次亮相 , 当时AMD推出了Instinct MI200系列 。 MI210将CDNA 2体系结构引入PCIe卡 , 面向那些追求MI200系列HPC和机器学习性能 , 但需要主流服务器标准化外形的客户 。 总体而言 , 作为AMD的一部分 , MI200今天被广泛推出 , 将整个MI200产品系列向OEM客户推广 。
从顶级规格开始 , MI210是现有MI250加速器的有趣变体 。 这两个部分是基于单个封装上MCM配置中的一对Aldebaran(CDNA 2)芯片 , 而对于MI210 , AMD正在将所有组件缩减为单个芯片和相关硬件 。 由于MI250(X)的OAM外形尺寸需要560W , AMD基本上需要将硬件减半 , 才能将PCIe卡的功耗降至300W 。 所以他们放弃了第二个封装芯片 。
最终的结果是 , 从物理硬件和预期性能来看 , MI210基本上是MI250的一半 。 CNDA 2图形计算芯片具有与MI250相同的104个CU , 芯片以1.7GHz的峰值时钟速度运行 。 因此 , 撇开工作负载可伸缩性不谈 , MI210的性能在所有实际用途上都是MI250的一半 。
随着MI250将64GB的HBM2e内存与每个GCD配对(总共128GB内存) , MI210将单个GCD的容量降至64GB 。 AMD在这里使用相同的3.2GHz HBM2e内存 , 因此该芯片的总体内存带宽为1.6 TB/秒 。
性能方面 , 使用一个Aldebaran芯片与AMD上一代PCIe卡Radeon MI100进行比较 。 虽然时钟更高 , 但相对于MI100 , CU的数量略有减少 , 这意味着对于某些工作负载 , 旧的加速器至少在纸面上要快一点 。 实际上 , MI210有更多的内存和更多的内存带宽 , 因此它应该仍然具有性能优势 。 在无法利用CDNA 2架构改进的工作负载中 , MI210不会比MI100高出太多 。
所有这些都强调了CDNA(1)和CDNA 2体系结构之间的整体相似性 , 以及开发人员需要如何利用CDNA 2的新功能来充分利用硬件 。 与CDNA(1)相比 , CDNA 2的亮点在于FP64载体工作负载、FP64基质工作负载和压缩FP32载体工作负载 。 AMD将其ALU的宽度增加了一倍 , 达到了64位的全宽 , 使FP64操作能够以全速处理 , 这三个用例都从中受益 。 同时 , 当FP32操作打包在一起以完全填充更宽的ALU时 , 它们也可以从新的ALU中受益 。
但是 , 正如我们在最初的MI250讨论中所指出的 , 与所有压缩指令格式一样 , 压缩FP32也不是轻而易举的 。 开发者需要编码来利用它;压缩操作数需要与偶数寄存器相邻并对齐 。 对于专门为体系结构(如Frontier)编写的软件 , 这是很容易做到的 , 但需要更新更多的可移植软件来考虑这一点 。 正是出于这个原因 , AMD明智地仍然在全速率(22.6 TFLOPS)下宣传其FP32矢量性能 , 而不是假设使用压缩指令 。
- 键盘|手机输入法“9键”和“26键”哪个打字更快?更科学?
- 输入法|五笔输入法最终会消亡
- 小米科技|搅局阿里云,抖音快手杀入云市场
- 红米搅局千元机,120W快充跌至1500,还有1亿主摄+OLED屏
- 红米手机|跌至2399元,天玑9000+120W快充,红米直接搅局中端市场!
- 百度输入法斩获6项国际设计大奖 用AI助力用户表达
- 乐视手机|乐视手机回归,搅局者还是炮灰?
- 比达第三方输入法报告:AI技术突破释放增长潜力,2022年底第三方输入法用户规模预计达7.96亿
- 荣耀|7-8月发?荣耀X40发布时间和硬件参数遭到预测,有望搅局千元市场
- OPPO|Redmi K50 Ultra首曝:搅局下半年顶级旗舰市场
