去年11月,AMD发布了CDNA2新架构的新一代加速计算卡Instinct MI250X、MI250,升级6nm工艺、2.5D MCM双芯整合封装、第三代Infinity Fabric总线互连技术,集成最多14080个流处理器核心、880个矩阵核心、218GB HBM2e显存/内存 。
两款卡均采用OAM模块形态,现在终于增加了PCIe标准形态,型号“Instinct MI200”,支持PCIe 4.0 。
文章图片
MI200回归单芯封装,规格、性能几乎完全就是MI250砍去一半:291亿个晶体管,104组计算单元,6656个流处理器核心,416个矩阵核心,4096-bit 64GB HBM2e显存,三条Infinity Link互连总线(最多四块并行) 。
核心频率还是1.7GHz,性能也正好减半,FP64/FP32矢量算力22.6TFlops,FP64/FP32矩阵算力45.3TFlops,FP16矩阵算力181TFlops,INT8矩阵算力181Tops 。
显存频率也维持在3.2GHz,所以带宽减半1.6TB/s 。
整卡功耗从560W降到了300W,采用单个EPS12V 8针辅助供电接口,被动散热 。
软件API支持OpenMP、OpenCL、HIP,计算框架支持TensorFlow、PyTorch、Kokkos、RAJA 。
文章图片
文章图片
文章图片
Instinct MI200 PCIe已经出货,方案客户包括华硕、戴尔、超微、慧与、联想 。
文章图片
与此同时,AMD还发布了ROCm 5开发套件,硬件新增支持Instinct MI200系列计算卡、Radeon PRO W6800专业显卡,系统新增支持Red Hat Enterprise Linux 8.5,商业ISV合作伙伴新增Ansys Cascade、TempoQuest,不仅提高了开发者的可用性,还在各种关键负载中实现了更出色的性能 。
ROCm 5的应用程序支持还包括HPC、AI、机器学习应用程序,以及AMBER、Chroma、CP2K、GRID、GROMACs、LAAMPS、MILC、Mini-HAAC、NAMD、NAMD 3.0、ONNX-RT、OpenMM、PyTorch、RELION、SPECFEM3D Cartesian、SPECFEM3D Globe、TensorFlow 。
文章图片
文章图片
文章图片
文章图片
文章图片
文章图片
文章图片
文章图片
- 领军企业|30个!中国科协发布2022年科技领域重大问题难题
- 小米|小米12S系列官宣7月4日正式发布:小米与徕卡联合研发
- 最前线 | 腾讯游戏发布40余款产品与项目,《王者荣耀》发布全新规划
- 腾讯游戏发布40余款产品与项目,《王者荣耀》发布全新规划
- 华为|重磅级新品官宣:华为全屋智能2.0将于7月4日发布 前代39999元起
- 口红|下周发布!华为P50 Pocket新版开启预订:送1699元口红耳机
- NVIDIA|GTX 1630最新发布时间曝光:6月28日 定价1000元
- 无边框|华硕灵耀X 13体验:AMD锐龙6000系列加持 超轻薄的本子也很能打
- gen.g战队|高通可能会在11月14日发布骁龙8 Gen 2 SoC,明年安卓机旗舰就看它了
- 腾讯|Reno8系列发布新色花仙紫:工艺全新升级,暑假换机还有限时礼盒
