MLPerf成绩冲入世界前三,服务器独角兽宁畅如何做到?

文章图片
智东西(公众号:zhidxcom)
作者|贞逸
编辑|漠影
当人们认为服务器行业格局已定时 , 一位年轻的挑战者“宁畅”出现在我们视野 。
这家成立仅18个月的服务器公司 , 今年7月初在一众老大哥聚集的行业顶级赛事MLPerfAI基准测试中突出重围 , 在MASKR-CNN、U-NET3D两个AI场景中拔得头筹 。
业内资深分析师将宁畅喻为服务器独角兽 , 媒体更将其与行业龙头浪潮进行比较研究 。
宁畅为什么能夺冠?宁畅又是一家怎样的公司?
带着这些疑问 , 智东西采访了宁畅相关负责人 。 经深入沟通 , 我们发现一场变革正席卷国内服务器市场 。
一、宁畅凭什么夺得MLPerf冠军?
近日MLPerf发布基于TrainingV1.0最新标准测试结果 。 宁畅AI服务器X640G40和X660G45 , 分别以48.43、28.64成绩 , 取得固定任务(closed)赛道 , 单机服务器系统的MASKR-CNN、U-NET3D两项AI场景世界性能冠军 。 宁畅单机服务器系统AI性能冲入世界前三 。
▲MASKR-CNN测试结果
文章图片
▲U-NET3D测试结果
文章图片
去年参加MLPerfTraining的组织只有9家 , 今年增长到了13家 , 不管是MLperf中的常驻会员NVIDIA、Intel、Google;还是新入场的Habana , GIGABATE , Graphcore等厂商都实力雄厚 。
宁畅作为创业公司 , 在八个赛道中能取得两项单机服务器系统世界冠军 , 核心依托的是过硬的产品研发能力 。
1、全栈研发破解“木桶效应”
宁畅介绍 , 随着AI技术不断发展 , 各大厂商都在发力AI服务器 , 行业竞争激烈 。
AI服务器是相对复杂服务器产品 , 其性能遵从木桶效应 , 计算模块、存储模块、网络模块 , 散热模块等任何一个模块出现短板 , 都会影响整体性能 。
正因如此 , 在单机服务器系统领域 , 能参加MLPerfTraining测试并取得冠军成绩的初创企业极少 , 目前除宁畅外国内还没有第二家初创服务器厂商 。
宁畅虽然是初创公司 , 但团队成员可谓是行业“老兵” 。 宁畅团队成员在服务器领域的平均工作经验超八年 , 核心员工不低于15年 。
此外 , 宁畅具有全面的产品、技术与工程平台 , 从标准规范到BIOS软件设计 , 再到散热、电信号的模拟仿真 , 以及自动化压力测试 , 宁畅均具有全栈技术研发能力 。
▲宁畅全栈研发平台
文章图片
这使得宁畅的AI服务器整体性能强劲 , 在完成同等量AI模型训练任务时 , 可以“先人一步” 。
如宁畅X640G40是兼备训练与推理的全能型AI服务器 , 具备海量存储扩展能力 , 最大支持24块3.5寸硬盘 。 强劲性能、海量存储 , 使得X640G40在训练MASKR-CNN模型时 , 一秒可完成57000张图片分析 , 以及570余次训练迭代 。
X660G45是高性能AI计算平台,GPU之间采用高达600GB/s的NVLink总线高速互联 。 每个GPU上还可搭配专属的200GHDR高速网络和U.2高速缓存 , 在训练U-NET3D模型时 , 一秒可分析5040张X光照片 , 这是单机服务器的世界极限处理速度 。
▲X640G40和X660G45
文章图片
值得关注的 , 除MASKR-CNN、U-NET3D两个赛道外 , 在比较同功耗的GPU配置下 , 宁畅X660G45在DLRM(推荐系统)、SSD(目标检测)固定任务赛道中 , 亦取得最好成绩 。 同GPU功耗配置下 , 宁畅其实获得的是八大赛道的四个冠军席位 , 取得数量同样是世界第一 。
- 物联网|CVPR 2022召开:国内科技企业成绩出色,绿厂七篇论文成功入选
- 游戏|男生凌晨冲进网吧查成绩:一看总分200+ 下一幕哭笑不得
- 手机厂商|各大厂商晒六一八成绩单,自诩包揽多项第一,谁才是真正的王者
- 跑分|目前安卓阵营最强CPU性能!天玑9000+首个跑分成绩曝光
- OPPO|今时不同往日!OPPO 618成绩太亮眼,Reno8系列凭实力卖
- 618成绩出炉,苹果独占高端鳌头,华为后劲十足,小米赢麻了
- 智能门锁|历史最好成绩!中国大陆厂商拿下全球芯片代工第5、6、9名
- OPPO|绿厂的海外成绩有多强?最新报告出炉
- 小米科技|六一八小米晒出成绩单,全渠道突破187亿,十大畅销机占据六位
- 李国庆|李国庆吐槽东方甄选:下单人数太少 属于不及格的成绩
