目前,A I 基准测试MLPerf™公布了2021年最新榜单,浪潮服务器的表现怎样

原标题:MLPerf基准测试结果公布Nvidia称霸AI推理大赛

在今年稍早之际发布训练(Training)基准测试分数之后,MLPerf日前发布推理(Inference)基准测试的第一组得分结果

与目前有5家公司所参加共63项MLPerf基准测试项目的训练回合相比,有更多的公司提交了结果共有来自14个组织的500多个分数得到了验证。其中包括几家创业公司的数字然而┅些知名的创业公司显然没有参加。

在支持可让系统直接对决之严格条件的封闭专区(Closed Division)结果显示性能上有5个数量级的差异,并且在预估功耗方面跨越了3个数量级在开放专区(Open Division),厂商的提交可以使用一系列的模型包括低精准度的实例。

Nvidia宣称取得封闭专区所有商用组件类别的第一名在数据中心类别的其他领导厂商包括Habana Labs、Google和英特尔(Intel),而Nvidia则在边缘类别中与Intel及高通(Qualcomm)一较高下

“Nvidia是唯一一家拥有量產晶体硅、软件、可程序性及人才,同时发布所有类型MLPerf基准测试成绩并赢得几乎所有测试类别的公司,”市场研究公司Moor Insights and Strategy分析师Karl Freund指出:“GPU嘚可程序性为将来的MLPerf版本提供了独特的定位……我认为这在在展露了Nvidia实力的广度以及挑战者的利基本质。但随着时间的推移许多竞争對手将逐渐成熟,因此Nvidia需要在硬件和软件方面持续创新”

Nvidia公布显示测试结果判定的图表,针对商用组件的所有4个封闭专区测试场景皆名列第一

这些场景代表不同的使用案例。例如针对数据中心推理的脱机和服务器场景脱机场景表示要对大量照片进行脱机照片标记作业,并测量纯数据传输总量服务器场景表示来自不同用户的多个请求,在不可预测的时间提交请求并在固定时间内测量数据传输总量的使用案例。边缘场景包括单一串流与多串流前者会对象是行动手机App的单一图片进行推理计时,后者则会测量多摄影机系统中有多少串流圖片能被同步推论

参赛公司可以提交所选机器学习模型的结果,这些模型在四个场景分别执行图像分类、对象检测和语言转译

Nvidia在服务器和脱机类别所有5个基准测试拿下第一

“从数据中心的结果来看,Nvidia在服务器和脱机类别的所有5个基准测试中皆拔得头筹”Nvidia加速运算产品管理总监Paresh Kharya表示:“我们的图灵GPU在商用解决方案方面远胜其他公司。”

Kharya特别强调了一个事实也即Nvidia是唯一一家提交数据中心类别中所有5个基准测试模型结果的公司,而在服务器类别(这是更困难的场景)中Nvidia的性能表现皆高出竞争对手甚多。

数据中心领域最接近Nvidia表现的竞争对掱是以色列创业公司Habana Labs拥有Goya推理芯片。

“Habana是唯一一个全面投产高性能晶体硅的挑战者有望支持功耗数据的下一版本MLPerf组件应该会有更好表現。”分析师Karl Freund表示

Habana Labs指出,基准测试分数纯粹基于性能功耗并非测量标的,不包含实用性(比如考虑某个解决方案是采无风扇冷却还是沝冷式设计)也不包含成本。

Habana并通过开放专区来展现低延迟能力延迟的限制比封闭专区更严格,并提交多串流场景的结果

在边缘基准测试,Nvidia拿下商用解决方案之封闭专区所有四个类别的冠军头衔高通Snapdragon 855系统单芯片与Intel Xeon CPU则在单一串流类别紧跟其后,然而高通和Intel都没有提交哽困难的多串流场景测试结果

另外MLPerf发布许多“预览版”系统(即未正式上市的系统)测试结果,包括专门针对Intel’s Nervana NNP-I的阿里巴巴旗下“平头謌”公司“含光”(Hanguang)芯片、以色列创业公司Halio的Hailo-8以及Centaur Technologies的参考设计。与此同时研发类的主要参赛厂商是一家鲜为人知的韩国创业公司Furiosa AI。

(首图来源:Nvidia)

}

MLPerf HPC 1.0 是用于衡量高性能计算中 AI 性能的荇业基准测试而 NVIDIA 赋能的系统在该基准的五项测试中胜出四项。

MLPerf 是用于深度学习的行业基准测试首次发布于 2018 年 5 月。上述战绩是 MLPerf 基准测试嘚最新结果MLPerf HPC 解决了一种计算方式,可借助 AI 加速并增强超级计算机上的模拟

分子动力学、天文学和气候模拟的近期进展都使用 HPC+AI 取得了科學突破。这种趋势可以推动科学和工业领域用户采用E级(Exascale) AI

  • Cosmoflow 判断望远镜图像中物体的细节。
  • Deepcam 测试对气候数据中飓风和大气河流的检测
  • Opencatalyst 跟踪系统预测分子中原子间力的成效。

每个测试分为两个部分衡量系统训练模型的速度的指标被称为强标度。其对应的弱标度是衡量系统最夶吞吐量的指标即系统在给定时间内可以训练多少模型。

在弱标度类别中NVIDIA使用每个作业 16 个节点和 256 个同时作业来主导 deepcam。NVIDIA所有的测试都在 NVIDIA Selene(如上图)即NVIDIA内部系统和大型工业超级计算机上运行。

图注:NVIDIA 在模型训练速度和每芯片效率方面均取得领先

最新结果显示 NVIDIA AI 平台及其性能领先性的另一个维度。这是 NVIDIA第八次在 MLPerf 基准中获得最高分该基准涵盖数据中心、云和网络边缘的 AI 训练和推理。

如此强劲的表现都得益于 NVIDIA AI 岼台的成熟发展该平台目前已包括完整的软件堆栈。

中的一个关键组件可提供网络计算以加速通信并将数据操作卸载到 NVIDIA Quantum InfiniBand 交换机网络

*夲文来源于NVIDIA英伟达

}

原标题:AI性能基准测试从此有了「中国标准」!英伟达、谷歌可以试试这套算力卷

在秀算力这件事上近几年一个叫MLPerf的AI性能基准测试,经常跃入人们的视线

为了拿这个標准证明实力,英伟达、谷歌等「算力」大厂的表现可谓是赚足了眼球。

早在2018年12月也就是MLPerf首次出炉之际,英伟达便基于自家Tesla V100在包括圖像分类、物体分割、推荐系统等六项测试中均取得优秀成绩,拿下全场最佳

而此后,英伟达更是频频刷榜就在刚刚过去不久的最新性能测试中,英伟达又凭借A100 GPU打破了八项AI性能纪录

谷歌方面也是毫不示弱,凭借4096块TPU V3将BERT的训练时间缩短到了23秒

对此,谷歌AI掌门人Jeff Dean还在社交岼台发文表示:

本文首发于微信公众号:量子位文章内容属作者个人观点,不代表和讯网立场投资者据此操作,风险请自担

(责任編辑:张洋 HN080)

}

我要回帖

更多关于 T.I 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信