营销信息资讯,更全更新信息实报!
首页 > 海外> 正文

英伟达 H100 首次亮相 MLPerf,测试结果刷新纪录

来源: 发布时间:2022-09-14 10:22
浏览:10854

北京时间 9 月 9 日,MLCommons 社区发布了最新的 MLPerf 2.1 基准测试结果,新一轮基准测试拥有近 5300 个性能结果和 2400 个功耗测量结果,分别比上一轮提升了 1.37 倍和 1.09 倍,MLPerf 的适用范围进一步扩大。

阿里巴巴、华硕、Azure、壁仞科技、戴尔、富士通、技嘉、H3C、HPE、浪潮、英特尔、Krai、联想、Moffett、Nettrix、Neural Magic、英伟达、OctoML、高通、SAPEON 和 Supermicro 均是本轮测试的贡献者。

其中,英伟达表现依然亮眼,首次携 H100 参加 MLPerf 测试,并在所有工作负载中刷新世界纪录。

H100 打破世界记录,较 A100 性能提升 4.5 倍

英伟达于今年 3 月份发布基于新架构 NVIDIA Hopper 的 H100 GPU,与两年前推出的 NVIDIA Ampere 架构相比,实现了数量级的性能飞跃。黄仁勋曾在 GTC 2022 上表示,20 个 H100 GPU 便可以承托相当于全球互联网的流量,能够帮助客户推出先进的推荐系统及实时运行数据推理的大型语言模型。

令一众 AI 从业者期待的 H100 原本定于 2022 年第三季度正式发货,目前处于接受预定状态,用户的真实使用情况和 H100 的实际性能尚不可知,因此可以通过最新一轮的 MLPerf 测试得分提前感受 H100 的性能。

在本轮测试中,对比 Intel Sapphire Rapids、Qualcomm Cloud AI 100、Biren BR104、SAPEON X220-enterprise,NVIDIA H100 不仅提交了数据中心所有六个神经网络模型的测试成绩,且在单个服务器和离线场景中均展现出吞吐量和速度方面的领先优势。

以 NVIDIA A100 相比,H100 在 MLPerf 模型规模最大且对性能要求最高的模型之一 —— 用于自然语言处理的 BERT 模型中表现出 4.5 倍的性能提升,在其他五个模型中也都有 1 至 3 倍的性能提升。H100 之所以能够在 BERT 模型上表现初出色,主要归功于其 Transformer Engine。

其他同样提交了成绩的产品中,只有 Biren BR104 在离线场景中的 ResNet50 和 BERT-Large 模型下,相比 NVIDIA A100 有一倍多的性能提升,其他提交成绩的产品均未在性能上超越 A100。

而在数据中心和边缘计算类别的场景中,A100 GPU 的测试成绩依然不俗,得益于 NVIDIA AI 软件的不断改进,与 2020 年 7 月首次亮相 MLPerf 相比,A100 GPU 实现了 6 倍的性能提升。

追求 AI 通用性,测试成绩覆盖所有 AI 模型

由于用户在实际应用中通常需要采用许多不同类型的神经网络协同工作,例如一个 AI 应用可能需要理解用户的语音请求、对图像进行分类、提出建议,然后以语音回应,每个步骤都需要用到不同的 AI 模型。

正因如此,MLPerf 基准测试涵盖了包括计算机视觉、自然语言处理、推荐系统、语音识别等流行的 AI 工作负载和场景,以便于确保用户获得可靠且部署灵活的性能。这也意味着,提交的测试成绩覆盖的模型越多,成绩越好,其 AI 能力更加具备通用性。

在此轮测试中,英伟达 AI 依然是唯一能够在数据中心和边缘计算中运行所有 MLPerf 推理工作负载和场景的平台。

在数据中心方面,A100 和 H100 都提交了六个模型测试成绩。

在边缘计算方面,NVIDIA Orin 运行了所有 MLPerf 基准测试,且是所有低功耗系统级芯片中赢得测试最多的芯片。

Orin 是将 NVIDIA Ampere 架构 GPU 和 Arm CPU 内核集成到一块芯片中,主要用于机器人、自主机器、医疗机械和其他形式的边缘嵌入式计算。

目前,Orin 已经被用在 NVIDIA Jetson AGX Orin 开发者套件以及机器人和自主系统生成模考,并支持完整的 NVIDIA AI 软件堆栈,包括自动驾驶汽车平台、医疗设备平台和机器人平台。

与 4 月在 MLPerf 上的首次亮相相比,Orin 能效提高了 50%,其运行速度和平均能效分别比上一代 Jetson AGX Xavier 模块高出 5 倍和 2 倍。

追求通用型的 NVIDIA AI 正在被业界广泛的机器学习生态系统支持。在这一轮基准测试中,有超过 70 项提交结果在 NVIDIA 平台上运行。例如,Microsoft Azure 提交了在其云服务上运行 NVIDIA AI 的结果。

热门文章

  • 推动人工智能在规范中发展,大咖们上演“头脑风暴”
    推动人工智能在规范中发展,大咖们上演“头脑风暴”

    推动人工智能在规范中发展,大咖们上演“头脑风暴”

    人工智能是引领未来发展的战略性技术,也是新一轮科技革命和产业变革的重要驱动力量。近日,一场立法征集意见座谈会在湾谷科技园杨浦区人...

  • 凭实力“出圈”,Nutri壹营养把握母婴消费新风
    凭实力“出圈”,Nutri壹营养把握母婴消费新风潮

    凭实力“出圈”,Nutri壹营养把握母婴消费新风

    近些年,年轻人逐渐成为父母角色的主流。作为崛起的后浪,新时代的扛把子,这届新生代父母在带娃这条路上也是相当的与众不同。科学育儿,

  • 双11电商人才数据报告:主播、网红及快递人才缺口
    双11电商人才数据报告:主播、网红及快递人才缺口大,直播运营策划容易拿高薪

    双11电商人才数据报告:主播、网红及快递人才缺口

    封面新闻记者 雷强双11购物狂欢节经过13年发展进化,俨然成了反映中国经济和消费活力的重要参考。双11改变了大众消费习惯,重塑电

  • 时链科技亮相世界人工智能大会,用AI算法赋能节能
    时链科技亮相世界人工智能大会,用AI算法赋能节能增效

    时链科技亮相世界人工智能大会,用AI算法赋能节能

    9月3日,为期三天的2022世界人工智能大会在上海世博中心圆满落下帷幕。本次大会以智联世界、元生无界为主题,充分演绎和展现了人工

  • 思必驰俞凯受邀出席AI人工智能应用讲座并发表主题
    思必驰俞凯受邀出席AI人工智能应用讲座并发表主题演讲

    思必驰俞凯受邀出席AI人工智能应用讲座并发表主题

    近日,上汽通用五菱在柳州技术中心举办了AI人工智能应用讲座,思必驰联合创始人兼首席科学家、上海交通大学教授俞凯受邀参加,现场带来

  • 哲语人工智能亮相2022世界人工智能大会,受到多
    哲语人工智能亮相2022世界人工智能大会,受到多方关注!

    哲语人工智能亮相2022世界人工智能大会,受到多

    2022世界人工智能大会于9月1日—3日在上海世博中心成功举办。本次大会以智联世界,元生无界为主题,以AI赋能城市数

人工智能

更多 >

物联网

更多 >