谷歌、英伟达在 MLPerf AI 训练基准测试中得分最高

• 2023年12月31日上午3:52 • 百科分享 • 阅读 143

根据 MLCommons 周三发布的数据，谷歌和英伟达在每年两次的人工智能程序培训基准测试中并列得分最高。

2.0 版 MLPerf 训练结果显示，谷歌在商业系统的四项任务上训练神经网络的时间最少，得分最高：图像识别、对象检测、一项针对小图像的测试和一项针对大图像的测试，和 BERT 自然语言处理模型。

Nvidia 在八项测试中的其他四项测试中获得了最高荣誉，这是因为其商用系统：图像分割、语音识别、推荐系统，以及解决在“迷你围棋”数据集上玩围棋的强化学习任务。

两家公司在多项基准测试中都取得了高分，但是，谷歌没有报告其他四项测试的商用系统的结果，只报告了它赢得的那四项测试。 Nvidia 报告了所有八项测试的结果。

基准测试报告调整神经“权重”或参数需要多少分钟，直到计算机程序在给定任务上达到所需的最低准确度，这一过程称为“训练”神经网络。

在所有供应商中，由于更强大的功能和更智能的软件方法，培训时间显着缩短。在媒体简报会上，MLCommons 的执行董事 David Kanter 解释说，从广义上讲，结果表明训练的性能提高优于摩尔定律，传统的经验法则表示芯片的晶体管速度每 18 到 24 个月翻一番提高计算机性能。

Kanter 说，例如，在著名的 ImageNet 任务中，训练神经网络为数百万张图像分配分类器标签，如今的得分比简单的芯片改进所暗示的要快 9 到 10 倍。

“我们做得比摩尔定律好很多，”坎特说。 “假设晶体管与性能呈线性关系，你会期望获得大约三倍半的性能；事实证明，我们得到了 10 倍的摩尔定律。”

Kanter 说，“普通的男人或女人”会从中获益，“只有一个工作站的研究人员”只包含 8 个芯片，他说。

Nvidia 在构成世界上大部分 AI 计算的 GPU 芯片的销售中占据主导地位，它会定期提交大部分或所有测试的结果。他指出，那些单一的工作站正在看到改进或 4 到 8 倍的简单晶体管缩放。 “我们正在将更多的能力交到研究人员手中，这使我们能够进行更多的实验，并有望做出更多的发现。”

谷歌的 TPU 是 Nvidia 芯片的主要竞争对手之一，它与 MLPerf 的往绩记录要差得多。在 12 月的基准测试报告中，该公司仅提交了一个测试编号，用于在 BERT 测试中使用其 TPU 进行实验。

谷歌在准备好的评论中表示，“谷歌的 TPU v4 [第 4 版] ML 超级计算机在五个基准测试中创造了性能记录，平均速度比下一个最快的非谷歌提交的速度快 1.42 倍，比我们的 MLPerf 1.0 提交速度快 1.5 倍。”

在 ZDNet 询问谷歌为什么选择与这四个类别的商业系统竞争而不是其他四个类别时，该公司在一封📮回复中表示，“我们提交的目的是主要关注能够为我们带来 MLPerf 之外的最大利益的工作负载。

“我们根据模型与谷歌内部和谷歌云客户使用的 ML 模型的相似性来决定提交哪些模型。提交和调整基准是一项重要的工作，因此我们集中精力为我们最大限度地提高 MLPerf 之外的利益。

“鉴于此，我们将精力集中在云可用类别的四个基准测试上——BERT、ResNet、RetinaNet、MaskRCNN。”

Nvidia 强调了其自身以及包括戴尔和联想在内的合作伙伴提交的全面范围。使用一种或另一种 Nvidia 芯片的计算机负责 105 个系统和 264 个报告结果中的 235 个报告测试结果。

“根据今天发布的 MLPerf 基准测试，NVIDIA 及其合作伙伴继续在所有基准测试中提供最佳的整体 AI 训练性能和最多的提交，其中 90% 的所有条目来自生态系统，”Nvidia 执行官 Shar Narasimhan 在准备好的评论中说。

“NVIDIA AI 涵盖了 MLPerf Training 2.0 回合的所有八项基准测试，突出了其领先的多功能性。”

在一张幻灯片中，Narasimhan 展示了他所说的“标准化”测量，该测量试图实现每个加速器的性能，因为不同的机器提交使用不同数量的加速器芯片。 Narasimhan 说，这项措施表明 Nvidia 在 8 项测试中的 6 项中表现最佳。

Narasimhan 说：“我们认为，这种将最高性能标准化为 1.0 X，然后以相似规模显示所有剩余加速器进行比较的特殊方法是比较所有人的最公平方式。”

在其他发展中，MLPerf 测试继续获得追随者，并获得了比过去更多的测试结果。共有 21 个组织报告了 264 个测试结果，高于 12 月 1.1 版报告中的 14 个组织和 181 个报告的提交。

新进入者包括华硕；中国科学院，或 CASIA；计算机制造商 H3C； HazyResearch，一个研究生提交的名字； Krai，曾参加过其他MLPerf竞赛，推理，但从未参加过训练；并启动 MosaicML。

在前五名的商业系统中，Nvidia 和谷歌紧随其后的是少数几个成功获得第三、第四或第五名的提交者。

微软的 Azure 云单元在图像分割比赛中获得第二名，在高分辨率图像的目标检测比赛中获得第四名，在语音识别比赛中获得第三名，所有系统均采用 AMD EPYC 处理器和 Nvidia GPU。

计算机制造商 H3C 在图像分割竞赛、高分辨率图像对象检测竞赛、推荐引擎和围棋游戏等四项测试中获得第五名，并且在语音识别方面也获得了第四名。所有这些系统都使用了 Intel XEON 处理器和 Nvidia GPU。

Dell Technologies 在使用低分辨率图像的对象检测中排名第四，在 BERT 自然语言测试中排名第五，两者均使用 AMD 处理器和 Nvidia GPU 的系统。

计算机制造商 Inspur 凭借使用 AMD EPYC 处理器和 Nvidia GPU 的系统在语音识别方面排名第五，在推荐系统方面排名第三和第四，分别使用基于 XEON 和基于 EPYC 的系统。

Graphcore 是一家总部位于英国布里斯托尔的初创公司，它使用替代芯片和软件方法构建计算机，在 ImageNet 中排名第五。 IT 解决方案提供商 Nettrix 在图像分割比赛中获得第四名，在围棋强化学习挑战赛中获得第四名。

在为记者做的简报中，Graphcore 强调其能够以更低的价格为其配备不同数量 IPU 加速器芯片的 BowPOD 机器提供与 Nvidia 相比具有竞争力的分数。例如，该公司吹捧其 BowPOD256，它在 ResNet 图像识别中获得第五名，比 8 路 Nvidia DGX 系统快十倍，同时成本更低。

“最重要的肯定是经济性，”Graphcore 的软件主管马特·菲尔斯 (Matt Fyles) 在媒体简报会上说。 “我们过去有一种趋势，即机器速度越来越快，但价格越来越贵，但我们已经划定了界限，我们不会让它变得更贵。”

尽管一些较小的 Graphcore 机器在几分钟的训练时间上落后于最好的分数或 Nvidia 和 Graphcore，“我们的客户都不关心几分钟，他们关心的是你是否有竞争力，然后你可以解决他们关心的问题，”他说。

Fyles 补充说，“有很多项目有数千个芯片，但现在行业将扩展您可以使用该做的其他事情，而不仅仅是，我们必须赢得这场基准竞赛——这是逐底竞争 ”

与过去的报道一样，Advanced Micro Devices 对 Intel 拥有吹嘘的权利。在参赛的 130 个系统中，有 79 个使用了 AMD 的 EPYC（霄龙）或 ROME 服务器处理器，这一比例高于英特尔至强芯片。此外，八项基准测试的前 40 个结果中有 33 个是基于 AMD 的系统。

与过去一样，英特尔除了在合作伙伴系统中配备 XEON 处理器外，还通过其 Habana Labs 单元推出了自己的参赛作品，使用 XEON 和 Habana Gaudi 加速器芯片而不是 Nvidia GPU。英特尔仅将精力放在 BERT 自然语言测试上，但未能进入前五名。

八项基准测试中有七项与 12 月的比赛相同。一个新条目是对其中一项对象检测任务的替代，在该任务中，计算机必须在图片中勾勒出一个对象的轮廓，并在轮廓上附加一个标签来识别该对象。

在这个新版本中，广泛使用的 COCO 数据集和 SSD 神经网络被新的数据集 OpenImages 和新的神经网络 RetinaNet 所取代。

OpenImages 使用大于 1,200 x 1,600 像素的图像文件。另一个目标检测任务仍然使用 COCO，它使用分辨率较低的 640 x 480 像素图像。

在媒体发布会上，MLCommons 的 Kanter 解释说，OpenImages 数据集结合了一个新的基准神经网络供提交者使用。先前的网络基于经典的 ResNet 神经网络，用于图像识别和图像分割。

新测试中使用的替代方法称为 RetinaNet，它通过对 ResNet 结构进行多项增强来提高准确性。例如，它添加了所谓的“特征金字塔”，它会同时查看网络所有层中对象周围上下文的所有外观，而不仅仅是网络的一层，这会添加上下文以更好地实现分类。

“特征金字塔是经典计算机视觉的一项技术，因此在某种程度上，这是对应用于神经网络领域的经典方法的重复，”坎特说。

除了特征金字塔之外，RetinaNet 的底层架构，称为 ResNeXt，通过 ResNet 上的一项新创新来处理卷积。经典 ResNet 使用所谓的“密集卷积”通过图像的高度和宽度以及 RGB 通道过滤像素。 ResNeXt 将 RGB 过滤器分解为单独的过滤器，称为“分组卷积”。这些小组并行运作，学习专门研究颜色通道的各个方面。这也有助于提高准确性。

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。商机网仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 tenspace2022@163.com 举报，一经查实，本站将立刻删除。本文链接：https://www.315965.com/n/66727.html 聚才发母婴好物

、

0 0

亚马逊，直接说不：人工智能语音复制迫在眉睫的恐怖

上一篇 2023年12月31日上午3:47

人工智能伦理应该像设计安全一样硬编码

下一篇 2023年12月31日上午3:58

百科分享

手机如何在网上赚钱(学生暑假网上兼职做什么好)

韩国大学放假时间其他信息：当中国的大学生还埋头苦读，在学习备考的战场上浴血奋战，出国留学的同学们已经早早迎来了他们的暑假！那么留学生什么时候放暑假？他们暑假有多长？中韩两国历史渊源，距离实在近，就近留学成为很多学生及家长的选择，那么韩国的大盟学什么时候放假呢？今天我们就一起来探讨一下韩国大学什么时候放暑假？一、韩国大学什么时欢市求露候放暑假？韩国大学…

神明
2024年1月27日
114
百科分享

身份证号码的数字代表什么意义（满18岁防沉迷2024无人用过的实名注册大全最新）

每个人都是有一张属于自己的身份证的，上面也都分别由18位不同数字代码组成。那么身份证号码的数字代表什么意义了？其实这18个代码是被分成了四个部分的，分别是地址码、出生日期码、顺序及性别码、校验和。下面将详细的讲解一下这四个不同的部分。身份证号码的数字代表的意义 1、地址码身份证前6位就是地址码，所谓的地址码表示的是编码对象常住户口所在县的行政区代码。 2…

神明
2023年12月2日
308
百科分享

布达拉宫是文成公主的宫殿吗？具体情况是怎样的？

在中国历史上，有许多感人至深的爱情故事。其中，唐朝入藏的两位公主——文成公主和金城公主的故事堪称千古绝唱。这是一段跨越千年的浪漫传奇，见证了中华民族的繁荣昌盛与文化交流。然而，关于布达拉宫是文成公主的宫殿还是赤德祖赞的王宫的问题，一直存在着争议。那么，布达拉宫究竟是谁的宫殿呢?本文将从历史资料出发，对这一问题进行探讨。布达拉宫位于中国西藏自治区拉萨市，是西…

2024年2月15日
38
百科分享

微信营销，为什么这么火？

现在的vx营销好像很火一样，我们公司想做公众但是怎么做才能好看系统一点呢？一、首先是vx公众账号的自身内容和定位。1、没有方向相当于是无头的苍蝇，发一点这个信息，发一点那个信息，用户群体不统一。vx未来的营销是投递式，不同于微博的广布式，所以vx更需要真实的粉丝，产生真实的反馈。所以要明确每一次沟通、互动、推送的对象是谁，您对这些目标人群越了解，信任度就越…

神明
2024年1月24日
119
百科分享

谷歌和苹果声称他们的设备可以提供更好的睡眠；不是真的，大学说

我震惊了，震惊得说不出话来。杨百翰大学 (BYU) 的一项新研究发现，苹果和谷歌高度吹捧的智能手📱机功能声明确实完全是胡说八道。在这种情况下，该功能是 Apple 的 Night Shift（和 Android 的夜间模式），它将设备的屏幕调整为更暖的色调，理论上可以让用户更快入睡。 BYU 详细描述了这种看法，苹果和谷歌玩弄的神话，然后抹杀了它。 [通…

2024年1月5日
132
百科分享

Zoho 将商业智能带入大众市场

每个 21 世纪的企业都是——或者应该是——数据驱动型企业。但就像开采黄金一样，原始数据毫无意义，除非你知道在哪里发光，而数据本身可以指导该决定。这就是 Zoho Corporation 最新发布的目标。商业智能即服务该公司正在宣传一个端到端的自助式商业智能，该利用人工智能驱动的数据分析来帮助揭示关键模式和洞察力。我们之前讨论过机器人过程自动化 (R…

2024年1月6日
135
百科分享

薛仁贵为什么被流放流放后为何又重新启用

我们都知道薛仁贵是唐初名将，他的事迹在民间广为流传，备受后人敬仰。不过薛仁贵一生也受过挫折，根据唐史记载，薛仁贵曾被流放象州，但具体原因是什么并无记载。当时高句丽遗民和新罗发动叛乱，薛仁贵负责平定此事，后来他在一场战役中，输给了新罗，有历史学家认为这或许就是薛仁贵遭到流放的原因。不过薛仁贵并没有因此遭受弃用，后来他不仅又被重新启用，还凭借智慧得以善终。 1、…

2024年2月22日
38
百科分享

鹅狗成一家，布局微信搜索和搜狗搜索的机遇来了（网络营销者）

当当网的网络营销相对传统营销有什么优势成立5年以来，销售额每年以2倍的速度迅速增长，发展速度迅猛惊人。究其原因，主要取决于网上购物的价格优势。低价战略是网上销售的第一驱动力，而当当网的价格优势首先来源于当当网和出版社之间的良好战略合作。据当当网相关负责人介绍，和当当网战略合作的出版社很多都取得了巨大的生产效益，最突出的例子就是机械工业出版社，他们每年在当当…

神明
2024年1月21日
109
百科分享

企业应该升级到 iOS 16 的 14 多个理由源代码

当谈到升级到 iOS 16 的原因时，大多数焦点都集中在新操作系统对消费者友好的功能上也就不足为奇了。但企业用户升级的原因有很多——包括这些提高生产力的调整。 SSO 的重大改进单点登录 (SSO) 允许员工登录到他们的托管设备一次，以查看它的使用设置，包括应用程序和服务部署。与大多数简单的事物一样，它依赖于复杂的技术网络，该技术于 2019 年首次通过…

2024年1月9日
125
百科分享

崔颢与李白：诗坛巨擘，谁更厉害？

崔颢和李白，两位唐代著名诗人，各自在诗坛上留下了浓墨重彩的一笔。那么，崔颢和李白谁更厉害呢?本文将从他们的诗歌成就、创作风格、影响力等方面进行分析。一、诗歌成就 1.崔颢崔颢，字千里，唐代著名诗人，被誉为“初唐四杰”之一。他的诗歌作品以豪放、奔放著称，尤其擅长描绘山水风光。崔颢的诗歌成就主要体现在《黄鹤楼》、《登鹳雀楼》等名篇上，这些作品都成为了中国古代…

2024年2月18日
50

谷歌、英伟达在 MLPerf AI 训练基准测试中得分最高

相关推荐

发表回复