NVIDIA 推出 Hopper,其新的硬件架构可将数据中心转变为 AI 工厂

NVIDIA 推出 Hopper,其新的硬件架构可将数据中心转变为 AI 工厂

NVIDIA 又做了一次,但这次有所不同——似乎是从竞争对手的剧本中借用了一页。 在已成为 AI 行业最重要活动之一的 NVIDIA GTC 上,该公司宣布了其硬件架构和产品的最新迭代。 以下是公告的细目及其对整个生态系统的意义。

Hopper:NVIDIA 的新 GPU 架构
GTC 从周一开始一直持续到周四,共有 900 多场会议。 来自 50 多个国家/地区的 200,000 多名开发人员研究人员和数据科学家已注册参加此次活动。 在 GTC 2024 主题演讲中,NVIDIA 创始人兼首席执行官黄仁勋宣布了数据中心和高性能计算、人工智能、设计协作和数字双胞胎、网络、汽车、机器人和医疗保健领域的大量新闻。

Huang 的框架是“公司正在处理、提炼他们的数据,制作人工智能软件……成为智能制造商。” 如果目标是将数据中心转变为“AI 工厂”(如 NVIDIA 所说),那么将 Transformers 置于其核心位置是有道理的。

公告的中心是新的 Hopper GPU 架构,NVIDIA 将其称为“下一代加速计算”。 新架构以美国计算机科学家先驱 Grace Hopper 的名字命名,继承了两年前推出的 NVIDIA Ampere 架构。 该公司还发布了其首款基于 Hopper 的 GPU,即 NVIDIA H100。

NVIDIA 声称 Hopper 比其前身带来了数量级的性能飞跃,而这一壮举基于六项突破性创新。 让我们通过它们,快速记录下它们与竞争对手的比较情况。

第一,制造业。 H100 采用专为 NVIDIA 的加速计算需求而设计的尖端 TSMC 4N 工艺,内置 800 亿个晶体管,在加速 AI、HPC、内存带宽、互连和通信方面取得了重大进步,包括每秒近 5 TB 的外部连接。 在制造层面,Cerebras 或 Graphcore 等新贵也在不断突破可能性的界限。

第二,多实例 GPU (MIG)。 MIG 技术允许将单个 GPU 划分为七个更小、完全隔离的实例,以处理不同类型的作业。 Hopper 架构通过在云环境中跨每个 GPU 实例提供安全的多租户配置,将 MIG 功能扩展到上一代产品的 7 倍。 NVIDIA 的合作伙伴 Run:AI 提供类似于软件层的东西,称为部分 GPU 共享。

第三,机密计算。 NVIDIA 声称 H100 是世界上第一个具有机密计算功能的加速器,可以在处理 AI 模型和客户数据时保护它们。 客户还可以将机密计算应用于医疗保健和金融服务等隐私敏感行业以及共享云基础设施的联合学习。 这不是我们在其他地方看到的功能。

四、第4代NVIDIA NVLink。 为了加速最大的 AI 模型,NVLink 与新的外部 NVLink 交换机相结合,将 NVLink 作为扩展网络扩展到服务器之外,连接多达 256 个 H100 GPU,带宽比使用 NVIDIA HDR Quantum InfiniBand 的上一代高 9 倍。 同样,这是 NVIDIA 特有的,尽管竞争对手也经常利用自己的专业基础设施来连接他们的硬件。

五、DPX指令加速动态规划。 动态规划既是一种数学优化方法,也是一种计算机编程方法,最初是在 20 世纪 50 年代发展起来的。 在数学优化方面,动态规划通常指的是通过将决策分解为随时间推移的一系列决策步骤来简化决策。 动态规划主要是对普通递归的优化。

NVIDIA 指出,动态编程被广泛用于各种算法,包括路线优化和基因组学,与 CPU 相比,它可以将执行速度提高多达 40 倍,与上一代 GPU 相比提高多达 7 倍。 我们不知道在竞争中有直接的等价物,尽管许多 AI 芯片新贵也利用了并行性。

第六项创新是我们认为最重要的一项:新的 Transformer 引擎。 正如 NVIDIA 指出的那样,转换器是自然语言处理的标准模型选择,也是有史以来最重要的深度学习模型之一。 H100 加速器的 Transformer Engine 旨在将这些网络的速度提高到与上一代相比的 6 倍,而不会降低准确性。 这值得进一步分析。

Hopper 核心的 Transformer 引擎
看着 NVIDIA H100 核心的新变压器引擎的标题,我们想起了英特尔架构师 Raja M. Koduri 对 ZDNet 的 Tiernan Ray 的评论。 Koduri 指出,矩阵乘法的加速现在是衡量芯片性能和效率的重要指标,这意味着每个芯片都将是一个神经网络处理器。

Koduri当然是现场。 除了英特尔自身的努力外,这也是推动一系列新贵的新一代 AI 芯片设计的原因。 看到 NVIDIA 提到变形引擎让我们想知道该公司是否对其 GPU 进行了彻底的重新设计。 毕竟,GPU 最初并不是为 AI 工作负载设计的,它们只是恰好擅长这些,而 NVIDIA 有远见和敏锐的眼光围绕它们构建生态系统。

然而,深入 NVIDIA 自己对 Hopper 架构的分析,彻底重新设计的想法似乎被打消了。 虽然 Hopper 确实引入了一种新的流式多处理器 (SM),具有许多性能和效率改进,但仅此而已。 考虑到围绕 NVIDIA GPU 构建的生态系统的绝对重量,以及彻底重新设计将带来的大量更新和潜在的不兼容性,这并不奇怪。

分解 Hopper 的改进,内存似乎是其中很大的一部分。 正如流行的机器学习训练库 PyTorch 的 Facebook 产品经理告诉 ZDNet 的那样,“模型越来越大,它们真的非常大,而且训练起来非常昂贵。” 如今最大的模型通常不能完全存储在 GPU 附带的内存电路中。 Hopper 带有更快、更多并在 SM 之间共享的内存。

另一个提升来自 NVIDIA 全新的第四代张量核心,与 A100 相比,它的芯片到芯片速度最高可提高 6 倍。 张量核正是用于矩阵乘法的。 在 H100 中,使用了新的 FP8 数据类型,与上一代 16 位浮点选项相比,计算速度提高了 4 倍。 在等效数据类型上,仍然有 2 倍的加速。

至于所谓的“新 transformer 引擎”,事实证明这是 NVIDIA 用来指代“软件和定制的 NVIDIA Hopper Tensor Core 技术的组合,专门用于加速 transformer 模型训练和推理”。

NVIDIA 指出,transformer 引擎在 FP8 和 16 位计算之间进行智能管理和动态选择,自动处理每一层中 FP8 和 16 位之间的重铸和缩放,以提供高达 9 倍的 AI 训练速度和高达 30 倍的 AI 推理速度 与上一代 A100 相比,大型语言模型的加速。

因此,虽然这不是彻底的重新设计,但正如 NVIDIA 的技术博客所阐述的那样,性能和效率改进的结合导致与 Ampere 相比加速了 6 倍。 NVIDIA 专注于提高 transformer 模型的性能并没有错。

Transformer 模型是当今广泛使用的语言模型的支柱,例如 BERT 和 GPT-3。 最初是为自然语言处理用例开发的,它们的多功能性正越来越多地应用于计算机视觉、药物发现等,正如我们在 AI 现状报道中所记录的那样。 根据 NVIDIA 共享的一项指标,过去 2 年已发表的 AI 研究中有 70% 是基于 transformers 的。

软件方面:Apache Spark 用户的好消息
但是软件方面呢? 在之前的 GTC 公告中,软件堆栈更新是新闻的关键部分。 在这种情况下,虽然在 FP8 和 FP16 计算之间动态选择的 NVIDIA 调整启发式算法在内部是新转换器引擎的关键部分,但相比之下,对面向外部的软件堆栈的更新似乎不那么重要。

NVIDIA 的 Triton 推理服务器和用于训练大型语言模型的 NeMo Megatron 框架正在更新。 Riva、Merlin 和 Maxin 也是如此——一种语音 AI SDK,分别包括预训练模型、端到端推荐 AI 框架以及音频和视频质量增强 SDK。 正如 NVIDIA 强调的那样,这些被 AT&T、微软和 Snapchat 等公司使用。

NVIDIA 的 CUDA-X 库还有 60 个 SDK 更新。 NVIDIA 选择突出新兴领域,例如加速量子电路仿真(cuQuantum 全面上市)和 6G 物理层研究(Sionna 全面上市)。 然而,对于大多数用户来说,好消息可能是针对 Apache Spark 的 RAPIDS 加速器的更新,它在不更改代码的情况下将处理速度提高了 3 倍以上。

虽然这在 NVIDIA 的公告中并不十分突出,但我们认为应该如此。 对于 Apache Spark 用户而言,无需更改代码即可在一夜之间实现 3 倍加速,80% 的财富 500 强企业在生产中使用 Apache Spark,这可不是什么小新闻。 这也不是 NVIDIA 第一次向 Apache Spark 用户展示一些爱。

总的来说,NVIDIA 似乎保持着它的势头。 尽管竞争非常激烈,但凭借 NVIDIA 成功创造的先机,可能并不需要彻底的重新设计。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。商机网仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 tenspace2022@163.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.315965.com/n/66668.html 聚才发 母婴好物

(0)
上一篇 2023年12月30日 上午6:57
下一篇 2023年12月30日 上午7:06

相关推荐

  • 2024准确率100的生男生女公式很准哟(2024年的清宫表看男孩女孩)

    对于孕妈妈来说,怀孕是一件高兴的事情,那有的时候妈妈很想知道自己怀的是男孩还是女孩,都想早点的知道宝宝的性别,那想知道是男是女,有什么方法呢? … 具体的生男还是生女的计算的公式有好几种的计算的方法,在下面为大家推荐了四种计算的方法,大家可以参考一下的。 2018生男生女计算公式一: 怀孕农历月份双乘+孕妇农历生日月份-怀孕时虚龄+19=,得出结…

    2023年11月30日
    151
  • 2024车险怎么买最划算大概多少钱(最实用划算的投保方式)

    都说“买车容易养车难”,车子到手之后,第一笔大费用就是买保险。很多车主只知道车险一定要买,但对于哪些保险怎么赔、怎么买更划算,了解并不多。 今天,就跟大家聊聊车险。 车险的种类 目前,车险主要分为两大类:一是交强险,二是商业险。 交强险是国家强制买的,不买不能上路,是车子最基础的保障; 而商业险可以根据自己的需求自由买,保额也可以自己定。 1 交强险 先来说…

    2023年8月9日
    180
  • CES 2023 最佳机器人和 AI 创新

    从割草机等平凡的工具到了解驾驶员的奇幻概念车,在 CES 2023 上展示的几乎每一项创新都注入了 AI。 虽然有些产品采用“机器人”的形式,但其他产品则无形地利用 AI 功能使日常产品更智能、更有用。 正如 AMD 首席执行官苏丽莎在主题演讲中所说,“人工智能确实是科技未来最重要的大趋势。” 以下是 CES 上一些最出色、最引人注目的人工智能产品: 标致 …

    2024年1月1日
    124
  • 刘光世是什么身份?他是谁的后代?

    刘光世是南宋末年的一位著名将领,他在抗金战争中表现出色,被誉为“忠臣”。然而,很少有人知道他与岳飞有着紧密的关系,他是岳飞的后代。本文将从历史背景、事实经过以及相关人物的角度出发,探讨刘光世的身份背景和他在南宋时期的军事成就。 一、历史背景 南宋时期,岳飞作为南宋军队的主要将领之一,他在战场上表现出色,被誉为“忠臣”。而刘光世则是另一位南宋军队的重要将领,他…

    2024年2月28日
    37
  • 如何让眼睛有杀气?(男生练出充满魅力的眼神细节教学)

    眼睛是人们心灵的窗户。如果你想拥有明亮的眼睛,你需要良好的个人素质和修养。同时,你需要良好的心理素质和丰富的生活经验,才能有更完整的眼神表达。因此,我个人认为眼睛的练习应该与你的个人想法相结合。当然,它也需要不断的练习。 平时没事的时候,可以拿一面小镜子,然后把自己设定在某种意境中,寻找相应的眼神表现,反复练习。 把喜、 怒、 哀、 乐 、怨 恨、 愁 表达…

    2023年12月13日
    321
  • 学生发型男短发(三种初高中男生最帅的发型)

    开学了,男生们都应该好好捯饬一下自己的形象,剪一款好看帅气的发型,让自己能够在新的学期里有一个新的开始!发型作为男生们提升颜值的利器,一定不能随便乱剪,选择一个适合自己的造型才能让自己的形象更加帅气!今天,阿北给大家推荐3款适合“学生党”的帅气发型,开学了赶紧剪一个吧! 第1款:两边掏空发型 很多在校的男生,喜欢保留一定的刘海,让自己看起来显得更加减龄一些。…

    2023年8月9日
    254
  • 裴行俭和武则天的关系是怎样的?他们有什么故事?

    在中国历史上,有许多令人敬仰的政治家和文学家,他们的名字成为了永恒的传奇。裴行俭和武则天就是这样一对令人瞩目的人物,他们在政治舞台上共同演绎了一段充满传奇色彩的故事。那么,裴行俭和武则天究竟是什么关系呢?本文将带您了解这对政治佳话背后的真相。 裴行俭,字子文,唐朝著名政治家,曾任宰相,是唐朝中期著名的改革家。他在位期间推行一系列政治改革,使得国家政治稳重、经…

    2024年2月15日
    35
  • 用灭火器进行灭火的最佳位置是对准哪里(灭火应该站在下风还是上风)

    消防安全常识理应大家都知道 但是数据统计结果显示, 仍然有人会犯一些消防安全常识性的错误! 那都有哪些呢? 下面我们一起来看看吧! 火警报警电话 01 调查数据显示有273人(占0.21%)回答火灾报警电为“122”或“911”。 纠错:中国的火警电话是119。让人意想不到的是,有不少人回答为911。911是美国报警服务电话。另外要告诉大家的是,122是交通…

    2023年12月7日
    158
  • bot微信状态是什么意思(微信状态bot怎么设置)

    vx状态bot vx状态新增一个机器人图标,名字叫做“bot”,“bot”是“robot”的英文缩写翻译过来就是机器人的意思。 botvx状态是什么意思呢? 没有感情的机器人 1.机器人是没有感情的,我们可以理解为vx设置为bot状态就是我已经下班不要打扰我啦!可以想象我们面对机器人客服与人工客服的待遇。 2.工作时vx状态设置为bot状态,我们可以理解为,…

    2023年12月1日
    268
  • 最贵前十名的摩托车图片和报价(世界顶级摩托跑车排行第一名多少钱)

    如果说轿车装载着家庭,那么摩托就承载着自由。那种被风儿包裹着向上而行的热血,估计是每个男人都无法拒绝的。 虽然只是一个普普通通的两轮摩托车,但是在骑士眼中它代表着激情,代表着向往这是很难被其它交通工具所取代。 距今为止摩托车的发展已经超过百年,也让许多摩托车不仅仅成为代步工具,更成为某些骑士眼中的收藏品。有些摩托车可能大家穷极一生的积蓄都买不起。 今天峰纪实…

    2023年8月7日
    882

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注