OpenAI 提出开源 Triton 语言作为 Nvidia CUDA 的替代方案

• 2023年12月29日上午12:01 • 百科分享 • 阅读 194

根据人工智能研究公司 OpenAI 的说法，Nvidia 的图形处理单元太难编程，包括使用 Nvidia 自己的编程工具 CUDA。

这家总部位于旧金山的 AI 初创公司在微软和风险投资公司 Khosla Ventures 的支持下，于周三推出了 1.0 版本，这是一种专门为减轻这种负担而设计的新编程语言，名为 Triton，在一篇链接到 GitHub 源代码的博客文章中有详细介绍。

OpenAI 声称 Triton 可以为 AI 机器学习形式的核心神经网络任务（例如矩阵乘法）提供比 CUDA 编码更易用的优势。

“我们的目标是让它成为 CUDA 深度学习的可行替代方案，”这项工作的负责人、OpenAI 科学家 Philippe Tillet 通过📮告诉 ZDNet。

Triton“适用于尽管拥有良好的软件工程技能但不熟悉 GPU 编程的机器学习研究人员和工程师，”Tillet 说。

该语言来自 OpenAI，它开发了风靡全球的 GPT-3 自然语言处理程序，这一事实可能会使该代码在 AI 领域更加卓越。

最初的 Triton 揭幕发生在 Tillet 于 2019 年发表的一篇论文中，当时他还是哈佛大学的一名研究生，还有他的导师 H. T. Kung 和 David Cox。

Tillet 着手解决的问题是如何制作一种比供应商特定的 AI 库（例如 Nvidia 的 cuDNN）更具表现力的语言，这意味着能够处理神经网络中涉及的矩阵的各种操作；同时具有可移植性，并具有可与 cuDNN 和类似供应商库相媲美的性能。

根据 Tillet 和团队的说法，直接在 CUDA 中对 GPU 进行编程实在是太难了。例如，为 GPU 编写本机内核或函数“由于 GPU 编程的许多复杂性而非常困难，”Tillet 和团队在帖子中写道。

特别是，正如 Triton 文档所解释的那样，“GPU 在优化局部性和并行性方面仍然极具挑战性”。

但 Tillet 还希望该语言比迄今为止的定制工作更容易编程，基于所谓的“涉及大量手动工作”的“微内核”。特别是，Triton 被提出作为替代供应商库的两种主要方法的替代方法，这两种方法称为多面体编译和调度语言。

Tillet 选择的是一种称为 tiles 的方法。在 CUDA 编程中广泛使用的 Tile 将机器学习程序中使用的矩阵分解成片段，这些片段可以有效地分布在共享 SRAM 内存和快速寄存器内存中，并通过多个指令线程并行高效地运行。

然而，在 CUDA 中进行并行化是困难的，因为需要在程序的指令线程之间进行显式同步语句。

Triton 的语义将图块指定为内置类型，这样 Triton 编译器就可以搞清楚这些片段如何在 GPU 的许多核心及其伴随的寄存器中有效分配。

实际上，并行化和优化代码的工作已从语言下推到编译器中。

正如 Tillet 所说，编译器“自动执行各种重要的程序优化”。

“例如，通过查看计算密集型块级操作的操作数，可以将数据自动存储到共享内存中。”

Triton 程序员的高级代码首先转换为中间表示，其灵感来自开源 LLVM 编译器基础结构中的中间表示。正如 Tillet 在原始论文中所描述的那样，“只需对 LLVM-IR 进行一些数据和控制流扩展，就可以实现各种平铺级优化通道，从而共同实现与供应商库相当的性能。”

然后将中间表示提供给即时编译器，该编译器以最适合共享内存和 GPU 内核寄存器的方式将各种矩阵转换为片段。

JIT 在 GPU 核心内部组织指令线程以从主内存中提取相同的值，称为“内存合并”。同样，JIT 将这些线程共同感兴趣的数据放入共享内存中以进行高效操作，这称为“共享内存分配”。

正如 Tillet 所描述的，结果是“单线程和自动并行化”的程序。 JIT 正在执行自动调整图块、数据片段的工作，以最有效地将它们分布在核心之间。

在最初的 Triton 论文中，Tillet 提出了一种基于 CUDA 语法的类 C 形式的 Triton。然而，在这个新的 1.0 版本中，Triton 与 Python 集成在一起。详细信息在博客文章中有详细说明。

使用 Triton 的好处应该是可以立即加快开发神经网络的一些基本操作。正如 Tillet 在博文中所说，“它可用于编写与 cuBLAS 性能相匹配的 FP16 矩阵乘法内核”，这是一个实现开源基本线性代数子程序的 Nvidia 库，“这是许多 GPU 程序员无法做到的” 做不到——不到 25 行代码。”

Tillet 说，他在 OpenAI 的超级计算负责人 Chris Berner 的监督下，全职参与 OpenAI 的项目。但也有几位 OpenAI 工作人员对 Triton 项目的帮助。

“最近，几位 OpenAI 员工和研究人员——都没有 GPU 编程经验——为该项目贡献了代码和想法，”Tillet 告诉 ZDNet。 “我们已经使用它来加速和重写我们的大部分 GPU 内核，我们致力于通过后续版本使其更广泛地适用。”

Tillet 指出，该项目得到了 OpenAI 外部的“有意义的贡献”，其中包括香港科技大学的 Da Yan、微软 DeepSpeed 优化库的团队以及商业 AI 初创公司 Anthropic。

周三的博文没有强调性能指标，只是说 Triton 可以与 CuBLAS 匹敌。然而，在 Tillet 的原始论文中，该语言的 Triton-C 版本在运行所谓的深度卷积时能够获得比 Nvidia 的 CuDNN 库更好的性能，深度卷积是将输入视为局部相关数据组的操作，例如图像像素。

请注意，该软件目前仅适用于 Nvidia GPU；它尚不能用于 AMD 的 GPU，也不能编译为 CPU。作者邀请对这些芯片感兴趣的合作者加入这项工作。

Tillet 的语言努力出现在 AI 硬件加速领域的一个有趣时刻。 Nvidia 面临来自 Cerebras Systems、Graphcore 和 SambaNova 等 AI 芯片和系统初创公司的激烈竞争。这些公司都有各种芯片架构，可以将并行计算分配给多个片上内核。事实上，SambaNova 的芯片有一个所谓的数据流架构，它共享 Triton 的一些原理。

然而，所有这些供应商都不得不开发自己的软件工具来优化 PyTorch 和 TensorFlow 程序到他们计算机的移动。相比之下，Nvidia 拥有 CUDA 十多年的开发经验和广泛的软件开发人员基础。

可以想象，Triton 可能是竞争对手为其芯片获得广泛的开源所需的新软件工具之一。

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。商机网仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 tenspace2022@163.com 举报，一经查实，本站将立刻删除。本文链接：https://www.315965.com/n/66481.html 聚才发母婴好物

、

0 0

澳大利亚数字部长避免立法人工智能伦理并将保持自愿框架

上一篇 2023年12月28日上午6:20

微软收购“支出情报”供应商 Suplari 以支持 Dynamics 365

下一篇 2023年12月29日上午12:05

百科分享

2024年平板性价比排行榜（平板电脑性价比排行2024年最值得入手的平板）

1、小米5pro 屏幕艳丽，支持HDR+，触感灵敏，自带的系统动画效果，逼真有趣，特别提一下，8个声道杜比音效，营造出震撼的效果，真的太棒了!骁龙870.打游戏、追剧、学网课都绰绰有余，没有压力可言。如果仅仅只是看视频，没有打游戏需求，那么配置稍低的小米5也是不错的选择。 2、华为HUAWEI MatePad 11 磨砂的手感超级棒，配置方面，2k屏120h…

神明
2023年8月3日
217
百科分享

宋哲宗的死因是什么？都有什么说法存在？

历史上的皇帝，他们的一生充满了传奇色彩，而他们的结局往往也是人们关注的焦点。宋朝的哲宗皇帝赵煦，他的一生充满了争议，而他的死因更是成为了一个历史的谜团。本文将带您揭秘宋哲宗的死因，还原一个真实的历史人物。一、宋哲宗的生平简介宋哲宗，名赵煦，字子瞻，是北宋第八位皇帝，年号元祐。他在位期间，推行新政，力图振兴国家，但由于政治斗争激烈，新政最终失败。宋哲宗在位…

2024年2月26日
34
百科分享

菜鸟驿站怎么申请开店需要多少钱（加盟快递代理站点大概需要多少钱）

随着时代的发展，随着网络销售的火爆，出现了很多的快递公司，菜鸟驿站就是刚刚出现时间不长的一家快递公司，但是很多人对菜鸟驿站吐槽严重。那么菜鸟驿站怎么申请开店？菜鸟驿站为什么不送货上门？菜鸟驿站为什么叫菜鸟驿站？针对以上三个问题，跟小编来一探究竟吧。菜鸟驿站怎么申请开店 1、要看您想申请合作的菜鸟驿站类型，不同类型操作方式不同，具体操作如下：个体站点：申请菜…

神明
2023年12月3日
171
百科分享

微信公众号怎么盈利(种什么果树最赚钱呢)

vxgongzhonghao如 1，利用个人vx号为vx公号宣传运兄缓营vx来自gongzhonghao不是叫用户直接vx360问答搜索某某关注，大家也不要忽略了个人vx号的作用。比如，个人vx有附近的人，摇一摇，添加手📱机QQ好友，添加手📱机联系人，朋友圈等功能。一定要结合起来使用，把用户引到gongzhonghao上。 2，手📱机陌陌留言板，附近人宣传…

神明
2024年1月31日
108
百科分享

明宣宗为什么只活了三十八岁？他为何英年早逝？

明宣宗朱瞻基，是中国历史上一位极具争议的皇帝。他在位期间，实行一系列改革，使国家政治稳重、经济繁荣。然而，令人惋惜的是，他仅在位十年，年仅三十八岁便英年早逝。那么，明宣宗为何只活了三十八岁?他为何英年早逝?本文将带您揭开这一谜团。首先，我们要了解明宣宗的生平。朱瞻基生于明成祖永乐二十二年(1424年)，是明成祖朱棣的孙子。他在位期间，推行“靖难之役”后的新…

2024年2月13日
34
百科分享

十一高速免费是几号到几号2024年（30号上高速十月一号下高速免费吗）

#头条创作挑战赛#距离2024年十一国庆放假时间相信大家都已经知道了，具体的放假时间为2024年10月1日至10月7日。今年国庆节的放假安排，调休上7天，在国庆节假期结束之后的星期六和星期天是直接调休上班。调休上7天，很多人事宁愿只放5天，还是先享受一下国庆假期吧，你是否出行的计划呢？国庆假期高速免费几天，具体是按上高速时间还是下高速时间来计算，高速免费是几…

神明
2023年11月29日
170
百科分享

倒车入库出来要打灯吗（科目二扣分项目修正技巧图解讲解）

国庆到了，你的心情一定是这样的。不过如果你的驾照还没学或者没考完，那一定要注意了！从今天开始被称为“史上最难”的驾照考试新规定就开始实施了，新修订的《机动车驾驶人考试内容与方法》里对驾照考试做出了很多新规定，总体来说一句话评价：更难了！更严了！驾考新规有啥更严格的要求呢？今天咱们来说说它。一、倒车入库限时，超时挂科新规定对倒车入库科目的时间做出了规…

神明
2023年12月9日
257
百科分享

15 年的 iPhone 使苹果公司开始营业

当他嘲笑第一款 iPhone 的到来时，当时的微软首席执行官史蒂夫鲍尔默明确表示他认为苹果没有成功的机会。自 Apple 于 2007 年 1 月推出 iPhone 以来，情况发生了很大变化。改变一切的产品当时，Apple 是一家 iPod 公司，也生产过时但性能不足的 PowerPC Mac。如今，iPhone 制造商的 iPad 吞噬了上网本“行业…

2024年1月3日
170
百科分享

2024身份证四级成绩查询官网入口（身份证号查询四六级考试成绩）

2024年上半年（6月）全国大学英语四、六级考试（含口试）成绩今天出炉！国家政务服务全国大学英语四、六级考试成绩查询服务输入姓名、证件号码或准考证号即可一键查询！无需电脑，掌上直达查询步骤第一步：点击下方葵花码进入“全国大学英语四、六级考试成绩查询”服务；第二步：进入页面后，选择考试科目，输入正确的姓名、证件号码或准考证号，点击“查询”…

神明
2023年11月29日
186
百科分享

科四能考几次啊?有补考费吗（科目四可以考几次补考要交钱吗）

驾照科目四理论上可以考“无数”次！但是这个理论次数有一个前提条件：那就是必须在科目一及格后的3年内完成考试并及格，如果在3年内科目四没有及格的话，前面所有的成绩就会被清零!本文就来具体分享一下科四考试次数的三个重要知识点：第一就是“首次考试的时间”；根据地区不同科目四的考试时间也是有所不同，但是主要有三种情况：科三科四联考的当天下午、9天内免预约以及科三及…

神明
2023年8月1日
184

OpenAI 提出开源 Triton 语言作为 Nvidia CUDA 的替代方案

相关推荐

发表回复