AI 初创公司 Snorkel 为企业 AI 准备了一种新型专家

AI 初创公司 Snorkel 为企业 AI 准备了一种新型专家

在人工智能的最后一次大热潮中,在 70 年代末和 80 年代,一种流行的方法被称为专家系统,包含基于人类知识输入计算机的任务规则的程序。

专家系统最终失败了,因为它们都被证明太难编纂——专家真正能表达他们所知道的是什么? — 而且构建和维护起来也太费力了。 换句话说,他们没有扩展。

周三,总部位于旧金山的成立三年的人工智能初创公司 Snorkel 推出了一种工具,正如他们所说,在开发神经网络时,将人类领域的专家带回了驾驶座。 网络。

Snorkel 的以数据为中心的基础模型开发,正如该产品的名称,是对初创公司旗舰 Snorkel Flow 程序的增强。 这些新功能让公司可以编写函数,使用所谓的基础模型自动创建标记的训练数据,这是现有最大的神经网络,例如 OpenAI 的 GPT-3。

Snorkel Flow 中的新功能让领域专家而非程序员创建一个工作流,然后自动生成标记数据集,这些数据集可用于为特定任务训练基础程序。

Snorkel 联合创始人兼首席执行官亚历克斯拉特纳在通过 zoom 接受 ZDNET 采访时表示:“我们很高兴能够提高非开发人员的技能并赋予主题专家权力,从而能够推动更多的人工智能制造过程” .

Ratner 说:“这些人拥有领域知识,而且他们经常被孤立地手工标记数据。” “我们希望他们坐在他们应该坐在的地方,我们认为他们需要的地方,坐在驾驶座上,与数据科学家共同驾驶或独自领导。”

GPT-3 以及 OpenAI 的 Dall•E 2 和谷歌的 RoBERTa 等基础模型越来越流行,因为它们能够生成文本和图像,然后可以将其应用于自动化客户服务机器人等广泛的企业任务 到创建公司文档到创建股票摄影。

基础模型是数据大户。 GPT-3 由 Open-AI 在 2020 年使用流行的 CommonCrawl 数据集从 2016 年到 2019 年的网页进行了训练,其中包含 45TB 的压缩文本数据。 OpenAI 必须将其管理到可管理的 570GB 数据。 对于大多数公司来说,训练这样的模型是望而却步的。

一些基础模型,例如 GPT-3,可以作为云服务访问,这减轻了希望使用它们的企业的一些负担。 公司可以租用模型并进行一些调整以适应他们的用例。

但是为了有效地使用基础模型,公司仍然必须根据特定用例调整模型的功能,例如法律或营销,这就是所谓的“微调”模型。 捕获必要的领域知识可能需要数十 GB 的新数据,以及适当的标签含义和程序提示。

拉特纳说,“企业对深度学习 AI 总是存在这种幻灭的问题,并且感觉,嘿,我们对 AI 的重视程度太低了,开源中有这么多 世界,我们的企业组织内部有那么多东西,为什么我们不快点行动呢?”

他说,公司行动不快的原因往往与那堆数据有关。

另外:“软件中正在发生奇怪的新事物,”斯坦福人工智能教授 Chris Re 说

“一直都是,数据呢?” 拉特纳说。 特别是,这些模型所依赖的标记训练数据,甚至在基础模型时代仍然依赖,以针对特定用例进行调整和微调,尤其是我们看到的企业中复杂的高性能数据 我们的顾客。”

Snorkel 的 Snorkel Flow 软件是一项商业成果,源于 Ratner 和其他研究人员于 2015 年开始在斯坦福大学人工智能实验室进行的开源学术研究。 这项工作促成了与谷歌研究人员共同开发的项目 Snorkel Drybell,拉特纳称该项目在谷歌内部产生了“巨大影响”。

Drybell 程序提供了一种构建规则的方法,这些规则随后会自动为数据生成标签,从而为人们标记每条数据节省了大量的手动工作。

在此过程中,Ratner 观察到实施规则引擎真的很困难。

“花了 6 到 9 个月的时间来确定围绕它的工作流程,然后才能部署它,”Ratner 回忆起 Drybell 计划时说。 “那是一个灵光一现的时刻,”他说。

他说,Drybell 是“几个例子之一,它展示了在现实世界中产生影响的潜力,但也表明必须进行多少工程和优先工作才能弥合这一差距,这是最终分拆公司的一个重要动机 2019年。”

可能需要一个商业包来帮助公司使用这种方法。

Ratner 和他的论文导师 Christopher Re 以及其他三位同事继续在 2019 年成立了这家公司,获得了 Greylock Partners 和 In-Q-Tel 等著名风险投资公司的风险投资。

Re 也是 AI 硬件初创公司 SambaNov Systems 的创始人,还有 Ratner 的另一位顾问、斯坦福大学计算机科学教授 Kunle Olukotun。

借助新的模型开发功能,Snorkel 解决了非常需要数据的程序的问题,并将其转变为头脑。 与其为像 GPT-3 这样的大型程序提供训练数据,不如使用这些模型的生成功能为更小的神经网络生成训练数据,甚至为与神经网络无关的 AI 形式生成训练数据。

“我们开始试验,”Ratner 说,“有了这样的想法,而不是试图找到一个基础模型并将其插入生产,使用基础模型自动标记数据以加速以数据为中心的开发循环,然后寻找 一个不同的可部署模型。”

模型开发套件包含三个组件,可以单独使用或组合使用。 一种是将文本提示与自然语言查询一起使用,这将提示基础模型生成数据标签作为输出。

这些自然语言查询可以是领域专家知道如何表述的内容,例如“这些合同文件是否与商标问题有关?” 然后,该查询成为一种让程序应用标签来确定文档是否与商标相关的文档的方法。 然后,总输出成为标签,用于训练分类器将文档分类为与商标相关或不相关。

模型开发工具的第二个选项是所谓的“热启动”。 基础模型在显示零个或几个示例时自动生成输出的能力——零样本和少样本学习——成为一种自动生成数据标签的机制。

并且,第三个选项,基础模型本身可以通过应用一个较小的数据集来使用,该数据集可以简单地“微调”大型基础模型。

这三种方法背后的想法是,基础模型本身是“构建的基础,但它们并不能神奇地解决你现实世界中的所有问题。”

“你仍然需要在它们之上构建。你必须对它们进行微调,弄清楚如何部署它们,”拉特纳说。

“我们正在以多种方式将基础模型嵌入到该工作流程中以加速它并从根本上弥合差距。”

一些客户已经使用模型开发功能几个月了,他们发现构建机器学习程序所需的时间大大减少了。

此外:AI 挑战者 Cerebras 组装模块化超级计算机“Andromeda”以加速大型语言模型

Ratner 回忆起一个客户的例子,该客户是排名前五的银行,他们希望训练一个人工智能程序从银行文件中提取与反洗钱问题和了解你的客户有关的内容。

该任务涉及扫描 PDF、数百页的文档,“非常复杂,非常定制,”拉特纳说,而且“出于监管原因,对于银行正确提取这些内容非常关键”。

“如果你试图手动构建一个带标签的训练集来训练 ML 进行这些提取,那将需要数月的专家法律时间”,一位人类领域专家说。 Ratner 说,Snorkel Flow 软件能够将时间缩短到几周。

“这种基础模型功能真正令人兴奋的结果实际上是通过使用基础模型热启动然后自动标记数据,将时间缩短到数小时或数天。”

模型开发能力指出了深度学习的一个基本事实,Ratner 说:现在它更多地是关于数据而不是关于特定的神经网络架构,至少从花费最多劳动力的地方来衡量是这样。

他补充说:“就数据科学家为使某事发挥作用所做的平均迭代而言,人工智能正变得更加以数据为中心,而不是以模型为中心。” “数据科学家实际上正在做很多工作,试图标记与改进和迭代数据相关的标签”,而不是修改模型。

Ratner 指出,Snorkel 的客户以前不得不花费六个月或更长时间手工标记数据,然后才能运行单个程序。

使用模型开发套件不需要运行标记任务的人员了解基础模型。 然而,如果有人碰巧对基础模型的细节感兴趣,“我们在幕后有一些好东西,”他指出,例如为基础模型编写自定义提示或提示模板的能力。

通过翻转范式,基础模型可以更有效地帮助更小、要求更低的模型,最终性能更好。

Ratner 说,通过使用基础模型的一般功能,可以“加快对现有和运营基础设施中的这些专业部署模型的培训”。 “你实际上可以获得比大型基础模型小 10,000 倍但在目标任务上更准确的模型。”

Ratner 说,最终程序可能是一个简单的回归模型或 XG Boost 或另一种方法。 这样的模型还有一个额外的优点,即它们不仅更容易在生产中运行,而且比通用的预训练程序(如 GPT-3)更准确,而且它们通常也比众所周知的黑色更易于解释和管理。 一盒大型神经网络。

“这类用例通常有更严格的管理,”了解你的客户等企业应用程序的 Ratner 说。

Ratner 认为,模型开发功能在某些方面对将人类主题专家重新置于核心角色的旧专家系统方法有所帮助。

“你如何将你可以通过规则或启发式表达的专家系统知识,或者现在提示中的一个问题,与这些统计模型的大量泛化能力结合起来?” 是一种思考方式。

“不要让你的主题专家只点击 10,000 个合同,就像你在玩 20,000 个问题一样,”他建议道。 “让他们写下他们的领域知识——同样,以前,我们称之为标签功能,现在我们以提示的形式提供它,这是另一种类型的标签功能。”

人类的努力被用来“引导和训练一个模型,该模型可以概括为现代人类模型非常擅长吸收和识别的模式的长尾。”

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。商机网仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 tenspace2022@163.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.315965.com/n/66822.html 聚才发 母婴好物

(0)
上一篇 2024年1月1日 上午3:16
下一篇 2024年1月1日 上午3:24

相关推荐

  • 李隆基杀了太平公主,为什么放过了她的儿子薛崇简?

    李隆基,唐朝的第七位皇帝,以他英明的政治才能和深远的历史影响而闻名于世。然而,他的一生并非一帆风顺,其中最引人关注的就是他对太平公主的处理。据历史记载,李隆基在夺取皇位后,杀了太平公主,却放过了她的儿子薛崇简。这一事件引起了人们的广泛猜测和讨论,为何李隆基会对太平公主下此狠手,却又对她的儿子宽大处理呢? 首先,我们需要了解的是,太平公主是唐高宗李治和武则天的…

    2024年2月22日
    43
  • 剑魂怎么加点战斗力最高(2024最新版本新手技能天赋加点推荐)

    今日,小编为大家带来DNF110级剑魂刷图加点推荐。 在当前版本中,剑魂在装备的基础上刷图效率高,技能范围大,清怪快,最重要的是帅气。 在小技能上,拔刀斩、流星狂、跳跃、升都要加满。如果进图暴击不满,就要点满暴击。正常情况下,剑神的暴击很容易满。 猛龙断空斩和破军升龙击两个任选一个点满就行了,小编建议点满猛龙断空斩,这个技能在有护石的情况下范围大,更方便清怪…

    2023年12月10日
    283
  • 旅游自助游攻略大全(自由行之前必须做好的准备)

    掐着指头算下来,不知不觉退休后六年里,自由行已走过98座大小城市。回望一路走下来感觉挺有意思的,没想到自己老了老了也能独立走出去看世界了。想想当初真的是逼出来的自由行,退休后,有了闲暇时间又喜欢出去玩,每年跟着旅行社出游三两次,感觉不过瘾满足不了自己那种想看世界的愿望,跟着旅行社既花费多又不自由,自己就想能不能采取自由行的方式?自己想去哪就去哪?那该多自由啊…

    2023年12月14日
    166
  • 一家餐厅是如何利用“人性营销”,每天利润增长至少10%以上?

    KFC的餐厅经理主要做一些什 肯德基公司进入中国17年来,累计培训员工20万人次,基本培训资金投入超过2.4亿元。 “肯德基独特的人性化管理方式,让员工实实在在地感受企业所给予的家庭般的关怀,从而热忱地提供服务。”王群说,先进的管理依靠优秀的人才才能实现,人才培训则是味造就优秀人才的必然途径。肯德基不断投入资金、人力对员工进行多方面各层次的培训。从餐厅服务员…

    2024年1月22日
    139
  • 李文忠:朱元璋的养子与明朝的功臣

    李文忠,字景明,号东篱,明朝开国功臣,朱元璋的养子。他出生于元朝至顺四年(1333年),祖籍浙江绍兴。李文忠的父亲李贞是元朝末年的一名普通士兵,因战乱而家破人亡,李文忠被朱元璋收养。 李文忠自幼聪明好学,勤奋刻苦,深得朱元璋的喜爱。在朱元璋的培养下,李文忠逐渐成为一位杰出的军事将领。元朝至正二十三年(1363年),李文忠随朱元璋攻占应天府(今南京),立下赫赫…

    2024年2月11日
    40
  • 在vb中怎么图片框中放入图片(代码属性导入添加图片方法)

    应用实例: 给VB程序加菜单图标: 在VB里面加图标比较麻烦,你需要用到API函数进行调用,参数不好理解: 给菜单添加图标的API函数:GetMenu、GetSubMenu、GetMenuItemID、SetMenuItemBitmaps。 写代码前你要把ImageList控件放到窗体上,如果工具栏中找不到它,通过“工程”菜单下的“部件”进行添加: 将Ima…

    2023年12月13日
    336
  • 6 种适用于远程团队的虚拟协作解决方案

    如此多的雇主还没有看到现代员工体验对自主性和灵活性的需求超过他们对存在的需求。 毫不奇怪,自从大流行来袭以来,技术人员一直在忙于构建协作工具以支持分布式混合工作的未来。 以下是公司可用的一些虚拟协作工具。 为什么这些工具很重要每项调查都表明,员工更愿意找一份新工作,而不是回到基于存在的微观管理的糟糕旧时代。 返回工作场所促进协作的论点可能有一定的分量,但这在…

    2024年1月8日
    130
  • 水果店微信营销这么做,生意火爆(水果网络营销)

    vx卖东西怎么 问题一:我想在vx上卖东西,有什么好的宣传方式吗! 想在vx上卖东西怎么宣传?一般都是做引流和推广的亲。 好比你是婴儿产品的,那你要找的是年轻的妈妈,然后去以分享的形式,让他们水掌异来主动加你,这样才能达到最好的效果要加对你东西感兴趣的精准客源 问题二:vx上卖东西怎么做宣传 多加点好友。刷刷朋友圈。也可以弄弄漂流瓶 问题三:vx卖东西怎么宣…

    2024年1月20日
    115
  • Apple 是否发明了一枚戒指来统治它们?源代码

    一家已经创建了出色的辅助功能解决方案并准备引入混合现实设备的公司在手势控制方面做了什么? 显然,制作一个智能戒指来控制体验。 苹果发明了一个戒指来统治他们我们认为我们知道苹果将很快推出其首款混合现实眼镜。 多年来,它一直在为这样的发布开发 UI 组件。 我们真的不知道他们什么时候会出现。 这种猜测已经成为我们等待已久的礼物,现在猜测是不明智的,尽管有人说我们…

    2024年1月9日
    133
  • 想做视频号?你需要知道这13点经验

    我想做一个视 如果你想做精细一点,现在就开始学premiere吧,书店买书或者网上找教程(推荐***.com)简单上手大概2天…ae上手真的太慢了…

    2024年1月25日
    120

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注