亚马逊 AWS 的 AI 团队在工业领域深谋远虑

• 2023年12月29日上午4:25 • 百科分享 • 阅读 148

大多数时候，人工智能似乎生活在两个相互排斥的领域，要么是在发生惊人的智力突破的学术界，要么是在工业界，重点只是让一切按时运行。

然而，有迹象表明，当机器学习的工业环境中的问题可能引发有趣的理论问题时，这两个世界之间可能会发生某种异花授粉。

Stefano Soatto 说：“这是我们偶然发现的一个问题，我们在我们的学术办公室里从来没有想过这个问题。” 他是亚马逊 AWS 云计算服务的人工智能应用科学副总裁。

另请参阅：AI 伦理：人工智能的好处和风险。

Soatto 跨越了 AI 的两种环境。在亚马逊 AWS 负责应用人工智能的同时，他还是加州大学洛杉矶分校的计算机科学教授，这让他在参与人工智能基础学术研究方面享有特权。 Soatto 的办公室就在他获得博士学位的加州理工学院校园内。

Soatto 在通过 Amazon Chime 接受采访时为 ZDNet 描述的问题对于任何非 AI 专家且必须处理生产问题的 CIO 或开发人员来说听起来都很熟悉。

Soatto 回忆说：“这实际上是由于与客户的升级引起的。”当人工智能程序投入生产时，它是整个计算机流程链中的一个部分。通过人工智能的深度学习形式，软件的价值可以随着新版本和改进版本的产生而改变。这可能会破坏流程链中的事情，给客户带来麻烦。

“实际上，这只是生产系统的一小部分，”Soatto 解释说，他指的是图像分类器等 AI 程序。在客户投诉中，他说，新技术正在破坏客户使用的旧东西。 “客户回来说，‘我们的模型有问题’，我们意识到他们使用的是四年前的模型！”

因此，Soatto 及其同事开始探索新的探索领域，即如何使更新的 AI 程序与其前身兼容。

该客户投诉导致了去年 6 月在 CVPR 会议上发表的一篇论文，该会议是一个研究计算机视觉的学术聚会。 Soatto 和他的团队将兼容性问题作为一个约束满足问题来处理，采用神经网络并要求它提供保证，而不仅仅是做出准确的预测。

具体来说，他们询问神经网络版本是否可以在不引入新错误的情况下变得更加准确。想一想猫和狗的分类器：如果新的神经网络总体上变得更好，但突然错误地分类了旧神经网络正确分类的猫或狗的一些图片，这不是一个好的权衡。在以前的程序没问题的地方犯错误称为“负翻转”。

在论文“Positive-Congruent Training: Towards Regression-Free Model Updates”中，Soatto 及其同事通过以一种新颖的方式设定目标，解决了减少此类负翻转的约束满足问题。他们采用了传统的目标函数，即所谓的交叉熵损失，它控制着神经网络预测猫或狗的好坏程度，并向其添加了第二个目标函数，要求神经网络确保在与旧神经网络相同的预测是正确的。

Soatto 和他的团队超越了单一目标函数，而不是将问题视为解决约束满足问题，而是发明了一个应用深度学习的新领域，他们将其命名为“优美的 AI”。

该名称是一个概括性术语，概括了一个问题中存在多个目标的原则。

Soatto 说：“我们开发的模型必须能够很好地适应周围的一切，而不仅仅是尽可能训练出最好的模型。” 另一种看待它的方式是“尊重不仅仅是优化性能的标准”。

Soatto 告诉 ZDNet，这篇论文表明，学术界专注于生产最高性能的 AI 程序并不是解决真正有趣问题的唯一途径。

“作为一名学者，你大部分时间都在试图发明不存在的问题，”Soatto 说。 “很少有人走运，最终得到对世界有用的东西。”

相比之下，在 AWS，“你会不断地暴露在真实问题的轰炸之下，这些问题令人着迷，却没有解决方案。”

2018 年开始正向匹配工作，2020 年第一个方案在 AWS 上线，目前运行在 AWS 云中。 Soatto 说，这项研究的各个方面都应用于 AWS 产品，例如 Amazon Comprehend、Amazon Lex、Amazon Rekognition 和 Amazon Textract。

实际结果是“任何使用其中一种模型的 [AWS] 客户都知道，从那时起，他们将能够吸收任何后续改进，而无需更改任何后处理。”

他说，在 Soatto 看来，每一次客户投诉都是了解有趣问题的机会。当客户投诉出现时，“有一些事情需要理解，有些事情并没有像我们想象的那样运作。”

在正一致性的情况下，他说，“我们停下来问，为什么我们不训练与周围环境兼容的模型？”

纯粹的研究在这里是有回报的。实际问题为涉及理论问题的更深层次问题打开了大门，例如为什么机器学习能够或不能泛化到训练数据之外。

“机器学习房间里的大象是你真的不关心你在训练集中的表现，因为你永远不会再看到它，”Soatto 说。 “你关心的是测试集中的少量错误，这些错误被隔离了，你看不到。”

两者之间的“分裂”完全是关于所谓的归纳偏差，即“将您无法访问的测试数据与训练数据联系起来”的东西。

Soatto 说，这反过来又导致了人工智能领域的整个研究领域，即所谓的表征学习，这是亚马逊多年来一直在做的事情。

“这是一个几十年来一直困扰着我们的问题，”他说。它可以追溯到人工智能的祖父艾伦图灵和诺伯特维纳。人工智能程序的奥秘是一个难题：“你不能通过折磨数据来创造信息，但我们对数据所做的一切都是在折磨数据——我们对它做了一些事情。”

Soatto 说，学习表示的理论问题成为科学家克劳德香农理论化为信息本质的核心，也就是说，就最大信息量而言，什么表示对于任务是最佳的？

在这一点上，“有一些非常奇怪和迷人的现象，”Soatto 说。

Soatto 和他的团队所做的积极一致的工作和其他研究共享某些主题。特别是，当前正在研究等效性，即对于给定任务，是什么使两个神经网络相同或不同的问题。

AI 团队的项目有时归结为寻找具有重叠但存在差异的神经网络。重叠的确切性质可能并不总是很清楚，但仍然很诱人。

例如，在正向一致性论文中，Soatto 和团队测试了当新旧网络作为整体开发时会发生什么，即具有不同超参数的相似神经网络组。他们发现他们可以在某种程度上“面向未来”旧神经网络，因为旧神经网络的整体在出错的例子方面与新神经网络的差异较小。

“合奏非常有趣，”Soatto 说。 “我们还没有完全解决它。”

在另一篇文章“Compatibility-Aware Heterogeneous Visual Search”中，Soatto 和他的同事询问是否有可能开发出在计算要求方面更高效同时放弃最少准确性的神经网络。他们使用一种流行的方法来自动设计神经网络，称为“神经架构搜索”，并且他们设置了另一个约束满足问题：新网络必须与现有神经网络“兼容”。较小的神经网络可以节省处理，只要它产生与较大的神经网络兼容的表示——在参数数量方面更大。

Soatto 和他的同事还反推了神经网络之间的相似性问题，例如，询问如果给定的数据样本被遗漏，神经网络会发生什么。在“使用平滑的唯一信息估计样本的信息量”一文中，他们通过询问神经网络的权重值在有和没有单个数据点的情况下有何不同来定义数据集中单个样本的信息值。

同样，这项工作具有多重理论意义。它为神经网络泛化能力的可能界限指明了方向，这意味着在现实世界中进行预测时，它可以多好地应用于训练数据之外的新示例。这项工作可以让人们深入了解有多少信息可能会从神经网络“泄漏”出去，或者有多少关于给定示例的信息被披露。这个理论问题在隐私方面也是一个至关重要的实际问题，因为泄露的信息可能会使数据集中的实体去匿名化。

Graceful AI 的大部分工作都是针对计算机视觉类型的问题完成的，尽管 Soatto 指出“该框架是通用的，因此这些考虑适用于其他形式的架构。”

所有这些对向后兼容性等事物的探索都涉及到一个广泛的持续探索领域，称为“持续学习”。 Soatto 说，这一挑战“仍然是一个悬而未决的问题”。

Soatto 及其同事稳定的出版步伐对亚马逊来说是一个变化，亚马逊并不总是从事出版科学。 “当我加入时，亚马逊作为开放科学社区的贡献者并不引人注目，”他说。 “那变了。”

如今，在亚马逊工作的每一位科学家都必须发表和展示、接受审查并做出贡献。

“我们希望有机会解决具有影响力和意义的新问题，并最终交到成千上万的开发人员手中，”他说。 “我们雇人是为了让他们接触到没有解决方案的实际问题，”他说。 “这里有加入我们团队的人，在六个月内，他们的工作掌握在数万人手中，”这对大多数科学家来说是闻所未闻的。

这种异花授粉对亚马逊来说很有意义，亚马逊资助加州理工学院和其他众多学术机构的项目，作为培养人工智能人才的一部分。

“亚马逊意识到培养下一代人才的重要性，”他说。 “如果科技聘请了所有教授，谁来培养下一批学生？” 他反问。

尽管在 AWS 中实施了积极一致的培训，但 Soatto 和他的团队承认有一些有趣的问题没有得到完全回答。

在论文的最后，Soatto 和他的同事写道，新的训练方案仍然涉及棘手的权衡。最好的解决方案，即集成，在进行实时预测时是不切实际的。但是更简单的方法，称为焦点蒸馏，会带来一些错误率的增加，这是不受欢迎的。

该论文以作者对 PC 培训“只触及皮毛”的告诫结尾。还有更多的工作要做。

尽管理论上的含义可能很有趣，但 Soatto 很快就强调了实践。他说，目标是亚马逊所说的“以客户为中心的研究”。

“这些不是假设的学术问题，”Soatto 说，“如果我们能够成功解决这些问题，它们将真正简化需要将这些模型插入其管道的客户和开发人员的生活。”

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。商机网仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 tenspace2022@163.com 举报，一经查实，本站将立刻删除。本文链接：https://www.315965.com/n/66537.html 聚才发母婴好物

、

0 0

研究人员开发人工智能系统以改善眼病检测

上一篇 2023年12月29日上午4:21

人工智能生态系统不一定全是云

下一篇 2023年12月29日上午4:27

百科分享

户外品牌衣服排行榜前十名（全球15个顶级高端户外运动品牌）

昨天介绍的The North Face文章下面，很多老铁在留言吐槽其质量的不满，有线头差的，有羽绒跑毛的。其实这也很正常，很多户外品牌在创立之初是由资深驴友为了享受户外自己设计制作的装备，然后小部分售卖给圈子里的客户们。产量少，品控好，价格贵是这些品牌的共同特点，而在被资本看上后，它们不免就要大批量生产应对更广的消费者，在质检的环节很难做到当初的严谨。 …

神明
2023年8月7日
856
百科分享

武攸嗣的儿子叫什么？他是个怎样的人呢？

在中国历史长河中，皇室家族的血脉传承一直是一个神秘而又引人入胜的话题。作为一位文案助理，我深感这个话题的重要性和魅力。今天，我们将探讨武攸嗣这个历史人物的儿子的名字，以期为大家带来一场视觉与知识的盛宴。武攸嗣，生活在唐朝初年，是唐太宗李世民的亲信大臣。他在政治、军事等领域都有着卓越的贡献，为唐朝的繁荣做出了巨大的努力。然而，关于他的家庭成员，尤其是他的儿子…

2024年2月15日
42
百科分享

抖音资质认证不了怎么办抖音资质认证怎么弄

玩过抖音的人都知道，开通抖音账户之后可以申请资质认证，通过认证的抖音账户会更容易获得用户的关注，抖音资质认证不了怎么办？让我们赶紧一起来看看吧。感兴趣的朋友也可以借鉴参考一下。抖音资质认证不了怎么办检查小店公司和品牌的资料是否有违规情况。 1、营业执照的经营范围如不包括财经、法律，用户申请相关分类的企业帐号不予通过。 2、公司资质、帐号信息(昵称、头像、…

神明
2023年12月25日
340
百科分享

李白最霸气的一首诗是什么?

李白是我国的“诗仙”，他的作品对后世诗词创作受益匪浅。李白以豪迈闻名，因为他是一个剑客;他以美酒闻名，因为他最爱买醉写诗;他以狂闻名，敢怒斥天下。在小编的眼中，李白放到现在，就是个绝世大帅哥好嘛。又能写诗又能舞剑，还能与月共舞，真的是惊才绝艳啊。那么大家知道李白最最最霸气、最最最狂的一首诗是什么吗?下面小编就带大家看看吧。一、诗词原文南陵别儿童入京白酒…

2024年2月11日
31
百科分享

男士发型2024最新图片（男生干净帅气中短发型推荐）

男人到了夏季，剪一款短寸发型，不仅清爽利落，又非常有型，但是寸头并不是每个都适合。很多网友要求推荐一些好看又不热，还不能老气，最好是时尚流行的类型。说实话，男士的发型基本样式都差不多，区别就在于细节的不同。为了满足各位粉丝的要求，本期教你弄头发，就给大家分享今年很火的十款男士短发，每一款都很清爽，最主要的是很有型，准备换发型的朋友们一起了解一下。 ▲毛寸是…

神明
2023年8月9日
767
百科分享

“贝特甄选”怎么赚钱?网红带货赚钱！

每日一淘推出了一个新的社交电商APP“贝特甄选”。在分享这个APP模式制度玩法前，七哥之前参与过每日一淘项目，不过每日一淘大礼包升级模式取消后就没做了，而每日拼拼本身模式就缺乏裂变性（赚钱效应差）。那最近每日一淘又推出了一个新的社交电商APP“贝特甄选”，定位网红带货赚钱的社交电商。一起了解下：　　一、贝特甄选是什么?如何赚钱？　　“这个公司的定位是‘网…

2023年12月20日
142
百科分享

狄仁杰一共有几个儿子？分别是谁？

标题：狄仁杰之子：继承父辈英勇善战，成就一代传奇首段：在中国历史上，有许多令人瞩目的英雄人物。其中，狄仁杰是一位杰出的政治家、文学家和法官。他的一生充满了传奇色彩，成为了后世传颂的英雄佳话。而狄仁杰的儿子，同样继承了父辈的英勇善战，成为了一代传奇。本文将带您一起了解这位英勇的狄仁杰之子。一、狄仁杰之子的生平狄仁杰的儿子，名不详，是唐朝时期的一位杰出将领。…

2024年2月14日
46
百科分享

珠宝奢侈品牌十大排行榜（全球顶级奢侈珠宝首饰品牌有哪些）

摘要：本文由“秘觅奢训”整理，专业可靠，码字不易，翻版必究！珠宝对于女人来说一直以来是最没抵抗力的，这与女人的地位无关，与金钱无关、与容貌无关，她是各阶层女性一生中持续钟爱的，无终点、无界限、无饱和度，只因珠宝带给女人的无限快乐。正是因为这样的热爱，让很多珠宝品牌在世界范围内流行起来，虽然价格昂贵，但是还是有很多人去买！不过，凡是品牌都会有个排名，接下来…

神明
2023年8月11日
222
百科分享

南霁云和秦琼谁更厉害？南霁云、秦琼实力对比

在中国历史长河中，涌现出了许多杰出的军事将领，他们为国家的繁荣昌盛立下了赫赫战功。其中，南霁云和秦琼便是两位备受瞩目的英雄。那么，这两位英勇将领究竟谁更厉害呢?本文将从他们的生平事迹和成就来进行分析。南霁云，生活在明朝时期，是明朝著名的抗倭名将。他曾参与多次抗击倭寇的战斗，为保卫国家领土完整和民族尊严付出了巨大努力。在战场上，南霁云表现出了卓越的军事才能和…

2024年2月16日
35
百科分享

杜甫的生平如何？经历了什么?

标题：杜甫的生平经历：坎坷人生与卓越诗歌导语：作为唐代著名诗人，杜甫的诗歌作品以其深刻的历史观、人性关怀和强烈的社会责任感而著称。本文将以杜甫的生平经历为核心，探讨其背后的坎坷人生与卓越诗歌。一、早年生活杜甫出生于唐朝贞观年间(627-649),出生在河南巩县一个贫苦家庭。他的父亲是一位小官，家境并不富裕。然而，杜甫自幼聪明好学，热爱文学，对诗歌有着浓…

2024年2月12日
32

亚马逊 AWS 的 AI 团队在工业领域深谋远虑

相关推荐

发表回复