2021 年 MLOps 的状态

2021 年 MLOps 的状态

MLOps 市场是如何定义的,如果您想在您的组织中解决 MLOps,您应该寻找什么,有哪些选择?

这些都是与机器学习操作化高度相关的问题——不仅仅是因为 MLOps 达到了顶峰 (Gartner) 炒作。 一些人正试图解决全球及其他地区的 Gartner 中的问题。

Ori Cohen 和 Lior Gavish 就在其中。 他们的意见很重要,因为他们都是具有多年经验的机器学习从业者,他们的日常工作涉及 MLOps 的各个方面。

Cohen 拥有计算机科学机器学习、人工智能、实时脑机接口 (BCI) 的博士学位。 他目前是 New Relic 的首席研究员,最近公开了他的宠物项目——MLOps 状态。

Lior Gavish 的背景也是计算机科学,拥有广泛的机器学习以及商业和创业经验。 他与他人共同创立了 Monte Carlo,这是一家活跃于数据可观察性和数据可靠性的供应商,目前他在该公司领导工程。

我们采访了 Cohen 和 Gavish,讨论了 MLOps 的现状。

什么是 MLOps,它是为谁准备的?
首先,MLOps 到底是什么? 正如我们最近指出的那样,在相邻的数据和机器学习/人工智能领域不乏术语。 就 MLOps 而言,Cohen 提到了一个流行的图表,它有许多变体,其中机器学习处于中心位置,其他一切都围绕它放置。

“MLOps 实际上可以指与那个机器学习小盒子周围的空间相关的一切。你可以从数据和工程开始。数据科学分析、DevOps 基础设施系统、实验管理……两三年前,很多公司都是 进行实验管理。现在它还意味着对数据和数据管道的监控和可观察性”,科恩说。

Gavish 对此表示赞同,他将自己对 MLOps 的定义提炼为“帮助您在您感兴趣的某些约束条件下交付机器学习的实践和工具”。 对他来说,这涉及构建和部署的速度、可靠性和 SLA、安全性和合规性。

DataOps 和 MLOps 处于其生命周期的早期,Gavish 继续补充道。 这就是为什么会出现一定程度的混乱,而 Cohen 的工作是在这个空间中导航的宝贵工具。

Cohen 定义了许多表征 MLOps 解决方案的方面,他收集并验证了每个包含的解决方案的数据点。 其中一些,例如客户数量或总资金,很有趣,但在某种意义上也微不足道——它们可以适用于任何领域的任何公司。 我们的注意力被我们认为可能唯一适用于 MLOps 解决方案的许多方面引起了。

产品重点就是其中之一。 它指的是解决方案是否更侧重于数据、数据管道或两者。 一些解决方案监控和观察诸如模型的输入和输出、数据的漂移、损失、精度和召回准确度等事物。 正如科恩所说,其他一些人围绕数据管道做“相似但不同的事情”。

只有少数解决方案可以同时做到这两种情况。 他们中的一些人正在一个接一个地做,而另一些人则试图在事件之间建立关联,科恩继续补充道。 如果您的数据有问题,这可能意味着某些服务器出现故障,或者 CPU 处于 100%。 如果可以关联不同的输入,则可以更快地识别问题。 Cohen 指出,DevOps 和其他团队可以收到通知,这也是 New Relic 正在做的事情。

然后是角色方面,它确定了每个解决方案迎合的角色类型。 以数据为中心的解决方案可以满足数据科学家和数据科学主管的需求,也可以满足机器学习工程师和数据分析师的需求。 根据 Cohen 的说法,以数据管道为中心的解决方案更面向 DataOps 工程师。

高管也可以从 MLOps 解决方案中受益。 例如,通过为他们提供仪表板来监控在 GPU 上训练机器学习模型的成本或损坏的模型如何影响业务 KPI。

右、左、中功能
Gavish 指出,关注可观察性可能有助于识别背景差异。 在生产中运行的机器学习模型的可观察性与为这些模型提供数据的数据管道的可观察性非常不同。 那里有很多重叠,但人们使用的堆栈也有差异。

作为一家管道可观察性公司,Monte Carlo 专注于数据湖、数据仓库和分析仪表板,Gavish 继续解释说。 AI 可观察性解决方案可能更多地关注人们用来训练和部署机器学习模型的堆栈以及在该上下文中使用的框架和库。

对于 Gavish 和 Monte Carlo,未来的主要目标是缩短检测时间。 在过去的两年里,他们已经从几周或几个月缩短到了几个小时。 展望未来,目标是更接近分钟标记。

从某种意义上说,数据问题很复杂,因为基础设施中的操作问题可能会导致它们、数据漂移或某些代码更改而产生意想不到的后果。 加维什说,最终,他们还希望从一开始就帮助防止事故发生。 他声称,通过利用他们从数据健康问题中学到的知识以及如何检测和解决这些问题,这实际上是可能的。

MLOps 解决方案需要考虑的另一个方面是它可以应用的数据类型。 Cohen 指出,大多数解决方案都使用表格数据,因为它是最简单的用例,也是解决问题最多的用例。 一些解决方案现在正在转向图像和音频,以此作为解决其他用例和差异化的一种方式。

科恩分析中最复杂、最多样化的一个方面被重点介绍。 有右侧、左侧和中心的功能,它们也倾向于围绕每个解决方案的焦点聚集。 以数据为中心的解决方案提供的功能主要围绕漂移。 它可以是标签的数据漂移或概念漂移。

还有数据质量和数据完整性,根据 Cohen 的说法,这两者“可能相同,但有点不同”。 然后,我们有监控偏见和公平性,鉴于几个月前发布的欧盟 AI 法规,这越来越受到关注,再加上异常检测、分割、跟踪和一般的可解释性。

科恩发现,这些是人们入门所需的基础知识。 通常情况下,即使对 Cohen 来说,事情也不是完全简单的,他不得不着手进行相关研究,并直接询问供应商他们在幕后做了什么。

MLOps 状态是一个充满激情的项目。 它的根源可以追溯到 Cohen 号召数据科学家采取行动以监控与其模型相关的一切的动机,而不仅仅是模型本身。 作为写作的一部分,Cohen 研究了许多监控解决方案。

当 2 年后他再次访问这个空间时,他意识到那里有 30 多家新公司。 Cohen 的研究使 MLOps 领域的投资金额达到惊人的 38 亿美元,他预计该领域将出现整合。

然而,在此之前,The State of MLOps 项目正在扩展以包含更多工具,Cohen 越来越多地但很高兴地忙于尝试满足更多请求。 这项工作太好了,不能不分享,对于任何想要驾驭复杂的 MLOps 环境的人来说,它都是一个有用的工具。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。商机网仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 tenspace2022@163.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.315965.com/n/66508.html 聚才发 母婴好物

(0)
上一篇 2023年12月29日 上午1:30
下一篇 2023年12月29日 上午1:37

相关推荐

  • Apple 将 iCloud 密码引入 Windows,Microsoft 的 Edge源代码

    Apple 的最新产品版本直接针对 Windows 用户,这意味着您现在可以从 PC 管理您的 iCloud 密码。 Windows 版 iCloudApple 多年来一直为 Windows 提供 iCloud。 最新版本建立在已经可用的基础之上,增加了适用于 Windows 和 Microsoft Edge 浏览器的密码管理应用程序。 该公司今年早些时候为…

    2024年1月11日
    149
  • 外贸网站建设推广公司(新手需要知道的100个外贸网站)

    1.TOXUE外贸网 http://www.toxue.com/ 2.易创电子商贸 http://www.ectrade.com/ 3. 中国电子商务广场http://www.ecplaza.net/ 4.中国黄页 http://www.chinapages.com/ 5.外国企业中文网(亿经国际商贸网 http://www.chinae*http://ci…

    2023年8月8日
    134
  • 做抖音怎么找到适合自己的方向和位置(新手如何找到适合自己的领域)

    有人问我想要做抖音,不知道做什么方向,感觉自己是个普通人,其实我们大多数人说实在的都特别的普通,那比如说我这里给你举个例子,我之前呢,就有一个朋友叫周周,他是一个音乐老师,小学的一个音乐老师,并且呢,他是一个古风音乐人,他没事,课余时间就喜欢研究一下古风音乐,然后他还会自己唱唱的吧,我觉得还蛮好听的,他也是我身边唯一一个唱古风,这样的一个人。所以的话呢,我们…

    2023年8月13日
    287
  • Apple、辅助功能和 Project Titan

    我们知道 Apple 正在研发汽车。 我们认为这项工作的一部分将涉及为我们将要生活的世界建造交通工具,而不是我们现在所处的世界。 现在应该很清楚,未来的交通工具不一定是泰坦计划团队创造的唯一发明。 什么是汽车?这样看,在开发汽车的过程中,Apple 不得不识别和开发许多相关技术,包括但不限于:机器成像、人工智能、定位和地图技术、故障安全网络、边缘数据处理、众…

    2024年1月7日
    145
  • 郭元振与郭子仪:历史长河中的一段亲情纽带

    在中国的历史长河中,有许多杰出的人物,他们的故事被后人传颂,成为历史的瑰宝。其中,郭元振和郭子仪就是两位在唐朝时期有着重要影响的人物。那么,他们之间有什么关系呢?本文将以此为核心,探讨他们之间的亲情纽带。 首先,我们需要明确的是,郭元振和郭子仪并非同一时期的人物。郭元振生活在唐朝初年,而郭子仪则是唐朝中期的重要将领。尽管他们的活动时间并不重叠,但他们之间却有…

    2024年2月19日
    58
  • 如何使用ChatGPT写代码

    关于 ChatGPT 的一个更有趣的发现是它可以编写非常好的代码。 上个月,当我要求它编写一个我妻子可以在她的网站上使用的 WordPress 插件时,我对此进行了测试。 它做得很好,但这是一个非常简单的项目。 作为日常编码实践的一部分,您如何使用 ChatGPT 编写代码? 这就是我们要在这里探索的内容。 ChatGPT 可以擅长哪些类型的编码?关于 Ch…

    2024年1月3日
    141
  • 虾怎么做才好吃又简单(5道大虾的做法大全家常)

    大家好,我是秀厨娘,一个喜欢待在厨房里研究美食的姑娘,每天与大家分享一道营养美味的家常菜做法,如果您也喜欢做美食,欢迎关注,我们可以互相分享自己在做美食时积累的经验,互相学习,为家人和朋友做出更营养健康的美食。 马上就要过年了,很多家庭主妇或者家里的掌勺大厨,应该都开始琢磨,年夜饭给家人准备什么年夜菜了。给远道回家过年家人,亲戚朋友们露一手,也可以大展厨艺,…

    2023年8月6日
    250
  • 掌握徐溥的正确读音及发音技巧

    在汉语中,有许多字词的读音并不直观,需要我们通过学习和实践才能掌握。今天,我们就来探讨一下“徐溥”的正确读音及其发音技巧。 首先,我们要明确的是,“徐溥”是一个常见的中文名字,它的正确读音应该是“xú pǔ”。其中,“徐”读作“xú”,第二声,意思是慢慢地、不急促;“溥”读作“pǔ”,第三声,意思是广大、普遍。所以,“徐溥”这个名字的含义可以理解为慢慢地、普…

    2024年2月26日
    45
  • 庆历新政的参与者有哪些

    说到这个庆历新政在历史上也是非常的知名的,大家也是知道的,这个新政对于当时的宋朝来说还是有非常大的积极意义的,虽然不到一年失败了吧,但是为后来的王安石变法打了基础,所以很多人对这个庆历新政比较感兴趣,很多人也都在问这个庆历新政都有哪些人参与,这个问题非常值得学习,下面我们一起来分析揭秘看看。 1、庆历新政的参与者有哪些 范仲淹、富弼、韩琦、欧阳修、蔡襄、王素…

    2024年2月8日
    41
  • 长城,还是搞不懂互联网

      长城在营销上的改变是有整体性的。即都在向互联网化、网红化、年轻化、以及女性化的方向努力。很多言论确实出圈了,但也很容易引起争议。   作者|杨知潮 编辑|原 野 长城的市场存在感已经不比以往,但新闻却越来越多。 这次长城就搞了个大新闻,向有关部门举报比亚迪的两款混动车型油箱存在环保问题,上了一把热搜。 举报并非新事件。这份举报长城汽车…

    2023年12月26日
    156

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注