H2O.ai 将 AI 大师驱动的 NLP 引入企业

H2O.ai 将 AI 大师驱动的 NLP 引入企业

世界上大约有 1200 名国际象棋大师,而 AI 大师只有 250 名。 在国际象棋中,就像在 AI 中一样,特级大师是为顶级职业棋手保留的荣誉。 在 AI 领域,这一荣誉授予 Kaggle 进程系统中表现最好的数据科学家。

H2O.ai 是一家人工智能云公司,在 2021 年底的 E 轮融资中筹集了 1 亿美元,目前估值为 16 亿美元,雇用了全球 10% 的人工智能大师。 该公司刚刚发布了 H2O Hydrogen Torch,该产品旨在为企业带来图像视频和自然语言处理 (NLP) 的 AI 精通技术。

我们与 H2O 首席执行官兼创始人 Sri Ambati 取得了联系,我们讨论了从 H2O 的起源和整体产品到 Hydrogen Torch 以及它在 AI 领域中的位置等方方面面。

H2O:人工智能堆栈
几十年前,Ambati 首次开始使用 AI 为印度太空研究计划进行语音到文本的翻译。 随后,他偶然发现了当时处于早期阶段的神经网络。 作为硅谷的移民,他花时间在初创公司工作。 他还在伯克利和斯坦福大学休假期间结识了数学家、物理学家和计算机科学家。

Ambati 与他们合作,为 H2O 的开源基金会奠定了基础。 但直到他的母亲得了乳腺癌,他才“受到启发,要为每个人普及机器学习”。

正如他所说,Ambati 着手将 AI 带到每位医生或数据科学家的指尖,以解决对社会有价值的问题。 为此,他继续补充说,必须重新发明大规模的数学和分析。 这导致了 H2O,汇集了编译器工程师、系统工程师、数学家、数据科学家和大师,以便非常快速地轻松构建高价值和高精度的模型。

多年来,H2O 建立了一条完整的产品线来实现这一点。 Ambati 说,当 H2O 于 2012 年启动时,可扩展的开源 AI 基础存在差距。 有像 R 和 Python 这样的语言允许人们构建模型,但它们非常慢或脆弱或功能不全。 按照 Ambati 的说法,H2O 的贡献在于他们构建了“世界上最快的距离计算器”。

这是对深度学习中用于矩阵乘法的核心数学的引用。 当你可以计算两个长张量之间的距离时,Ambati 继续补充说,你可以开始在高维和低维数据中生成丰富的线性和非线性数学。

该贡献是 H2O 开源框架的一部分。 Ambati 将这种低级基础称为“AI 的汇编语言”。 然后是 H2O 集成框架和开源社区,例如 Scikit-learn、XGBoost、Google 的 TensorFlow 或 Facebook 的 PyTorch。 H2O 团队开始为这些做出贡献,同时最终在后来被称为 AutoML 的地方整合了一个集成框架。

H2O 在该领域的产品是 H2O AutoML,基于 H2O 开源和 XGBoost,以及更广泛的产品,称为 Driverless AI,它是闭源的。 两者都以时间序列数据为目标,这些数据是许多企业用例的支柱,例如客户流失预测、欺诈预防或信用评分。

根据 Ambati 的说法,在过去四年中,无人驾驶 AI 一直是“H2O 经济的引擎”。 它帮助 H2O 获得了数百家客户,占财富 500 强的一半以上,包括 AT&T、花旗、第一资本、葛兰素史克、日立、Kaiser Permanente、宝洁、贝宝、普华永道、利洁时、联合利华和沃尔格林。

Ambati 将这一层称为“人工智能的编译器”。 这就是 H2O 开始使用大师级方法的地方:将问题空间划分为许多菜谱,为每个菜谱分配 Kaggle 大师级大师,目的是提炼他们的知识,使地面团队的工作变得更容易。

建立良好的机器学习模型后的下一阶段是安全地运行该模型。 数据本身就存在偏差,而有偏差的模型不应在没有受到质疑的情况下投入生产。 找到盲点并进行对抗性测试和模型验证,部署模型,然后将其集成到软件构建的 CI/CD 中,这就是 Ambati 所说的“AI 的中间件”。

这通过 H2O(AI 云)提供的混合云、内部部署和边缘产品来解决。 客户通过应用程序使用它:有一个 AI 应用程序商店、一个预建模型商店和功能商店,从模型构建中获得的见解具体化。 AI Cloud 也是多云的,因为客户需要选择。 然后还有 H2O Wave——按照 Ambati 的说法,这是一个用于构建应用程序的 SDK。

站在网络巨人的肩膀上
Hydrogen Torch 是 H2O 产品组合的最新成员,专为图像、视频和 NLP 处理用例的应用程序量身定制,包括识别或分类对象、分析情绪或在文本中查找相关信息。 这是一种无代码产品,Ambati 对此表示:

“它走进了谷歌、微软、亚马逊和 Facebook 等网络巨头的传统领域,并使用了他们的一些创新,但通过让客户更轻松地使用深度学习来挑战他们,既可以采用预先构建的模型,也可以将它们转化为 本地使用。”

Ambati 提到了 Hydrogen Torch 的一些早期采用者用例,例如实时视频处理。 在新加坡,这样做是为了确定交通是否畅通,或者某些情况是否会导致事故。 使用的方法是采用“传统的”大型机器学习模型,然后根据手头的特定数据对其进行微调。

Hydrogen Torch 在底层使用了 Facebook 的 PyTorch 和谷歌的 TensorFlow。 H2O 采用它们并添加了大师级专业知识以及集成环境。 这还包括 H2O 的 MLOps 产品,它为生产中的数据和机器学习管道提供支持。

正在对模型进行持续监控,以确定其准确性是否发生了变化。 这可能是因为传入数据的模式发生了变化,或者因为最终用户的行为发生了变化。 无论哪种方式,模型都会被重建和重新部署。

此外,Hydrogen Torch 无代码产品的一部分是自动生成文档,这样数据科学家就可以深入探索选择了哪些数据以及应用了哪些转换。 Ambati 声称,与基准模型相比,Hydrogen Torch 模型的准确度最高可提高 30%,达到 90 个百分点。

当然,他继续补充说,人工智能在准确性、速度和可解释性之间存在着众所周知的权衡。 根据用例要求,必须做出选择。 然而,速度在某种程度上是一种普遍要求。

就速度而言,H2O 的内存处理在确保 Hydrogen Torch 能够按图像、视频和 NLP 处理用例的需要执行方面发挥着关键作用。 在相关方面,H2O 也将机器学习模型小型化提上了日程。 这将使模型能够部署在更多边缘设备上,并具有更好的性能。

Hydrogen Torch 还与 H2O 产品组合中的另一个产品 Document AI 具有协同作用。 Document AI 可以处理传入的文档,结合图像和 NLP 方法。 然后是来自 Zoom 通话和播客等来源的音频和视频数据正在激增,H2O 旨在帮助其客户跟上。

H2O 与 CommBank 和 AT&T 等知名客户持续合作。 H2O 和客户组织的专家共同创建了机器学习模型,并制定了收益分享计划。

Ambati 还确定了 H2O 产品组合未来增长的更多领域:联邦人工智能、内容创建、合成数据生成、数据叙事,甚至数据新闻等领域都在 H2O 的关注范围内。 Ambati 说,目标是建立对 AI 服务社区的信任。 这确实是一个宏伟的愿景,其进展难以衡量。 然而,就产品路线图而言,H2O 似乎走在了正确的轨道上。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。商机网仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 tenspace2022@163.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.315965.com/n/66648.html 聚才发 母婴好物

(0)
上一篇 2023年12月30日 上午5:19
下一篇 2023年12月30日 上午5:30

相关推荐

  • 1402年12月18日发生了什么?朱棣决定迁都北京

    在历史的长河中,有些日子因为某些重大事件的发生而被永远铭记。1402年12月18日就是这样一天,明朝的永乐皇帝朱棣在这一天做出了一个重大决定——迁都北京。 朱棣是明成祖的名字,他在位期间,明朝的疆域达到了历史最大范围,国力达到了鼎盛。然而,他的迁都决定并非一时兴起,而是在深思熟虑后做出的。这个决定的背后,既有对国家安全的考虑,也有对国家发展的规划。 在朱棣登…

    2024年2月8日
    36
  • Databricks 通过新的 AutoML 引擎和特征存储提升 AI 赌注

    随着 Databricks 在北美举行的年度会议 Data + AI Summit 继续进行,该公司也发布了有关其新功能的公告。 昨天的重点是传统分析。 今天的主题是 AI,面向多个受众。 对于开发者群体以及成熟的商业用户,Databricks 正在引入一个 AutoML(自动机器学习)引擎; 对于数据科学家,该公司正在添加一个特征存储。 前提一般来说,Au…

    2023年12月28日
    144
  • 智能手机卫星预期将很快撞向地球源代码

    你听说(这件新闻)了吗? 普通智能手📱机正在获得卫星连接! Apple 最近宣布了传闻已久的新 iPhone 14 卫星支持,使用户能够在蜂窝网络覆盖范围之外发送紧急消息。 这项名为 Emergency SOS 的服务是通过与美国低地球轨道 (LEO) 卫星公司 Globalstar 的合作实现的。 (Apple 还暗示了未来的其他合作伙伴关系。)紧急求救信…

    2024年1月9日
    128
  • 女博士百万积蓄交亲姐保管却难要回:别笑了,这种事谁遇上都头大

      这些年,我一直坚信一件事情,两个人走的距离太近,尤其是朋友,甚至亲戚,那么你们之间的缘分很有可能就要尽了。哪怕是夫妻,彼此之间也应该有适合的距离。同时不管是再亲的人,你如果不想让这段关系出现问题,那么就一定不要把钱参与进来。 一旦人与人之间突破了距离,或者钱参与进来,关系也就会发生问题。 但是这些事情很多人不在乎,当然更有一些人经历太少,不懂。 今天我们…

    2023年8月5日
    229
  • Apple 为 Qi2 标准贡献了 MagSafe——它为何重要源代码

    Apple 非常重视可持续性,如果您希望数十亿智能手📱机用户转向无线充电,这一点很重要。 这可能解释了为什么它通过无线充电联盟 (WPC) 将其 MagSafe 技术作为其他人使用的标准。 Apple 的 MagSafe 都在 Qi2 上无线充电器比有线充电器消耗更多的能量(高出 39%)来为手📱机充电。 诚然,手📱机不会在单位基础上消耗大量电量,但当你将数…

    2024年1月10日
    140
  • 原神生日当天抽卡增加出金概率么(10大原神玄学出金技巧盘点非酋和零氪党必学)

    因为原神的抽卡有一个歪的机制,所以脸黑的玩家发明了很多玄学抽卡技巧,希望以此来提高运气,不得不说,有一些还真管用! 今天戏仔就来盘点一下原神的十大玄学抽卡技巧,一起来学一学~ 01 关联角色 每个角色都有属于他的人脉圈,只要在抽指定角色的时候选择一个和他有关联的人物登场,说不定能提高抽奖几率。比如抽神里绫华就可以用旅行者、托马、神里绫人。 02 关联地点 一…

    2023年12月2日
    300
  • 怎么绑鱼钩最牢固又不伤子线(新手绑双鱼钩的方法教程)

    有钓友说自己绑的鱼钩,钓到鱼后经常会脱钩切线,然后问我,是不是用的绑钩方法不好,有没有哪种比较牢固的绑钩方法。钓鱼绑钩的方法有好多个,但在牢固度上基本都是差不多的,没有哪一个更牢固更好一说。同样的方法,两个钓友都在用,一个是经常脱钩切线,一个则啥事没有,这里头在手法上的技巧,下面就来说说,绑鱼钩该注意哪些要领。 一、绑鱼钩需要绕的圈数 绑鱼钩绕线的圈数是没有…

    2023年8月10日
    258
  • 减少 AI 倦怠的 8 种方法

    负责任和有道德的人工智能已经成为我们这个时代的热点问题,尤其是当人工智能渗透到决策和自动化的各个方面时。 根据最近的一项调查,35% 的公司现在报告在其业务中使用人工智能,42% 的公司正在探索该技术。 IBM 的同一项调查发现,信任极其重要——五分之四的受访者表示能够解释他们的 AI 如何做出对他们的业务很重要的决策。 然而,AI 仍然是代码——1 和 0…

    2024年1月1日
    140
  • 微软悄悄揭秘新型AI(可能悄悄石化你)

    作为最后的完整人类中的一员,我感到非常荣幸。 我意识到,在有形的未来,以前被称为人类的艺术家将成为血肉之躯的动人混合体。 也许我不应该感到惊讶,然后,当微软的研究人员出现以稍微加速绝望的未来时。 这一切看起来都是那么天真,那么科学。 研究人员论文的标题创造性地不透明:“神经编解码器语言模型是零样本文本到语音合成器。” 你认为这可能意味着什么? 有一种新的、更…

    2024年1月1日
    140
  • 2024小说排行榜前十名巅峰之作(现代经典好口碑小说推荐)

    大家好呀!初次见面这里是小义,是一个书龄十年的宅男老书虫,从上学以来我便一头扎进网文的世界一发不可收拾,在畅游网文世界的这十年里,我看过不少让人拍案叫绝的好作品,也见过不少让人难以下咽的太监烂文,见识过中国网文的巅峰,也共同经历过低谷,那么废话不多说,今天我要分享的就是网文世界十年来的巅峰之作,这期分享绝对慢慢的干货,老书虫以及小白皆可食用,前者收获回忆,后…

    2023年8月12日
    513

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注