Rendered.ai 推出平台即服务,用于创建合成数据以训练 AI 模型

Rendered.ai 推出平台即服务,用于创建合成数据以训练 AI 模型

随着机器学习的出现继续扰乱许多行业,越来越清楚的一件事是机器学习需要大量高质量的数据才能正常工作。

根据最近发布的一项调查结果,99% 的受访者表示有一个 ML 项目因训练数据不足而被完全取消,100% 的受访者表示由于训练数据不足而导致项目延迟。

使用合成数据是解决与从现实世界获取和使用高质量数据相关的问题的一种方法。 今天,Rendered.ai 宣布推出面向合成数据工程师和计算机视觉科学家的即服务产品。

Rendered.ai 宣称其是同类中的第一个,以及一个完整的合成数据堆栈,包括开发人员环境内容管理系统、场景构建、计算编排、后处理工具等。

我们采访了 Rendered.ai 创始人兼首席执行官 Nathan Kundtz,以了解更多关于该可以服务的用例,以及它在幕后如何运作的信息。

人工智能模型的高质量数据很难获得,而且价格昂贵
Kundtz 是一名受过训练的物理学家,拥有博士学位。 来自杜克大学。 他也有之前的创业经验,曾创立并成功移交Kymeta。 Kymeta 是混合卫星蜂窝网络的开发商,Kundtz 一直听说卫星行业的人们在数据方面遇到的挑战。

他将如何应对这些挑战的想法写在了一份白皮书中,并与一些人分享了这份白皮书。 其中一些人决定与他合作,试图构建可以帮助卫星行业的人的工具,尤其是遥感领域的人。 这导致我们在 2019 年启动了 Rendered.ai。

昆茨称遥感涉及“正在建造的城市、生活模式、作物、林业等来自太空的图像”。 这完全属于非结构化可视数据的范畴。 但这并不是 Rendered.ai 所能产生的全部。

视觉数据可以指来自相机的图像类型,但也可以指 X 射线等事物。 Rendered.ai 也做雷达和许多其他不同的传感模式,最终可以使用计算机视觉工具进行转换。 该还可用于非视觉数据,例如表格数据、音频数据或视频数据。

Kundtz 强调了一个用例,其中 Orbital Insight 与 Rendered.ai 合作,作为国家地理空间情报局小企业创新研究资助的一部分。 Orbital Insight 通过使用合成数据证明了物体检测性能的改进结果。

Rendered.ai 帮助他们修改合成图像,因此经过训练的 AI 模型可以泛化到真实图像。 他们还帮助有效地使用大量合成图像和少量真实示例的组合来联合训练模型。

正如 Kundtz 指出的那样,要使图像与计算机视觉相关,需要的不仅仅是图像本身。 需要对图像进行注释,以正确标记需要由 AI 模型识别的描绘项目。

Kundtz 说,要在 RGB 摄影测量中标注 200 公里的测绘带,成本可能高达 65,000 美元。 这并不一定包括赞助注释的人希望训练 AI 模型识别的所有对象。 合成数据背后的想法是生成足够真实的数据,但同时保证包含 AI 模型需要学习的所有内容,并进行预注释,从而降低成本。

逼近真实世界
Rendered.ai 应用了所谓的基于物理的方法。 正如 Kundtz 解释的那样,这在实践中意味着他们应用基于物理的模拟来足够好地近似现实世界的行为以生成有用的数据。 还有其他方法可以生成合成数据,但 Kundtz 认为它们都行不通。

GAN(生成对抗网络)是一种用于生成合成数据的常用方法。 正如 Kundtz 所说,从本质上讲,我们提供了大量图像,然后教授一种算法来制作更像我们已有的图像。 他继续补充说,GAN 的问题在于你没有引入任何新信息。 你生产你已经拥有的东西。

另一种生成合成数据的方法是使用视频游戏引擎。 Kundtz 承认,这里面有很多物理原理,Rendered.ai 也使用它们,但它的范围相当狭窄。 他认为,这种方法不适用于人们需要合成数据的广泛用例。 另外,游戏引擎并没有达到与现实无法区分的地步,有时这会对算法产生重要影响。

Kundtz 说,Rendered.ai 所做的是使其可扩展到各种不同的模拟类型,然后与在这些领域拥有深厚专业知识的公司建立合作伙伴关系。 不仅使用视频游戏引擎代码,还嵌入深厚的物理知识。

无论如何,这不是模拟现实世界,而是模拟您可以为现实世界创建的网格。 根据定义,模拟不会捕捉到真实世界 100% 的保真度。 Kundtz 指出,这意味着您需要做两件事。

首先是克服与现实的差距,避免引入可能混淆 AI 模型的人工制品。 二是应用后处理效果,帮助克服所谓的恐怖谷,提高真实感。

Rendered.ai 的有两个主要组件:开发人员框架和计算机编排图书馆环境。 正如 Kundtz 所说,“任何你可以用 Python 编写脚本的东西,你都可以放入那个开发者框架中”。 还有一个可视化层,Rendered.ai 称之为无代码环境,它使人们无需手动输入所有内容即可生成工作流。

但该方法的核心在于 Rendered.ai 所谓的“图表”。 这是定义不同类型对象、它们的属性和相互依赖性的可视化方式:

“该图不仅定义了一段数据、一张图像或一张表格,而且还定义了一种生成它们的随机方法。因此,您可以使用该图在某个域内不断生成其他数据”,Kundtz 说。

在此背景下,Rendered.ai 定义了合成数据工程师和计算机视觉工程师的角色。 合成数据工程师是编写脚本的人,这些脚本定义了不同图形的可能性。 计算机视觉工程师摄取图形并确定他们希望在特定数据集中看到的内容。

协作,包括计算
Kundtz 还详细阐述了在必要时引入一定量随机性的过程和工具。 这对于确保数据反映真实世界以及生成边缘案例和测试不同场景很有用。

Rendered.ai 声称其引入的部分创新正是流程中这些不同角色的定义,以及支持它们的协作基础设施。 Kundtz 说,大多数模拟工具、3D 建模和游戏工具都是围绕单个用户构建的,但合成数据基本上是多学科的。

Rendered.ai 的入职流程通常从现有代码开始,然后对其进行修改以满足每个客户的需求。 Kundtz 承认合成数据还处于早期阶段,因此教育客户并帮助他们进行实验是 Rendered.ai 使命的重要组成部分。

在这方面有帮助的是,分别以 500 美元/月和 5000 美元/月的价格获得 Developer 或 Professional 计划与 AWS 上的计算捆绑在一起。 尽管实例中确实存在一些限制,但其想法是让用户能够运行他们需要的实验,而不必过分担心他们的 AWS 账单。 还有一个免费层可用于测试。

Rendered.ai 在 2021 年获得了 600 万美元的种子资金,已经发布了一个开源应用程序和相关内容,以帮助用户使用其。 Kundtz 提到他们将为更多领域发布额外的开源应用程序和内容,以吸引更多用户。

“我们可以做很多事情来帮助这个行业的人们。我认为这是人工智能面临的最重要的问题之一,如果不是最重要的问题的话。所以我很高兴能够提供帮助,”他总结道。

注意:本文已于 2024 年 2 月 4 日更新,以更正 Rendered.ai 融资轮次日期及其订阅级别的名称,这些都是之前错误报告的。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。商机网仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 tenspace2022@163.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.315965.com/n/66636.html 聚才发 母婴好物

(0)
上一篇 2023年12月30日 上午4:19
下一篇 2023年12月30日 上午4:35

相关推荐

  • 2024小说排行榜前十名巅峰之作(现代经典好口碑小说推荐)

    大家好呀!初次见面这里是小义,是一个书龄十年的宅男老书虫,从上学以来我便一头扎进网文的世界一发不可收拾,在畅游网文世界的这十年里,我看过不少让人拍案叫绝的好作品,也见过不少让人难以下咽的太监烂文,见识过中国网文的巅峰,也共同经历过低谷,那么废话不多说,今天我要分享的就是网文世界十年来的巅峰之作,这期分享绝对慢慢的干货,老书虫以及小白皆可食用,前者收获回忆,后…

    2023年8月12日
    505
  • 狄仁杰担任的同凤阁鸾台平章事是个什么官?是宰相吗?

    狄仁杰,唐朝著名政治家、法学家,他的名字在历史长河中流传千古。然而,对于狄仁杰担任的同凤阁鸾台平章事这一职位,许多人可能会感到陌生。那么,同凤阁鸾台平章事究竟是个什么官?它与宰相有何关系?本文将为您揭开这一谜团。 首先,我们需要了解的是,同凤阁鸾台平章事是唐朝中期设立的一个临时性职务。它的全称是“同凤阁鸾台平章军国重事”,简称“同凤阁鸾台平章事”。这个职位的…

    2024年2月22日
    34
  • 5G、物联网、SaaS 推动荷兰数据中心增长

    根据 Arizton Advisory & Intelligence 的一份新报告,物联网、SaaS 和 AI 应用程序的部署,在 5G 部署和包括智慧城市项目在内的政府支持计划的推动下,将在未来几年内推动荷兰的公共云和私有数据中心投资 研究报告。 对于企业技术专业人士来说,好消息是增长将带来更广泛的托管和云服务选项。 据 Arizton 称,数据中…

    2024年1月6日
    135
  • 文成公主生过几个孩子?探索文成公主的子嗣情况

    在中国历史上,有许多感人至深的爱情故事。其中,唐朝文成公主与吐蕃国王赤德祖赞的爱情故事堪称千古绝唱。这是一段跨越千年的浪漫传奇,见证了中华民族的繁荣昌盛与文化交流。然而,关于文成公主生过几个孩子的问题,历史记载并不明确。本文将从历史资料出发,对这一问题进行探讨。 文成公主,唐朝皇室成员,美丽聪慧,才情出众。她的名字,成为了中国历史上最美的爱情象征之一。公元6…

    2024年2月15日
    43
  • 如何保护 Windows 10 和 11 PC 免受勒索软件侵害源代码

    加密锁。 想哭。 阴暗面。 继续。 美杜莎储物柜。 勒索软件威胁不会很快消失。 该消息不断报道这种有害类型的恶意软件在世界范围内掀起新一波浪潮。 它之所以流行,很大程度上是因为攻击者可以立即获得经济回报:它通过加密硬盘上的文件来工作,然后要求您支付赎金(通常是比特币或其他加密货币)以解密它们。 但你不必成为受害者。 Windows 10 和 11 用户可以采…

    2024年1月12日
    132
  • 孙贵妃与马皇后是什么人:宫廷地位与宠爱之争

    在中国的历史长河中,宫廷斗争是一道独特的风景线。其中,明朝的孙贵妃与马皇后之间的地位与宠爱之争,更是引人入胜。两位女性在权力的游戏中,各自展现了自己的智慧和勇气,也揭示了宫廷生活的残酷与真实。 孙贵妃,明成祖朱棣的宠妃,出身名门,美貌聪慧。她的美丽和才情深深吸引了朱棣,使他对她宠爱有加。然而,孙贵妃的地位并不稳固。她的崛起,挑战了马皇后的地位。马皇后,明成祖…

    2024年2月27日
    29
  • 亲身体验 Windows 11 第一印象源代码

    Windows 11 目前处于早期预览阶段,功能远未完成; 这个部署阶段通常侧重于确保硬件和应用程序的兼容性。 我的大多数最新台式机还不能运行 Windows 11,因为它们没有配置 2.0 可信模块 (TPM) 打开(一个简单的修复)或启用安全启动(一个更复杂的修复)。 但是,我能够成功地将 Windows 11 预览版加载到我的 Dell OptiPle…

    2024年1月11日
    133
  • 电脑中病毒了怎么办一直安装软件(笔记本台式电脑修复病毒教程)

    提到了电脑病毒,那可真是恨得牙根痒痒。因为平时工作都离不开电脑,办公处理文件以及调整数据都需要使用到电脑。所以平时经常会从网上下载一些办公需要的软件。有的时候下载到的软件,都需要通过杀毒软件查杀一下才敢安装。即使是这样,有时候都防不住,还会出现中招的情况。大家都知道一款杀毒软件很难防住所有的病毒,随着计算机及网络的高速发展。电脑病毒好像也变得越来越多了,并且…

    2023年12月6日
    204
  • Graphcore 在最新的 MLPerf AI 基准测试中为 Nvidia 带来了新的竞争

    MLPerf 是用于训练计算机执行机器学习任务所需时间的基准测试套件,周三发布的结果显示,总部位于英国布里斯托尔的初创公司 Graphcore 有了一个新的竞争者,与两者相比取得了可观的成绩 重量级人物,英伟达和谷歌。 五年前成立并融资 7.1 亿美元的 Graphcore 在任何 MLPerf 测试中都没有获得最高分,但它报告的结果在使用的芯片数量方面与其…

    2023年12月28日
    115
  • 最新最全专利、商标、著作权规费标准(网络营销注册费)

    商标版权到底需要多少钱 商标注册费用在1800元左右,版权登记费用在1000-1500元左右 计算机软件 D 解析: 擅自复制程序代码和擅自销售程序代码的复制品,这是侵害软件权利人的著作权的行为。因此,销售自己的软件的同时向客户提供其他公司的工具软件的复制品,这种行为侵犯了著作权。 著作权法的原理是保护作品的表达,即作品本身,而不保护作品的构思。因此参照他人…

    2024年1月19日
    156

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注