黑进 Nvidia 的 GauGAN 2 AI 影像机的荒诞之美

黑进 Nvidia 的 GauGAN 2 AI 影像机的荒诞之美

在 Nvidia 的新人工智能演示 GauGAN 2 中输入“ZDNet 精湛报告”这些词,你会看到一张看起来像大块泡沫绝缘材料在白雪皑皑的背景下在湖中摔跤的图片。

添加更多的词,比如“ZDNet 精湛的报告”,你会看到图像变成了一些新的东西,一些几乎无法辨认的形式,也许是一辆已经被消化的一级方程式赛车,沿着看起来有点像 道路,在人造结构的模糊视图前。

用两个骰子图像的小按钮掷骰子,同一个短语变成一个幽灵般的雾气笼罩的风景,带有某种有机性质的打哈欠的嘴,但完全无法识别其确切种类。

输入短语是控制 GauGAN 的最新方式,GauGAN 是图形芯片巨头 Nvidia 开发的一种算法,用于展示人工智能的最新水平。 最初的 GauGAN 程序于 2019 年初推出,作为一种绘图方式,并让程序通过填充绘图自动生成逼真的图像。

名称中的“GAN”一词指的是一大类神经网络程序,称为生成对抗网络,由 Ian Goodfellow 及其同事于 2014 年推出。 GAN 使用两个以交叉目的运行的神经网络,一个产生输出并稳定地改进,直到第二个神经网络将输出标记为有效。 来回的竞争本质是它们被称为“对抗性”的原因。

Nvidia 在扩展 GAN 方面做了开创性的工作,包括在 2018 年推出“Style-GAN”,这使得生成高度逼真的假人照片成为可能。 在那项工作中,神经网络“学习”了面部的高级方面以及肤色等低级方面。

在 2019 年的原始 GauGAN 中,Nvidia 使用了类似的方法,让人们将景观绘制为区域,称为分割图。 那些包含湖泊、河流和田野等基本对象的高级抽象成为结构模板,然后 GauGAN 程序将以照片般逼真的形式填充绘制的分割图。

该程序的第二版已更新以处理语言。 这样做的目的是让 GuaGAN 2 可以使用与风景有关的有意义的短语,例如“海岸涟漪悬崖”。 GauGAN 2 程序将通过生成与该输入匹配的逼真场景来做出响应。

Nvidia 表示,GauGAN 2 是在“训练”阶段通过输入 1000 万张高质量风景图像而开发的,使用的是 Nvidia GPU 构建的 Selene 超级计算机。

分割图也可以根据输入的单词自动创建,允许人们返回并编辑景观布局,就像原始 GauGAN 允许人们从头开始创建地图一样。

正如 Nvidia 在博客文章中描述的 GauGAN 2,文本和图像以及分割图的结合是多模态 AI 的突破:

GauGAN2 将分割映射、修复和文本到图像生成结合在一个模型中,使其成为一个强大的工具,可以通过混合文字和绘图来创建逼真的艺术。 该演示是首批在单个 GAN 框架内结合多种模式(文本、语义分割、草图和样式)的演示之一。 这使得将艺术家的愿景转化为人工智能生成的高质量图像变得更快、更容易。

Nvidia 表示,实际的好处是,人们可以使用几个词来获得基本图像,而无需任何绘图,然后调整细节以完善最终输出。

但是添加与景观没有任何关系的词,例如“ZDNet”,开始生成疯狂的人工制品,这些人工制品有时具有令人反感的怪异,有时具有令人震惊的美丽——取决于你的品味。 在深度学习的术语中,由无意义短语产生的怪异图像是由于程序必须处理“分布不均”的语言,这意味着没有在提供给机器的训练数据中捕获。 面对不可调和的短语,程序很难将图像与短语相匹配。

从一系列图像中可以看出,“海岸波纹悬崖”最初产生了非常忠实的图像。 用不恰当的词添加限定词——自行车、纽约市、卡桑德拉这个名字——开始以奇怪的方式改变和塑造景观。

当所有的风景词都被去掉,只剩下废话时,更有趣的事情发生了。 奇怪的、未来主义的风景或多色的变形虫进入视野。

这个实验可以用暗示性的扩展短语进行得更远,而不是完全描述性的。 尝试在第一行输入 T.S. 艾略特的诗荒原,“四月是最残酷的月份,从死地中孕育丁香花。”

结果是一些引人注目的图像,实际上有些合适。 掷骰子时,会出现许多合适的景观变体,在某些情况下只有轻微的人工制品。

得益于 StyleGAN 的创新,GauGAN 能够将一种风格应用于图像,从根本上将输出调节为其他图像的形式,而不是像混搭。

风格在艾略特诗歌中的应用扭曲了忠实的风景图像,面目全非。 再一次,一大堆奇怪的物体出现了,对其中一些来说有一种令人作呕的有机质量,而另一些则只是曾经是图像的破碎碎片。

人们还可以提交图像,甚至可以在 GauGAN 2 中进行手绘。提交一张在冰岛古议会所在地辛格维利尔拍摄的旧照片并没有多大作用。 在有限的测试中,图像大部分保持未转换。

然而,加上“Þingvellir”这个词,就产生了一个足够逼真的景观,与 Þingvellir 遗址保持一致。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。商机网仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 tenspace2022@163.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.315965.com/n/66586.html 聚才发 母婴好物

(0)
上一篇 2023年12月30日 上午12:21
下一篇 2023年12月30日 上午12:29

相关推荐

  • 后宫小说排行榜前十名(8本好看的都市玄幻后宫巅峰之作)

    八本多女主,后宫流小说,渣男必备书单,道友请止步 不点赞不评论,还不关注的小伙伴先来一手,胯下扎针,然后无情嘲笑,加上脚底抹油-穷追猛打,最后气不过点外卖价格还被超级加倍!! 1,我也想努力啊!。作者:精品马甲。 简介:万万没想到,即将融资上市走向人生巅峰的黄金单身汉赵明阳居然重生了。 两世为人,站在人生的三岔路口,赵明阳决定这一世要改变努力方向。 精彩回顾…

    2023年8月14日
    863
  • 苹果在 iPhone 的 5G 承诺方面仍有很大的发展空间

    Apple 部署 iPhone 13 的秘密武器并不是什么大秘密:它是 5G。 更具体地说,5G 服务和基础设施的加速采用和部署将刺激对 Apple 智能手📱机的需求。 原因如下: 5G 基础设施仍在部署中。 在美国,并非每个地区都能平等地使用这项技术,但许多城市地区都可以。在美国之外,您会看到各国之间存在类似的差异,可用性也存在差异。 这意味着有很大的增长…

    2024年1月7日
    144
  • 家庭烧烤菜品有哪些(必买的30种烧烤素菜荤菜食材清单大全)

    鸡肉与软骨猪排,锡箔纸、还有不要太难烹饪的,老干妈孜然、我们是学校做组织的露天烧烤新浪微博QQ空.纸杯。 而且,烧烤羊肉串、羊鞭等。一次性碗、蔬菜类:青椒、大型贝类,调料:调和油。 腊肠鱼类、小馒头、鲜贝串等等,盐。 盐、羊肉、好吃到爆棚!助燃剂、烤肠,还有大全里脊肉。 水果,鱿鱼、青椒、蜂蜜、腰、牛扒。 大全肉类羊肉:最适合烧烤的是羊腿肉切成小食材块,鱼、…

    2023年12月1日
    311
  • 存款减少1.2万亿,大家都在买什么?

    常有读者朋友错过文章更新 保持联系,一起前行 ◎作者 | 牛叫兽 ◎来源 | 智友学堂(ID:zhiyoucf88) 4月份居民存款减少1.2万亿,钱都去了哪里? 这是一个重要的转折点,但这个结果,却没有如政策所愿。 经过一年多的“报复性存款”之后,4月居民新增存款终于出现拐头迹象,新增存款减少1.2万亿。 由于疫情和政策冲击,居民不买房少消费,储蓄存款因此…

    2023年12月25日
    137
  • 百度网盘下载的文件在哪个文件夹(手机,电脑,ipad下载到本地文件保存地址)

    百度网盘是我们使用最多的网盘。一些新手小白不知道百度网盘下载的文件在哪里。让我们与您分享百度网盘下载文件的保存位置。 1.百度网盘下载的电脑文件保存位置 登录电脑端百度网盘客户端后,点击右上角设置按钮,如下图所示 点击设置 打开窗口点击左侧传输,您可以看到百度网络磁盘计算机终端下载文件存储位置。苹果和windows系统计算机都是这样查看的。您也可以手动修改其…

    2023年12月13日
    967
  • 笑死人的脑筋急转弯大全及答案100个(搞笑幽默的整人沙雕脑筋急转弯)

    1、 一只乌龟掉进山崖里(猜一花名) ——答案:玫瑰(没龟) 又一只乌龟掉进山崖(猜一花名) ——答案:野玫瑰(也没龟) 2、 一只羊在吃草,一只狼从旁边经过,但没吃羊。(打一水产品) ——答案:虾(瞎) 又一只狼经过,还是没吃羊。(打一海产品) ——答案:海虾(还瞎) 第三只狼经过,羊冲狼大叫,狼还是没吃羊。(打一海产品) ——答案:龙虾(聋瞎) 3、 米…

    2023年8月12日
    206
  • 有效数字的定义是什么(科学计数法有效数字的取法保留规则)

    我们知道,物理是一门实验学科,很多物理规律都需要用物理实验加以验证,在实验过程中往往需要测量一些物理量,上一篇谈到了实验数据的记录,要记录到测量工具最下可读的下一位,这下一位是估计值。在分析这些数据的时候,要遵循哪些规则呢? 分析或运算物理实验数据,要遵循有效数字及其运算规则。 什么是有效数字?在数学上,是这样定义有效数字的:有效数字是指在一个数中,从该数的…

    2023年8月13日
    192
  • 李彦宏最终还是造手机了

    AI与手📱机的结合,究竟能够为手📱机厂商带来什么,还是未知数。但可以确定的是,手📱机行业要的不是一个比Siri更智能的“小度小度”。 作者 | 胡描 编辑 | 于惠如 时隔10年,百度又一次捡起了手📱机梦。这一次,小度扛下了大旗。 5月17日,百度旗下智能硬件品牌小度宣布将推出全新品牌“小度青禾”,并将在5月22日上线“青禾”的首款产品——小度青禾学习手📱机…

    2023年12月25日
    165
  • 运营网站如何盈利(怎么在网上做室内设计赚钱?)

    运营模式和盈利模式的区别 这些名词都是互联网考时代的产物,三个模式各有不同,发挥的效果也不一样,前面的商业模式是核心,在此基础上,才能推出运营模式和盈利模式,只要把商业模式设计能够形成闭环,那么运营座品议国放察湖促模式和盈利模式才能有效施展,否则商业模式有问题,有好的运营模式和盈利模式,还是不能将企业发展最好,下面我就三个模式用白话阐述下,希望大家能够看懂;…

    2024年1月28日
    124
  • OpenAI 提出开源 Triton 语言作为 Nvidia CUDA 的替代方案

    根据人工智能研究公司 OpenAI 的说法,Nvidia 的图形处理单元太难编程,包括使用 Nvidia 自己的编程工具 CUDA。 这家总部位于旧金山的 AI 初创公司在微软和风险投资公司 Khosla Ventures 的支持下,于周三推出了 1.0 版本,这是一种专门为减轻这种负担而设计的新编程语言,名为 Triton,在一篇链接到 GitHub 源代…

    2023年12月29日
    195

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注