抵制被打动的冲动，当我们谈论 AI 时知道我们在谈论什么

• 2023年12月31日上午2:19 • 百科分享 • 阅读 133

DeepMind、谷歌、Meta 和 OpenAI 等公司发布的新 AI 模型正在愈演愈烈。他们每个人在某种程度上都是不同的，他们每个人都在更新关于他们的成就、应用和影响的对话。

Imagen，像 DALLE-2、Gato、GPT-3 和他们之前的其他 AI 模型都令人印象深刻，但也许不是你想的那样。下面简要介绍一下我们在 AI 竞赛中所处的位置，以及我们目前学到的知识。

大型语言模型的优缺点
以这种速度，跟踪发布变得越来越困难，更不用说分析它们了。让我们从 GPT-3 开始这个时间线。出于多种原因，我们选择 GPT-3 作为该时间线的基准和起点。

OpenAI 的创建于 2020 年 5 月宣布，这看起来已经是很久以前的事了。这足以让 OpenAI 围绕 GPT-3 创建商业服务，通过与微软的合作将其作为 API 公开。

到目前为止，越来越多的应用程序在后台利用 GPT-3 为最终用户提供服务。其中一些应用程序只不过是美化的营销文案生成器——GPT-3 API 的薄包装。其他人，如 Viable，已经定制了 GPT-3 以适应他们的使用并绕过它的缺陷。

GPT-3 是一个大型语言模型 (LLM)，“大型”指的是模型特征的参数数量。目前 AI 专家之间的共识似乎是模型越大，即参数越多，它的性能就越好。作为参考，让我们注意到 GPT-3 有 1750 亿个参数，而 BERT，谷歌在 2018 年发布的标志性 LLM，如今用于为其搜索引擎提供动力，有 1.1 亿个参数。

LLM 的想法很简单：使用大量人类产生的知识数据集来训练机器学习算法，目标是生成模拟人类如何使用语言的模型。 GPT-3 被更广泛的受众访问以及商业使用这一事实使其成为赞扬和批评的目标。

正如 Steven Johnson 在纽约时报上所写的那样，GPT-3 可以“以令人难以置信的流利度写出原创散文”。这似乎引诱人们，包括约翰逊在内，想知道是否真的有“攻壳机动队”。 Johnson 写道，GPT-3 似乎正在操纵高阶概念并将它们放入新的组合中，而不仅仅是模仿文本模式。然而，这里的关键词是“似乎”。

Gary Marcus、Gary N. Smith 和 Emily Bender 等批评者指出了 GPT-3 在最基本层面上的根本缺陷，其中一些也被约翰逊引用。用 Bender 和她的合著者用来给 Timnit Gebru 和 Margeret Mitchell 从谷歌开除的现在著名的研究论文起标题的话，法学硕士是“随机鹦鹉”。

法学硕士逐字逐句地预测其散文的机制本质上是反流，马库斯写道，引用了他与著名语言学家诺姆乔姆斯基的交流。 Marcus 阐述说，这样的系统是根据数十亿字的数字文本进行训练的；他们的天赋在于找到与他们所接受的训练相匹配的模式。这是统计学的一项最高成就，但并不意味着，例如，系统知道它用作预测工具的单词的含义。

针对 GPT-3 和其他 LLM 的另一股批评是，它们产生的结果往往倾向于表现出毒性并再现种族、种族和其他偏见。这真的不足为奇，请记住用于培训 LLM 的数据来自何处：数据全部由人生成，并且在很大程度上是从网络上收集的。除非采取纠正措施，否则完全可以预料 LLM 会产生这样的输出。

最后但同样重要的是，法学硕士需要大量资源来培训和运营。乔姆斯基关于 GPT-3 的格言是“它唯一的成就就是耗尽了加州的大量能源”。但乔姆斯基并不是唯一指出这一点的人。 2024 年，DeepMind 发表了一篇论文“训练计算优化的大型语言模型”，其中分析人士声称，LLM 的训练是在对计算的深度次优使用下完成的。

总而言之，GPT-3 在某种程度上已经是旧闻了。在过去的几个月里，有许多新的法学硕士被宣布。 2021年10月，微软和英伟达宣布威震天——拥有5300亿参数的图灵NLG。 2021 年 12 月，DeepMind 宣布了具有 2800 亿个参数的 Gopher，Google 宣布了具有 1.2 万亿个参数的 GLaM。

2024 年 1 月，Google 公布了具有 1370 亿个参数的 LaMDA。 2024 年 4 月，DeepMind 公布了 700 亿参数的 Chinchilla，Google 公布了 5400 亿参数的 PaLM。 2024年5月，Meta公布了拥有1750亿参数的OPT-175B。

无论是规模、性能、效率、透明度、训练数据集组成还是新颖性，这些 LLM 中的每一个在某些方面都是卓越而独特的。虽然这些法学硕士中的大多数仍然不为公众所接受，但内部人士偶尔会对这些模型所谓的“理解”语言的能力大加赞赏。然而，这样的说法似乎有些夸张。

将 AI 的极限推向语言之外
虽然 LLM 在扩展能力和产生的结果质量方面取得了长足的进步，但它们的基本前提保持不变。因此，它们的基本弱点也保持不变。然而，当涉及到 AI 的前沿时，法学硕士并不是镇上唯一的游戏。

虽然 LLM 专注于处理文本数据，但还有其他 AI 模型专注于视觉和音频数据。这些用于计算机视觉和语音识别等应用程序。然而，在过去几年中，人工智能模型模式之间的界限变得模糊。

所谓的多模态学习是将来自不同来源的独立数据整合到一个单一的人工智能模型中。开发多模态 AI 模型的希望是能够处理多个数据集，使用基于学习的方法产生更智能的见解。

OpenAI 将多模态视为 AI 的长期目标，并在该领域非常活跃。在其最新的研究公告中，OpenAI 提出了两种模型，声称可以使这一目标更接近。

第一个 AI 模型 DALL·E 于 2021 年 1 月发布。OpenAI 指出，DALL-E 可以成功地将文本转换为适合用自然语言表达的各种概念的图像，并且它使用与 GPT 相同的方法- 3.

第二个 AI 模型 CLIP 也于 2021 年 1 月发布，可以以“零镜头”方式立即将图像分类为属于预定义类别之一。 CLIP 不必像大多数其他视觉 AI 模型那样针对特定于这些类别的数据进行微调，同时在行业基准 ImageNet 中超过它们。

2024 年 4 月，OpenAI 发布了 DALL·E 2。该公司指出，与其前身相比，DALL-E 2 生成的图像更逼真、更准确，分辨率提高了 4 倍。

2024 年 5 月，谷歌宣布了自己的类似于 DALL-E 的多模式 AI 模型，称为 Imagen。谷歌的研究表明，在样本质量和图像文本对齐方面，人类评分者在并排比较中更喜欢 Imagen 而不是其他模型。

吹牛的权利似乎在不断变化。至于这些多模态 AI 模型是否可以解决对资源利用和偏见的批评，虽然目前知之甚少，但根据已知的情况，答案似乎分别是“可能不会”和“有点” . 那么实际的情报部分呢？让我们深入了解一下。

OpenAI 指出，“DALL·E 2 已经了解了图像和用于描述它们的文本之间的关系。它使用一种称为“扩散”的过程，该过程从随机点的图案开始，并在识别时逐渐改变该图案以形成图像该图像的特定方面”。

谷歌指出，他们的“关键发现是，在纯文本语料库上预先训练的通用 LLM（例如 T5）在为图像合成编码文本方面出奇地有效：增加 Imagen 中语言模型的大小可以提高样本保真度和图像质量 – 文本对齐远远超过增加图像扩散模型的大小”。

虽然 Imagen 似乎严重依赖 LLM，但 DALL-E 2 的过程有所不同。然而，OpenAI 和谷歌的人员以及独立专家都声称，这些模型显示出一种与人类理解重叠的“理解”形式。麻省理工学院技术评论甚至将骑马的宇航员称为 DALL-E 2 的标志性形象，这是人工智能理解世界之旅的里程碑。

然而，加里·马库斯 (Gary Marcus) 仍然不相信。 Marcus 是一位科学家、畅销书作家和企业家，他在 AI 圈子中因其对许多主题的批评而闻名，包括智能的本质和深度学习的问题。他很快指出了 DALL-E 2 和 Imagen 的缺陷，并参与了公开对话，包括与谷歌的人进行对话。

马库斯在一篇题为“骑马宇航员”的文章中分享了他的见解。他的结论是，期望这些模型对与句法结构相关的语义完全敏感是一厢情愿的想法，无法推理是现代机器学习方法的普遍失败点，也是寻找新想法的关键所在。

最后但同样重要的是，在 2024 年 5 月，DeepMind 宣布了通才 AI 模型 Gato。正如 ZDNet 自己的 Tiernan Ray 指出的那样，Gato 是一种不同类型的多模式 AI 模型。 Gato 可以处理多种数据来执行多种任务，例如玩视频游戏、聊天、写作文、图片字幕和控制机械臂堆叠积木。

正如 Ray 还指出的那样，Gato 在很多事情上做得一般。然而，这并没有阻止构建 Gato 的 DeepMind 团队的人们惊呼“游戏结束了！这是关于让这些模型更大、更安全、计算效率更高、采样速度更快、内存更智能、模式更多”。

少数人的语言、目标和市场力量
那么所有这些都将我们留在哪里呢？撇开炒作、形而上学的信仰和热情的爆发不谈，应该冷静地审视人工智能的现状。虽然过去几个月发布的模型确实是令人印象深刻的工程壮举，有时能够产生惊人的结果，但它们所指向的智能并不是真正的人工。

生成这些模型的令人印象深刻的工程背后是人类智能。正是人类智能建立了越来越好的模型，艾伦图灵的基础论文《计算机器与智能》称之为“模仿游戏”，后来被称为“图灵测试”。

正如乔治敦法学院隐私与技术中心 (CPT) 的执行主任艾米丽·塔克 (Emily Tucker) 所写，图灵取代了“机器能思考吗？”这个问题。一个人是否可以将计算机误认为另一个人的问题。

图灵并没有本着对前一个问题有帮助的启发式的精神提出后一个问题。他并没有说他认为这两个问题是彼此的版本。相反，他表达了“机器能思考吗？”这个问题的信念。没有价值，并且似乎对不久的将来抱有肯定的希望，在不久的将来，人类实际上很难甚至不可能问自己这个问题。

在某些方面，那个未来可能正在快速接近。像 Imagen 和 DALL-E 这样的模型在出现需要人类拥有的那种智能才能处理的提示时会崩溃。但是，对于大多数意图和目的而言，这些可能被视为边缘情况。世界上的 DALL-E 能够产生的东西可以与最熟练的艺术家相提并论。

那么问题是，这一切的目的是什么。就其本身而言，花费 Imagen 之类的东西所需的时间和资源来随意生成很酷的图像似乎是错误的。

将此视为创建“真正的”人工智能的中间目标可能更合理，但前提是我们愿意认同这样一种观念，即在越来越大的规模上做同样的事情会以某种方式导致不同的结果。

有鉴于此，塔克声明的意图是尽可能具体地说明所讨论的技术是什么以及它是如何工作的，而不是使用诸如“人工智能和机器学习”之类的术语，这在某种程度上开始变得有意义了。

例如，塔克写道，与其说“人脸识别使用人工智能”，不如说“科技公司使用海量数据集来训练算法来匹配人脸图像”。如果完整的解释会破坏更大的论点，或者超出 CPT 的专业知识范围，他们会将读者指向外部资源。

说实话，就可读性而言，这听起来不太实用。但是，请记住，当我们说“人工智能”时，它确实是一种约定俗成，而不是表面上的东西。确实是科技公司使用大量数据集来训练算法来执行——有时有用和/或令人印象深刻的——模仿人类智能。

这不可避免地会引出更多问题，例如——做什么，以及为了谁的利益。正如斯坦福大学数字经济实验室主任、经济学家出身的埃里克·布林约尔松 (Erik Brynjolfsson) 所写，对类人人工智能的过度关注压低了大多数人的工资，“即使它放大了拥有和控制技术的少数人的市场力量” .

在这方面，人工智能与早于它的其他技术没有什么不同。这次可能不同的是事情发展的速度，以及少数人力量的放大程度。

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。商机网仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 tenspace2022@163.com 举报，一经查实，本站将立刻删除。本文链接：https://www.315965.com/n/66709.html 聚才发母婴好物

、

0 0

AI：模式不在数据中，它在机器中

上一篇 2023年12月31日上午2:13

未来的网络安全：“PlayStation”和物联网石棉的安全性

下一篇 2023年12月31日上午2:23

百科分享

红拂女与李靖：一段传世的爱情故事

在中国的历史长河中，有许多动人的爱情故事，其中就包括了唐朝时期的红拂女和李靖的故事。他们的关系，不仅仅是夫妻，更是一种深深的爱情和互相扶持。他们的故事，充满了传奇色彩，也充满了人性的光辉。红拂女，原名杨氏，是唐朝初年的一位著名女性。她的美丽和智慧，使她在历史上留下了深刻的印记。而李靖，是唐朝的一位重要将领，他的勇敢和智谋，使他在战场上屡建奇功。他们的相遇，…

2024年2月23日
34
百科分享

闯王之妻高桂英死之谜，分别有哪些说法？

闯王李自成的一生充满了传奇色彩，而他的妻子高桂英也成为了历史上一位神秘的女性。关于她的死因，历史上有很多种说法，让我们一起来揭开这个谜团。一、战死沙场说据史书记载，李自成在明朝末年的农民起义中，一度建立了大顺政权，但在与清军的战斗中节节败退。在这个过程中，高桂英一直陪伴在李自成身边，共同度过了艰苦的战斗岁月。有一种说法认为，高桂英在一场激战中英勇战死，为…

2024年2月28日
27
百科分享

读卡器怎么用在电脑上（手机读卡机的使用方法图解）

随着设备的不断更新和技术的不断迭代，内存卡的样式和存储标准逐渐固定。事实上，这些内存卡的固定样式是为了支持现有设备的应用而产生的。基于此类内存卡的卡槽和样式不统一。当与某些标准设备连接时，需要使用“转换器”将内存卡转换为一般样式和形状，但许多人不知道如何使用读卡器，本文介绍了使用读卡器时应注意的几件事。首先，选择读卡器样式读卡器只是一个总称，读卡器最常见…

神明
2023年12月12日
325
百科分享

骁龙最新的处理器是哪一款（骁龙现在有哪些处理器）

常用安卓阵营骁龙芯片手📱机的消费者应该有所了解，高通对于骁龙系列芯片其实是有分级的，“8”系列是高端旗舰芯片系列，“7”系列是中端芯片系列，“6”系列是低端性价比芯片系列。不少网友发现，近年来，高通的升级只在高端的“8”系列和中端的“7”系列进行，并未更新低端“6”系列芯片。近日，据报道，高通公司似乎正在开发一款新的基于4纳米的低端芯片组，将接替骁龙60…

神明
2023年8月4日
163
百科分享

丁谓和王钦若之间有关系吗？二人的关系如何？

标题：丁谓和王钦若的关系：历史真相揭秘导语：在中国历史上，有许多政治家和文学家的人物。而其中一位备受关注的人物就是北宋时期的丁谓和王钦若。他们之间的关系一直被人们津津乐道，但是他们之间到底是什么样的关系呢?本文将从历史资料出发，探讨这个问题。一、背景介绍丁谓是北宋时期的一位政治家和文学家，曾经担任过宰相等重要职务。而王钦若是北宋时期的一位政治家，也曾经…

2024年2月26日
33
百科分享

古代女子几岁结婚生子（古代女子一般多大年龄出嫁最好）

每到过年，总会听到很多人在网上吐槽，吐槽什么呢？吐槽不想回家。过去我们常说“每逢佳节倍思亲”，在外面时间久了，一到节假日就迫不及待地想回家看看父母亲人，为什么现在越来越多的年轻人每到过节的时候反而不想回家了呢？其中最大的原因就是——年轻人害怕父母“催婚”，比如一回家爸爸妈妈就问找了男朋友没有呀？找了女朋友没有呀？还有什么七大姑八大姨也来凑热闹，好像生怕男孩…

神明
2023年12月3日
220
百科分享

卢象升与孙传庭：两位明朝将领的英勇与智谋

在中国历史上，有许多英勇善战的将领，他们为国家的繁荣和民族的尊严付出了巨大的努力。在明朝时期，卢象升和孙传庭就是这样两位杰出的将领。他们分别在不同的历史时期，展现出了卓越的军事才能和坚定的民族精神。那么，卢象升和孙传庭谁更厉害呢?本文将从他们的生平事迹和军事成就进行分析。卢象升，字景升，号东篱，明朝末年著名的抗倭将领。他生活在一个动荡不安的时代，面对日本倭…

2024年2月22日
35
百科分享

柳永最特别的一首词(含赏析)

柳永作为我国古代北宋的著名词人，词风以婉约凄美闻名，擅长淫词小调。柳永自从二十五岁离家赴往崇安赶考后，就一生都痴迷于烟花巷柳。他擅长用市井俚语来写词，写的也大多是些烟花女子的勾栏之事，在当时看来是“上不得台面”的。可是你知道他最为特别的一首词是什么吗？他作为一个婉约派词人，最为特别的当然是为数不多的豪放词啦。今天接下来小编就带大家读读这篇词，看看柳永的另一面…

2024年2月26日
33
百科分享

武士彟三个女儿分别叫什么以及她们的身世

最近很多人在说这个武士彟的事情，其中问得比较多的就是这个武士彟有几个女儿的事情，话说这个武士彟是有三个女儿的，那么这三个女儿分别叫什么呢？这三个女儿的身世又具体是什么样的呢？对于这些问题我们一起来详细的解析分析下看看吧。武士彟三个女儿分别叫：武顺、武则天、武氏。 1、武顺武顺(623年~665年)，字明则，并州文水(今山西省文水县)人。唐朝女性历史人物，…

2024年2月23日
45
百科分享

光之国最帅的奥特曼排名前十名（公认最帅的奥特曼是赛罗吗）

女士们、先生们。欢迎来到M78星云光之国主办，诸多远古星云承办的“创造102”选秀大会的颁奖现场。本次选秀大会由四位权威导师，奥特之王、雷杰多奥特曼、赛迦奥特曼、诺亚奥特曼进行打分评选。打分过程采用公正、公平、公开的方式，不容质疑。本选秀不支持倒牛奶投票的方式。最终解释权归M78星云所有。下面颁奖正式开始。帅气担当—雷欧奥特曼来自…

神明
2023年8月11日
437

抵制被打动的冲动，当我们谈论 AI 时知道我们在谈论什么

相关推荐

发表回复