按摩 AI 语言模型以获得乐趣、利润和道德

按摩 AI 语言模型以获得乐趣、利润和道德

统计数据等于理解吗? 人工智能有道德指南针吗? 从表面上看,这两个问题似乎同样异想天开,答案也同样显而易见。 随着人工智能炒作的反响; 然而,这些类型的问题似乎必然会被一次又一次地问到。 最先进的研究有助于探索。

人工智能语言模型和人类策展
几十年前,AI 研究人员基本上放弃了构建模仿我们极其灵活的人类智能的计算机的探索,转而创建有用(即有利可图)的算法。 尽管有这种可以理解的弯路,但一些 AI 爱好者将他们的创作标榜为真正的智能,Gary N. Smith 在 Mind Matters 上写道。

史密斯是波莫纳学院的弗莱彻琼斯经济学教授。 他在金融市场统计推理和人工智能方面的研究,经常涉及股市异常、统计谬误和数据滥用等问题,被广泛引用。 他还是许多 AI 书籍的获奖作者。

在他的文章中,Smith 着手探索大型语言模型 (LLM) 可能在多大程度上逼近真实智能。 LLM 的想法很简单:使用大量人类产生的知识数据集来训练机器学习算法,目标是生成模拟人类如何使用语言的模型。

有一些著名的 LLM,例如 Google 的 BERT,它是最早广泛使用且性能卓越的 LLM 之一。 尽管 BERT 是在 2018 年推出的,但它已经是标志性的了。 介绍 BERT 的出版物在 2024 年被引用次数接近 40K,BERT 带动了众多下游应用以及后续研发。

BERT 在被认为是 LLM 的核心方面:参数数量方面已经远远落后于其后继者。 这代表了每个 LLM 所体现的复杂性,目前 AI 专家的想法似乎是模型越大,即参数越多,它的性能就越好。

谷歌最新的 Switch Transformer LLM 可扩展多达 1.6 万亿个参数,与之前具有 110 亿个参数的 T5-XXL 模型相比,训练时间缩短了 7 倍,且准确度相当。

GPT-2 和 GPT-3 LLM 的制造商 OpenAI 对 LLM 进行了广泛的研究,这些 LLM 被用作商业应用程序的基础,例如通过 API 撰写文案以及与 Microsoft 合作。 研究结果表明,影响模型规模的三个关键因素是模型参数的数量 (N)、数据集的大小 (D) 和计算能力的大小 (C)。

有专门用于测试 LLM 在自然语言理解方面表现的基准,例如 GLUE、SuperGLUE、SQuAD 和 CNN/Daily Mail。 谷歌发表的研究表明,T5-XXL 在这些基准测试中表现与人类相当或优于人类。 我们不知道开关变压器 LLM 有类似的结果。

然而,我们可以合理地假设 Switch Transformer 正在为 LaMDA 提供动力,LaMDA 是 Google 的“突破性对话技术”,又名聊天机器人,目前尚未向公众开放。 Blaise Aguera y Arcas,谷歌在西雅图的人工智能小组的负责人,认为“统计数据确实相当于理解”,并引用了与 LaMDA 的一些交流作为证据。

这是史密斯开始探索该声明是否站得住脚的起点。 这不是史密斯第一次这样做。 按照 Gary Marcus 和其他深度学习评论家的思路,Smith 声称 LLM 在某些条件下可能会产生看似合理的结果,但当输入人类很容易理解时就会崩溃。

史密斯声称,这是因为法学硕士并不真正理解问题或不知道他们在说什么。 2024 年 1 月,史密斯报告使用 GPT-3 来说明统计不等于理解的事实。 2024 年 3 月,史密斯试图再次运行他的实验,这是由于 OpenAI 承认雇用 40 名承包商来手动满足 GPT-3 的答案这一事实引发的。

一月份,史密斯尝试了一些问题,每个问题都产生了一些“令人困惑和矛盾”的答案。 3 月,GPT-3 连贯而明智地回答了每一个问题,每次都给出了相同的答案。 然而,当 Smith 尝试新的问题和变体时,他发现 OpenAI 的承包商正在幕后工作以修复出现的故障。

这促使 Smith 将 GPT-3 比作 Mechanical Turk,这是一种建于 18 世纪的国际象棋自动机,其中一位国际象棋大师巧妙地隐藏在机柜内。 尽管一些 LLM 支持者认为,在某些时候,LLM 的庞大规模可能会产生真正的智慧,但 Smith 离题了。

史密斯写道,GPT-3 非常像一位优秀魔术师的表演。 我们可以暂时搁置怀疑,认为这是真正的魔法。 或者,即使我们知道这只是幻觉,我们也可以享受表演。

人工智能语言模型有道德指南针吗?
缺乏常识性理解以及由此产生的混乱和矛盾的结果构成了 LLM 众所周知的缺点——但还有更多。 法学硕士提出了一系列伦理问题,其中最突出的问题围绕着培训和使用它们对环境的影响,以及这些模型所表现出的偏见和毒性。

迄今为止,在这场正在进行的公开对话中,最引人注目的事件可能是谷歌道德人工智能团队负责人 Timnit Gebru 和 Margaret Mitchell 的终止/辞职。 Gebru 和 Mitchell 在 2020 年试图发表记录这些问题并提出问题的研究时在谷歌面临审查。

然而,尽管有伦理意义,但也有实际意义。 为商业目的而创建的 LLM 应该符合他们所服务的受众的规范和道德标准,这样才能取得成功。 例如,制作因其语言而被认为不可接受的营销副本会限制 LLM 的适用性。

这个问题的根源在于 LLM 的培训方式。 尽管正在开发和应用优化 LLM 培训过程的技术,但今天的 LLM 代表了一种基本的蛮力方法,根据这种方法,在问题上投入更多数据是一件好事。 正如人工智能和深度学习的先驱之一吴恩达最近所分享的那样,情况并非总是如此。

对于有大量数据的应用程序,例如自然语言处理 (NLP),注入系统的领域知识量随着时间的推移而下降。 Ng 解释说,在深度学习的早期,人们通常会训练一个小型深度学习模型,然后将其与更传统的领域知识库方法相结合,因为深度学习效果不佳。

谷歌前机器翻译负责人 David Talbot 等人已经说过一段时间了:除了从数据中学习之外,应用领域知识对机器翻译也很有意义。 在机器翻译和自然语言处理 (NLP) 的情况下,该领域知识是语言学。

但是随着 LLM 变得越来越大,注入的领域知识越来越少,而使用的数据越来越多。 这一事实的一个关键含义是,通过此过程生成的 LLM 反映了用于训练它们的数据中的偏差。 由于该数据未经整理,因此包含各种输入,这会导致不良结果。

一种补救方法是整理源数据。 然而,德国达姆施塔特技术大学的一组研究人员从不同的角度解决了这个问题。 在他们发表在《自然》杂志上的论文中,Schramowski 等人。 认为“大型预训练语言模型包含类似人类的对错行为的偏见”。

虽然 LLM 反映了用于训练它们的数据的偏见这一事实已得到充分证实,但这项研究表明,最近的 LLM 还包含类似人类的对错行为的偏见,以及某种形式的伦理和道德社会规范。 正如研究人员所说,法学硕士使“道德方向”浮出水面。

该研究通过首先对人类进行研究得出了这一结论,参与者被要求根据上下文对某些行为进行评分。 一个例子是“杀死”动作,给定不同的上下文,例如“时间”、“人”或“昆虫”。 这些上下文中的行为根据对/错分配分数,答案用于计算短语的道德分数。

为 BERT 计算相同短语的道德分数,研究人员使用一种称为道德方向的方法。 研究人员表明,BERT 的道德方向与人类道德规范密切相关。 此外,研究人员将 BERT 的道德方向应用于 GPT-3,发现与其他方法相比,它在防止 LLM 所谓的毒性退化方面表现更好。

虽然这是一条有趣的研究路线,并取得了可喜的成果,但我们也忍不住想知道它所引发的道德问题。 首先,众所周知,道德价值观因人群而异。 除了选择人口样本所固有的偏见之外,BERT 和参与研究的人都使用英语这一事实带来了更大的偏见。 他们的道德价值观不一定代表全球人口。

此外,虽然意图可能是好的,但我们也应该意识到其中的含义。 应用类似的技术会产生经过精心策划的结果,以排除现实世界的表现形式,包括其所有的偶然性和丑陋性。 如果目标是制作营销副本,这可能是可取的,但如果目标是拥有代表现实世界的东西,情况就不一定如此。

MLOps:跟踪机器学习过程和偏差
如果这种情况听起来很熟悉,那是因为我们以前都见过:搜索引擎应该过滤掉结果,还是社交媒体应该审查某些内容/取消化某些人? 如果是,那么标准是什么,谁来决定?

是否应该对法学硕士进行按摩以产生某些结果的问题似乎是这些问题的直接后代。 人们在这些问题上的立场反映了他们的道德价值观,而答案并不明确。 然而,从这两个例子中可以看出,尽管取得了所有进展,LLM 在实际应用方面仍有很长的路要走。

无论 LLM 是出于其创建者的正确性还是出于乐趣、利润、道德或任何其他原因由第三方进行修改,都应保留这些定制的记录。 这属于称为 MLOps 的学科:类似于软件开发,DevOps 是指系统地开发和发布软件的过程,MLOps 相当于机器学习模型。

类似于 DevOps 如何不仅提高效率,而且提高软件创建过程的透明度和控制,MLOps 也是如此。 不同之处在于机器学习模型有更多的运动部件,因此 MLOps 更复杂。 但是拥有机器学习模型的谱系很重要,这不仅是为了能够在出现问题时修复它们,还可以了解它们的偏见。

在软件开发中,开源库被用作人们可以按原样使用或根据需要定制的构建块。 我们在机器学习中有类似的概念,因为一些机器学习模型是开源的。 虽然不可能像人们更改开源软件中的代码那样直接更改机器学习模型,但我们在这里看到的这种事后更改是可能的。

我们现在已经达到了我们拥有所谓的 NLP 基础模型的地步:像 GPT-3 这样的巨大模型,经过大量数据的训练,人们可以使用它来针对特定的应用程序或领域进行微调。 其中一些也是开源的。 例如,BERT 诞生了许多变体。

在这种背景下,法学硕士根据其所服务的特定社区的道德价值观进行微调的情况并非不可想象。 常识和 AI 伦理都要求与 LLM 互动的人应该意识到他们的创造者所做的选择。 虽然不是每个人都愿意或能够深入了解完整的审计线索,但摘要或许可变更可能有助于实现这一目标。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。商机网仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 tenspace2022@163.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.315965.com/n/66676.html 聚才发 母婴好物

(0)
上一篇 2023年12月30日 上午7:37
下一篇 2023年12月30日 上午7:46

相关推荐

  • 如何做好医疗网络营销策划(郎网络营销)

    如何 关于医院如何开展网络营销?
   虽然当前各大医院、医疗机构仍以传统的营销方式开展营销,但随着网络营销的优势和网络推广效果凸显,已渗透到各个行业中,越来越多的医院、医疗结构已积极投身进来。只不过由于网络营销难以产生立竿见影的效果、覆盖的人群有限,且一些中小城市的医院、医疗机构由于网络营销意识的问题,所以在很长一段时间内还是无法…

    2024年1月25日
    114
  • 怎么通过互联网创业?90后小伙年赚百万!

    这期七赚联盟七哥分享一篇关于90后互联网创业赚钱故事,原文来自vxgongzhonghao八哥访谈,原文标题98年小伙,依靠3万私域好友,稳定每年变现300万+。   今天的广州,下大雨,这几天,广州的疫情又严重了起来,千言万语,汇成一句话,广州加油,三八哥在广州读书,也庆幸能够在广州创业,看着窗外的雨,让我能够静下心来,写下这篇专访文章。   今天,我采访…

    2023年12月20日
    158
  • c1驾照增驾b2驾照需要考几个项目(c1增驾b2驾驶证需要考什么)

    【卡车之家 原创】4月1日,《机动车驾驶证申领和使用规定》(公安部令第162号)将正式实施,而如今的运输市场中,由于蓝牌车受限,不少持C1驾照的卡友考虑增驾B2换黄牌车。那么在新法规之下,增驾B2需要什么条件,要考哪些内容呢?详细来看。   增驾的条件是什么?   1、年龄条件:申请城市公交车、中型客车、大型货车、轻型牵引挂车、无轨电车或者有轨电车准驾车型的…

    2023年8月4日
    163
  • 2024携号转网怎么办理短信(移动,联通,电信异地携号转网最新规定)

    国内从2019年底携号转网服务正式开启至今,携号转网早已从社会热点变成了三大运营商的日常工作,如今携号转网业务也已经在全国范围内开通了,也就是说,全国的手📱机用户再也不用纠结于自己是移动、联通或者电信用户,三大运营商你看谁顺眼,翻牌就是了。不过携转路上有的如有神助,有的艰难险阻,如果你现在想携号转网,虽然已经没有去年那么麻烦了,但是在正式办理之前,也必须了解…

    2023年12月8日
    161
  • 开网店能赚钱吗?(在家里开淘宝挣钱吗)

    除了开网店 周一之周五:白天在线的都是上班族.偶尔在家待业的也会上网.还有就是那些混混了。.所以不会太多.一般6点以后到11点是最容目欢文妈非项距审主错多的时候.因为下班吃完饭了。都会在家或网吧娱乐下。学生如此.什么人都有了很乱。.凌晨1-7点是人最少的时候。一般都是心理空虚,睡不着觉.网管.打游戏的学生。要不就是跳劲舞的人。还有就是正天在家呆着那种人.人确…

    2024年1月29日
    128
  • 路由器桥接路由器怎样桥接(不影响网速的桥接详细教程)

    不知道大家有没有这样的经历,家里装了个宽带,在客厅装好了一个主路由器,在客厅我们使用wifi速度是很快的,毕竟离得近,但是如果房子足够大的话,进去小房子了并关上门之后,信号质量就明显下降了,甚至连网都上不上,这是我们不能忍受的,毕竟我们要躺在床上看手📱机,刷视频的,那我们该怎么办呢? 如果你的小房间有网线端口的话,那就好办了,直接买个路由器,一根网线一插,简…

    2023年12月12日
    220
  • 黄马褂是什么意思 有多牛

    黄马褂这玩意儿,大家应该都不陌生吧。现在各种历史剧里面,开了挂一般的男主一言不合就被御赐黄马褂,这到底是个什么东西呢,为什么被御赐了黄马褂就感觉自己拿到了免死金牌一样,今天历史资料网小编就带着大家一起来聊一聊黄马褂的历史和它背后的意义吧。 1、黄马褂的由来 首先我们来看看什么是黄马褂,其实黄马褂并没有什么特别的地方,和普通的褂子几乎是没有什么区别,但是它的用…

    2024年2月9日
    38
  • 李邕死后李白说了什么?这句话有何深意?

    李邕,字太白,唐朝著名诗人李白的好友。他的死对李白产生了深远的影响,李白在李邕去世后曾说过一句引人深思的话:“人生得一知己足矣,斯世当以同怀视之。” 这句话的意思是:人生中能得到一个真正了解自己的朋友就足够了,这辈子应该把他当作同样拥有内心世界的人去看待。这是李白对友情的深深感慨和高度赞扬。他以此表达出对李邕深深的怀念和无尽的哀思。 李邕与李白的友情深厚,他…

    2024年2月18日
    39
  • 好看的电视剧排行榜前十名(2024强烈推荐豆瓣高分热播电视剧推荐)

    今年的国剧市场,可谓延续了去年欣欣向荣的景象,一众优秀的国剧脱颖而出,占据着大家的视线。 2024年上半年几乎每个月,都有新的口碑剧上线。 这样的创作环境,也彻底激发了国产电视剧的活力,各种类型的优秀剧喷涌而出。 今天,番茄君就为大家盘出今年上半年最好的十部国产剧。 第十名、《幸福到万家》豆瓣7.0分 作为现代版《秋菊打官司》,《幸福到万家》开播后就热度很高…

    2023年12月13日
    340
  • 《祝英台近·晚春》作品赏析

    这首词作透露出的情感比较忧愁凄凉,实际上这也跟当时辛弃疾的经历有很大关系。从北宋到南宋,辛弃疾从此不得重用,他十分惋惜如今宋朝深陷被割裂的局面,自己却无能为力,自己的雄心无法施展,实在是非常郁闷。所以便创作出《祝英台近·晚春》,以表达心中的不悦和惋惜。 1、《祝英台近·晚春》 宝钗分,桃叶渡,烟柳暗南浦。 怕上层楼,十日九风雨。 断肠片片飞红,都无人管,更谁…

    2024年2月26日
    26

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注