AI：模式不在数据中，它在机器中

• 2023年12月31日上午2:13 • 百科分享 • 阅读 129

AI：模式不在数据中，它在机器中

机器学习依赖于海量数据，通过寻找数据中的模式来发挥作用，这在人工智能领域是司空见惯的说法。

事实上，“在数据中寻找模式”这个短语多年来一直是数据挖掘和知识发现等事物的主要短语，并且人们一直认为机器学习，尤其是它的深度学习变体，只是在继续寻找这种模式的传统。

人工智能程序确实会产生模式，但是，正如“亲爱的布鲁图斯，错不在我们的星星，而在我们自己”，这些模式的事实并不存在于数据中，而是人工智能程序所做的的数据。

几乎所有的机器学习模型都通过一个学习规则来运行，该学习规则会在程序被提供数据示例以及可能附加到该数据的标签时改变程序的所谓权重（也称为参数）。权重的值才算作“知道”或“理解”。

正在发现的模式实际上是权重如何变化的模式。权重正在模拟真实神经元被认为是如何“发射”的，这是心理学家 Donald O. Hebb 形成的原理，后来被称为赫布学习，即“一起发射的神经元，连接在一起”的想法。

还有：六十秒后的人工智能

权重变化的模式是机器学习中学习和理解的模型，这是深度学习的创始人所强调的。正如近四十年前所说，在深度学习的基础文本之一《并行分布式处理》第一卷中，James McClelland、David Rumelhart 和 Geoffrey Hinton 写道：

存储的是允许创建这些模式的单元之间的连接强度 […] 如果知识是连接的强度，那么学习必须是找到正确的连接强度的问题，以便产生正确的激活模式在适当的情况下。

McClelland、Rumelhart 和 Hinton 是为特定的读者、认知心理学家和计算机科学家写作的，他们在一个截然不同的时代写作，在这个时代，人们不会轻易假设计算机所做的任何事情都代表“知识”。他们在 AI 程序根本做不了多少事情的时候工作，他们主要关心如何从相当有限的晶体管排列中产生计算——任何计算。

然后，从大约 16 年前强大的 GPU 芯片的兴起开始，计算机确实开始产生有趣的行为，2012 年 Hinton 与他的研究生合作的具有里程碑意义的 ImageNet 性能结束，这标志着深度学习时代的到来。

由于计算机取得了新的成就，大众开始围绕人工智能和深度学习建立各种神话。大量糟糕的头条新闻将这项技术比作超人的表现。

另外：为什么 AI 报告如此糟糕？

今天的 AI 概念已经模糊了 McClelland、Rumelhart 和 Hinton 关注的重点，即机器，以及机器如何“创造”模式，正如他们所说的那样。他们非常熟悉权重构建模式的机制，作为对输入中仅数据的响应。

为什么这一切很重要？如果机器是模式的创造者，那么人们得出的关于人工智能的结论可能大部分都是错误的。大多数人认为计算机程序正在感知世界上的一种模式，这可能导致人们将判断推迟到机器身上。如果它产生结果，那么想法就是，计算机一定看到了人类看不到的东西。

除了构建模式的机器没有明确看到任何东西。它正在构建一个模式。这意味着“看到”或“知道”的东西与人类自称了解事物的口语化日常意义不同。

与其从以人类为中心的问题出发，不如从机器知道什么开始？最好从一个更精确的问题开始，这个程序在其权重的连接中代表什么？

根据任务的不同，该问题的答案有多种形式。

考虑计算机视觉。作为图像识别和其他视觉感知机器学习程序基础的卷积神经网络由一组衡量数字图像中像素值的权重组成。

像素网格已经是对现实世界的二维坐标系的强加。提供了坐标网格的机器友好抽象，神经网络的表示任务归结为将像素集合的强度与已施加的标签相匹配，例如“鸟”或“蓝鸟”。

在包含一只鸟，或者特别是蓝鸟的场景中，可能会发生很多事情，包括云、阳光和路人。但整个场景不是问题。对程序来说重要的是最有可能产生适当标签的像素集合。换句话说，模式是神经网络连接激活中固有的聚焦和选择的还原行为。

您可能会说，这种程序与其说是过滤，不如说是“看到”或“感知”。

另外：一个新实验：AI 真的认识猫或狗吗？

在游戏中也是如此，AI已经掌握了国际象棋和扑克。在由 DeepMind 的 AlphaZero 程序掌握的“全信息”棋局中，机器学习任务归结为在每个时刻制定一个潜在的下一步行动最终导致获胜、失败或平局的概率分数。

因为即使是最快的计算机也无法计算未来可能的游戏板配置数量，因此计算机的权重通过执行您可能称之为总结的操作来缩短对移动的搜索。该程序总结了如果一个人在给定的方向上采取几个行动成功的可能性，然后将该总结与在另一个方向上可能采取的行动的总结进行比较。

尽管棋盘在任何时刻的状态——棋子的位置，以及剩下的棋子——可能对人类国际象棋大师来说“意味着”某种东西，但目前尚不清楚“意味着”一词对于 DeepMind 的 AlphaZero 对于这样的总结任务有什么意义 .

Pluribus 程序也完成了类似的总结任务，该程序在 2019 年征服了最难的扑克形式——无限注德州扑克。该游戏甚至更加复杂，因为它包含隐藏信息、玩家面朝下的牌以及额外的“随机”虚张声势元素。但是，这种表示再次是对每轮可能性的总结。

即使在处理人类语言的程序中，权重中的内容也与不经意的观察者可能假设的不同。 GPT-3 是 OpenAI 的顶级语言程序，可以在句子和段落中产生惊人的类似人类的输出。

程序“懂”语言吗？它的权重表示单个单词甚至整个文本字符串如何与其他单词和字符串按顺序找到的可能性。

您可以将神经网络的该功能称为类似于 AlphaGo 或 Pluribus 的摘要，因为该问题更像是国际象棋或扑克。但是在神经网络中被表示为连接的可能状态不仅是巨大的，而且考虑到语言的无限组合性，它们是无限的。

另一方面，鉴于 GPT-3 等语言程序的输出是一个句子，是一个模糊的答案而不是一个离散的分数，因此“正确答案”的要求比国际象棋的输赢或平局要低一些或扑克。你也可以将 GPT-3 和类似程序的这个功能称为事物权重的“索引”或“清单”。

另外：什么是 GPT-3？您的企业需要了解的有关 OpenAI 突破性人工智能语言程序的一切信息

人类有类似的库存或语言索引吗？到目前为止，在神经科学中似乎没有任何迹象表明它。同样，在“to tell the dancer from the dance”这个表达中，GPT-3 是否发现了短语或关联中的多重意义？不清楚这样的问题在计算机程序的上下文中是否有意义。

在每一种情况下——棋盘、卡片、字符串——数据就是它们的本来面目：以各种方式分割的成型基材、一组塑料矩形纸制品、一组声音或形状。这些发明对计算机来说是否“意味着”任何东西，只是说计算机为了某种目的而做出响应而调整的一种方式。

此类数据在机器中提示的东西——过滤器、摘要、索引、库存，或者你想要描述这些表示的任何方式——从来都不是东西本身。它们是发明。

另外：DeepMind：为什么 AI 如此擅长语言？这是语言本身的东西

但是，您可能会说，人们看到雪花并看到它们的差异，如果他们愿意的话，还会对这些差异进行分类。诚然，人类活动一直试图通过各种方式寻找模式。直接观察是最简单的方法之一，从某种意义上说，神经网络所做的是它的一种扩展。

你可以说神经网络揭示了数千年来人类活动中始终存在的事实，即模式是强加于世界的事物，而不是世界上的事物。在这个世界上，雪花有形状，但对于收集雪花并对其进行索引和分类的人来说，这种形状只是一种模式。换句话说，它是一种构造。

随着越来越多的程序被释放到世界数据上，并且它们的权重被调整以形成我们希望创建有用表示的连接，创建模式的活动将急剧增加。这样的表示可能非常有用。他们可能有一天会治愈癌症。然而，记住它们所揭示的模式并不存在于世界之外是很有用的，它们存在于感知者的眼中。

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。商机网仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 tenspace2022@163.com 举报，一经查实，本站将立刻删除。本文链接：https://www.315965.com/n/66708.html 聚才发母婴好物

、

0 0

DeepMind：为什么AI这么擅长语言？这是语言本身的东西

上一篇 2023年12月31日上午2:09

抵制被打动的冲动，当我们谈论 AI 时知道我们在谈论什么

下一篇 2023年12月31日上午2:19

百科分享

DeepMind：为什么AI这么擅长语言？这是语言本身的东西

像 OpenAI 的 GPT-3 神经网络这样的程序如何能够回答多项选择题，或者以特定的风格写一首诗，尽管从未针对这些特定任务进行过编程？根据谷歌人工智能部门 DeepMind 的最新研究，这可能是因为人类语言具有导致神经网络预测意外的统计特性。从统计学的角度来看，自然语言具有“不统一”的特性，例如可以代表多种事物的词，称为“多义词”，例如“银行”一词，…

2023年12月31日
147
百科分享

想写好营销策划，需要知道营销是什么（上）

学习附近开什么点最好，写份营销策划　　这个，貌似没有免费给写来自的吧，而且也很多。我简单就策划内容和你说说吧。　　（我不知道你是在什么学校旁）　　1. 学校就是赚学生的钱，学生需要什么你就做什么，现在的学生主要开始由90后构成，（大学以后的就不算了吧，已经成人了，一般都去商场了，）你开店就要参考90后的需求是什么，多逛哈网站，法油头机头先块论坛啊，最好时尚…

神明
2024年1月19日
118
百科分享

阳历和阴历是什么意思?还有农历（哪个快一些有什么区别）

我们中国施行的是双历法，也就是阴历加阳历的纪年法。为什么要这样？据说这是为了用阴历来顺应农时，用阳历来方便统计。只不过这样一来，就会让一些朋友，时常觉得很糊涂：明明今天是几月几日，怎么又变成几月初几了？而且，不是说四年闰一年吗？怎么去年刚闰了，今年就又闰了…… 想要彻底弄明白这些问题，就需要我们首先弄清楚：什么是阴历？什么是阳历？什么是阴历我们现在…

神明
2023年12月4日
176
百科分享

rap歌曲推荐中文（几首超好听的流行rap推荐）

前不久，写了一篇‘十首京味儿金曲’的文章，每首歌儿的背后都承载了北京土著的乡愁，但上次没聊尽兴，所以今儿继续跟大伙儿分享我的歌单，不过这次主要聊十首京味儿说唱，摇滚跟民谣有机会再单写一篇儿一：较劲白佳《老样子》《北京残阳》首先要说的是较劲组合的代表作，说起较劲组合，大部分北京人都不陌生，每首作品都能让北京人感受到强烈的北京情怀，可能光说名字有的老北京人并…

神明
2023年8月8日
340
百科分享

曾国藩：在历史尴尬时期的坚韧与智慧

在中国的历史长河中，有许多伟大的人物，他们以独特的智慧和坚韧的毅力，改变了历史的进程。然而，有一位人物，他生活在一个被称为“最尴尬的时代”，那就是清朝末期的曾国藩。曾国藩生活在一个动荡不安的时代，那时的中国正面临着内忧外患，社会矛盾激化，民众生活困苦。然而，正是在这样的时代背景下，曾国藩以其坚韧不拔的精神和卓越的政治智慧，成功地挽救了清朝的命运，被誉为“清…

2024年2月10日
33
百科分享

满足您各种需求的文件管理器源代码

如果你有一台电脑，你就可以处理文件，不管云计算的出现多么试图掩盖这一事实。毕竟，Google Drive 和 Dropbox 只不过是在线文件管理器。当大多数人想到文件管理器时，他们往往会想到 Windows 资源管理器或 Mac OS X Finder，但实际上还有许多其他方式来管理文件。在本文中，我们将介绍几种管理文件的方法，以适应几乎任何工作方式…

2024年1月13日
125
百科分享

纯羊毛衣缩水了怎么恢复正常（纯棉全羊毛衫严重缩水变硬恢复小妙招）

改编自《毛衣缩水、变形怎么办？教你一招，立马复原！》《毛衣缩水怎么恢复？5个小妙招分分钟复原》来源：上海社区发布、7丽女性网天气开始暖和起来了，厚毛衣们也都要洗洗收起来啦，上一期小编向大家分享了许多清洗毛衣的小妙招，但是很多小伙伴们在评论区向小编反应，洗后的毛衣很多时候会又紧又短，缩水没弹性今天就教大家一招分分钟解决问题立马和新的一样！ …

神明
2023年12月5日
990
百科分享

阿巴亥：蒙语中的美丽寓意与特殊含义，地位是什么样的？

在蒙古族文化中，名字往往寄托着父母对孩子的美好祝愿和期望。阿巴亥这个名字在蒙古语中有着美丽的寓意和特殊的含义，让我们一起来了解一下吧! 一、阿巴亥的蒙语寓意阿巴亥这个名字在蒙古语中有着丰富的寓意。首先，我们可以将其拆分为三个部分：阿、巴、亥。其中，“阿”是蒙古语中的冠词，表示尊贵;“巴”意为美好、幸福;“亥”则代表丰收、富饶。因此，阿巴亥这个名字整体上可以…

2024年2月19日
48
百科分享

梁师成是什么人？他是太监吗？

梁师成，字子美，是中国古代著名的文学家、书法家。他与苏轼、黄庭坚、米芾并称为“苏门四学士”。然而，关于梁师成是否是太监的问题，历史上一直存在争议。那么，梁师成到底是不是太监呢?让我们一起揭开这段历史的疑云。一、梁师成的身世之谜梁师成，字子美，生于北宋时期，他的一生充满了传奇色彩。据《宋史》记载，梁师成的父亲名叫梁颢，是一位文学家。然而，关于梁师成的生父究…

2024年2月29日
29
百科分享

CashPro 预测：美国银行的新人工智能和机器学习工具

美国银行周五宣布推出 CashPro Forecasting，这是一种人工智能 (AI) 和机器学习 (ML) 现金流量预测工具。它利用基于企业现金流历史的 ML 模型来创建准确的财务预测。美国银行全球商业银行业务联席主管 Ken Ullmann 表示，该旨在帮助企业轻松预测未来的现金需求。他在一份新闻稿中解释说：“如今，许多公司依靠手动、重复的工作来…

2023年12月30日
130

AI：模式不在数据中，它在机器中

相关推荐

发表回复