现在微软有一个新的人工智能模型

现在微软有一个新的人工智能模型

微软推出了 Kosmos-1,它被描述为一种多模式大型语言模型 (MLLM),它不仅可以响应语言提示,还可以响应视觉提示,可用于一系列任务,包括图像字幕视觉问答、 和更多。

OpenAI 的 ChatGPT 帮助普及了 LLM 的概念,例如 GPT(生成式预训练转换器)模型,以及将文本提示或输入转换为输出的可能性。

另外:OpenAI 正在招聘开发人员,以使 ChatGPT 更好地编码

虽然人们对这些聊天功能印象深刻,但 LLM 仍在努力应对多模式输入,例如图像和音频提示,微软的 AI 研究人员在一篇名为“语言不是你所需要的全部:将感知与语言模型相结合”的论文中争论道。 该论文表明,要超越类似于 ChatGPT 的能力,实现通用人工智能 (AGI),需要在现实世界中进行多模态感知或知识获取和“扎根”。

“更重要的是,解锁多模态输入极大地拓宽了语言模型在更多高价值领域的应用,例如多模态机器学习、文档智能和机器人技术,”该论文说。

Alphabet 旗下的机器人公司 Everyday Robots 和 Google 的 Brain Team 去年展示了接地的作用,当时使用 LLM 让机器人跟随人类对物理任务的描述。 该方法涉及将语言模型置于给定现实世界上下文中可能执行的任务中。 微软还在其 Prometheus AI 模型中使用了基础,将 OpenAI 的 GPT 模型与 Bing 搜索排名和搜索结果的真实反馈相集成。

微软表示其 Kosmos-1 MLLM 可以感知一般模式、遵循指令(零样本学习)和在上下文中学习(少样本学习)。 “目标是让感知与法学硕士保持一致,以便模型能够看到和说话,”该论文说。

Kosmos-1 对提示的输出演示包括一张小猫的图像,上面有一个人拿着一张纸,小猫嘴角挂着微笑。 提示是:“解释为什么这张照片很有趣?” Kosmos-1 的回答是:“这只猫戴着一个能让它微笑的面具。”

其他例子也表明了这一点:从图像中感知到网球运动员扎着马尾辫; 在 10:10 读取钟面图像上的时间; 从 4 + 5 的图像计算总和; 回答“什么是 TorchScale?” (这是一个 PyTorch 机器学习库),基于 GitHub 描述页面; 从 Apple Watch 表盘读取心率。

每个示例都展示了像 Kosmos-1 这样的 MLLM 在多种情况下自动执行任务的潜力,从告诉 Windows 10 用户如何重新启动他们的计算机(或任何其他具有视觉提示的任务)到阅读网页以启动 网络搜索、解释来自设备的健康数据、为图像添加字幕等。 然而,该模型不包括视频分析功能。

另外:什么是 ChatGPT? 这里有你需要知道的一切

研究人员还测试了 Kosmos-1 在零样本 Raven IQ 测试中的表现。 结果发现“当前模型与成年人的平均水平之间存在很大的性能差距”,但也发现其准确性显示了 MLLM 通过将感知与语言模型对齐来“在非语言环境中感知抽象概念模式”的潜力。

考虑到微软计划使用基于 Transformer 的语言模型使 Bing 成为谷歌搜索的更好竞争对手,对“网页问答”的研究很有趣。

“网页问答的目的是从网页中找到问题的答案。它需要模型理解文本的语义和结构。网页的结构(如表格,列表和HTML布局)起着关键作用 在信息的排列和显示方式中的作用。这项任务可以帮助我们评估我们的模型理解网页语义和结构的能力,”研究人员解释道。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。商机网仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 tenspace2022@163.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.315965.com/n/58590.html 聚才发 母婴好物

(0)
上一篇 2023年12月22日 上午4:46
下一篇 2023年12月22日 上午7:07

相关推荐

  • 接触器品牌大全 十大热门交流接触器排行榜(附2024年排行榜前十名单)

    常用接触器型号有哪些?谁能说一下? 西门子接触器的型号有:接启顷猛触器3TF5322-0XG0205AAC36V,接触器3TF5322-0XF0205AAC110V接触器3TF5322-0XB0205AAC24V,接触器3TF5244-0XQ0170AAC380V接触器3TF5244-0XM0170AAC220V,接触器3TF5222-0XQ0170AAC3…

    2024年2月5日
    285
  • 2024双十一手机排行榜,11.11手机销量高的都有哪些(附2024最新排名前十名单)

    手📱机排行榜销量前十名 手📱机排行榜销量前十名有苹果、HUAWEI华为、OPPO等品牌,如下: 1、苹果 苹果公司,全称苹果股份有限公司,原称苹果电脑(AppleComputer),在2007年1月9日于旧金山的MacworldExpo上宣布改名。总部位于美国加利福尼亚的库比提诺,核心业务是电子科技产品,目前全球电脑市场占有率为3.8%。 是全球第一大手📱机…

    2024年2月3日
    206
  • Microsoft Azure 101:初学者指南源代码

      自 2010 年 2 月首次推出以来,Microsoft 的专有云计算解决方案 Azure 已迅速成为云领域的顶级参与者之一。如今,它已经有了显着的发展,可以利用 Microsoft 技术提供大量不同的服务,包括托管 Windows 操作系统的虚拟机、在不同系统上运行客户端的应用程序部署等等。 如今,许多组织都需要可扩展解决方案的灵活性,该解决…

    2024年1月16日
    138
  • 华为手机哪一款好用性价比高(华为手机哪一款好用性价比高又便宜)

    手📱机市场竞争激烈,制裁后的华为,手📱机业务明显脚步慢了下来,渐渐更不上主流市场的步伐,对于喜欢华为手📱机的用户来说,选择手📱机的时候,就有些迷茫了。现在的华为手📱机再好也别乱买,这3款才是“口碑最佳”的选择,好评高、配置强,至少流畅使用三五年! 第一款:华为 Mate 40 Pro 5G 屏幕:OLED 曲面环幕屏 处理器:麒麟 9000 5G 电池续航:…

    2023年7月30日
    250
  • 有限状态机:40 多年来它如何影响您的游戏源代码

    人工智能(AI)是最新的科技趋势之一,绝对是最具革命性的技术之一。 然而,正如我们可能已经多次提到的那样,人工智能并不是一项新技术,而只是一种终于找到了克服其局限性并充分发挥其潜力的方法的技术。 事实上,至少从 80 年代和 90 年代初期开始,至少从 80 年代和 90 年代开始就使用了第一个或多或少基本的 AI 的计算科学领域之一是…… [背景中播放不祥…

    2024年1月14日
    126
  • 变压器如何调压?变压器接地电阻偏高的危害及预防(附2024年排行榜前十名单)

    关于变压器的问题 主磁通=4.44EmfN,当电压降低时,因为U=Em,亮卖所以主磁通降低 /(根号下(R的平方+Xm的平方),所以当U降低时,励磁电流降低。阻抗和这些都没什么关系,所以阻抗不变,相应的,漏导芹肆及也不变漏抗=线圈匝数×漏导的平方,所漏抗也不变空载损耗=铁耗敬首逗=空载的功率,因为空载功率不变,所以铁耗不变铜耗=短路电流的平方×短路功率,因为…

    2024年2月4日
    149
  • 2024手机品牌排行榜前十名(附2024最新排名前十名单)

    手📱机排行榜2 世界手📱机销量排行榜2022前十名有:苹果、小米、荣耀、ViVO、华为、OPPO、真我360问答、天语、一加、飞利浦。 1、苹果 2024年,在手📱机领域苹果品牌整体销售成绩时规烧说短六持位列第一,全年总销量超1290万件。今年6月份,苹果的销售成绩达到全年最高峰。 2、小米 小米今年整体作随宣控北止绝敌工的排名是第二名,2024年全年小米手…

    2024年2月2日
    167
  • ASML遭遇砍单,芯片行业如何走出至暗时刻?

    过去两年,伴随芯片的短缺、对华禁令等一系列重大事件,光刻机从一种不为人知的先进制造设备,一跃成为了大众的新闻热点。在这当中,荷兰光刻机厂商 ASML 几乎是绕不开的存在。 原因并不复杂,因为 ASML 是全球唯一一家有能力制造先进 EUV 光刻机的公司,台积电、三星、英特尔想要苹果、高通等芯片设计公司制造先进制程工艺的芯片,就必须使用该公司的 EUV 光刻机…

    2023年12月19日
    133
  • 网络虚拟化:OSI 模型的未来源代码

    现在似乎每个人对网络和网络分层框架都有自己的想法。 事实上,随着软件定义网络 (SDN) 和网络功能虚拟化 (NFV) 的出现,一些专家即将完全摒弃分层概念,转而支持完全集成的堆栈,其中转发、传输、会话管理和所有 其余的只是一个大层,或者充其量只是控制器需要担心的抽象层。 在这一切之中是开放系统互连 (OSI) 模型,自 1990 年代互联网首次融合到 TC…

    2024年1月14日
    120
  • 怎么改快手主页背景(附2024年排行榜前十名单)

    快手私信聊天背景怎么换 1.首先,打开快手。 2然后点击左上角罩友的三横。 3然后点击你薯敏的头像。 4点击设置封面。 5点数闷枝击从相册里选择。 6最后选择你准备好的背景图即可!!

    2024年2月5日
    297

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注