现在微软有一个新的人工智能模型——Kosmos-1

现在微软有一个新的人工智能模型——Kosmos-1

微软推出了 Kosmos-1,它被描述为一种多模式大型语言模型 (MLLM),它不仅可以响应语言提示,还可以响应视觉提示,可用于一系列任务,包括图像字幕视觉问答、 和更多。

OpenAI 的 ChatGPT 帮助普及了 LLM 的概念,例如 GPT(生成式预训练转换器)模型,以及将文本提示或输入转换为输出的可能性。

另外:OpenAI 正在招聘开发人员,以使 ChatGPT 更好地编码

虽然人们对这些聊天功能印象深刻,但 LLM 仍在努力应对多模式输入,例如图像和音频提示,微软的 AI 研究人员在一篇名为“语言不是你所需要的全部:将感知与语言模型相结合”的论文中争论道。 该论文表明,要超越类似于 ChatGPT 的能力,实现通用人工智能 (AGI),需要在现实世界中进行多模态感知或知识获取和“扎根”。

“更重要的是,解锁多模态输入极大地拓宽了语言模型在更多高价值领域的应用,例如多模态机器学习、文档智能和机器人技术,”该论文说。

Alphabet 旗下的机器人公司 Everyday Robots 和 Google 的 Brain Team 去年展示了接地的作用,当时使用 LLM 让机器人跟随人类对物理任务的描述。 该方法涉及将语言模型置于给定现实世界上下文中可能执行的任务中。 微软还在其 Prometheus AI 模型中使用了基础,将 OpenAI 的 GPT 模型与 Bing 搜索排名和搜索结果的真实反馈相集成。

微软表示其 Kosmos-1 MLLM 可以感知一般模式、遵循指令(零样本学习)和在上下文中学习(少样本学习)。 “目标是让感知与法学硕士保持一致,以便模型能够看到和说话,”该论文说。

Kosmos-1 对提示的输出演示包括一张小猫的图像,上面有一个人拿着一张纸,小猫嘴角挂着微笑。 提示是:“解释为什么这张照片很有趣?” Kosmos-1 的回答是:“这只猫戴着一个能让它微笑的面具。”

其他例子也表明了这一点:从图像中感知到网球运动员扎着马尾辫; 在 10:10 读取钟面图像上的时间; 从 4 + 5 的图像计算总和; 回答“什么是 TorchScale?” (这是一个 PyTorch 机器学习库),基于 GitHub 描述页面; 从 Apple Watch 表盘读取心率。

每个示例都展示了像 Kosmos-1 这样的 MLLM 在多种情况下自动执行任务的潜力,从告诉 Windows 10 用户如何重新启动他们的计算机(或任何其他具有视觉提示的任务)到阅读网页以启动 网络搜索、解释来自设备的健康数据、为图像添加字幕等。 然而,该模型不包括视频分析功能。

另外:什么是 ChatGPT? 这里有你需要知道的一切

研究人员还测试了 Kosmos-1 在零样本 Raven IQ 测试中的表现。 结果发现“当前模型与成年人的平均水平之间存在很大的性能差距”,但也发现其准确性显示了 MLLM 通过将感知与语言模型对齐来“在非语言环境中感知抽象概念模式”的潜力。

考虑到微软计划使用基于 Transformer 的语言模型使 Bing 成为谷歌搜索的更好竞争对手,对“网页问答”的研究很有趣。

“网页问答的目的是从网页中找到问题的答案。它需要模型理解文本的语义和结构。网页的结构(如表格,列表和HTML布局)起着关键作用 在信息的排列和显示方式中的作用。这项任务可以帮助我们评估我们的模型理解网页语义和结构的能力,”研究人员解释道。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。商机网仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 tenspace2022@163.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.315965.com/n/66929.html 聚才发 母婴好物

(0)
上一篇 2024年1月2日 上午3:55
下一篇 2024年1月2日 上午4:05

相关推荐

  • 一个巨大的 Wear OS 日历升级——Google Pixel Watch 及其他源代码

    Google 的 Pixel Watch 有很多优点。 但是,Wear OS 软件的一个重要组成部分是它的系统日历集成。 这是一个令人沮丧的限制,不仅对 Pixel Watch 如此,对整个 Wear OS 以及几乎所有相关设备也是如此。 有点令人震惊的是,对于一家声称谷歌日历是其最受欢迎和最重要的生产力产品之一的公司来说,谷歌尚未为其可穿戴操作系统添加任何…

    2024年1月10日
    134
  • 90后创业者成垮掉的一代?“马云门徒”滞留海外,“小黄车之父”跑路美国

    作者|叶蓁 编辑|康晓 出品|深网·小满工作室 曾经中国90后创业者的代表人物,ofo创始人戴威,近日被海外媒体曝出已在美国开启新的事业。 据报道,戴威疫情几年一直穿梭于中美两地,并在纽约开了一家咖啡连锁店品牌About TimeCoffee,投资方包括IDG、真格基金和唯猎资本(戴威持有2.12%股份)。About Time CEO Marian Chen…

    2023年12月25日
    118
  • 我花了一个小时使用受 ChatGPT 启发的新型 AI 聊天机器人,我可能会笑死

    这是一场革命。 这就是我们被引导相信的。 我听说 OpenAI 的 ChatGPT 将很快取代谷歌,而且,谁知道呢,甚至可能取代棒球经理和政府。 我怎么能不兴奋呢? 然而,每个人似乎都在尝试 ChatGPT 并宣称它非常好。 那里的运动在哪里? 另外:什么是 ChatGPT,它为什么重要? 因此,我深入思考如何让我自己的聊天机器人兴奋起来。 发起一千个问题的…

    2024年1月1日
    218
  • 杜鸿渐与杜甫关系是什么?两人关系很好吗?

    在中国古典诗歌的宝库中,有两位杰出的诗人,他们分别是唐代著名诗人杜甫和宋代著名诗人杜鸿渐。虽然他们生活在不同的时代,但他们之间却有着一段跨越千年的诗坛传奇。本文将以杜鸿渐与杜甫的关系为核心,带您了解这段鲜为人知的诗坛佳话。 一、杜鸿渐与杜甫的相识 杜鸿渐,字子美,南宋著名文学家、书法家。他生活在公元11世纪,距离杜甫生活的时代已经过去了近千年。然而,命运之神…

    2024年2月15日
    44
  • 傅善祥与东王有什么感情纠葛?双方是怎么相识的?

    在历史的长河中,有许多被遗忘的人物和他们的故事。今天,我们要讲述的是一个关于傅善祥和东王的历史故事,这是一段深藏于历史尘埃中的感人情感纠葛。 傅善祥简介 傅善祥,字德华,清朝末年的女性文人。她以诗词歌赋闻名,才情出众,被誉为“才子佳人”。然而,她的一生却被深深地烙印上了一段情感的痛苦记忆——那就是她与东王的情感纠葛。 东王简介 东王,是清朝末年的一位重要人物…

    2024年2月13日
    45
  • 武则天:权力与亲情的较量

    武则天,中国历史上唯一一位女皇帝,她的一生充满了传奇色彩。然而,在她的一生中,有一个让人唏嘘不已的故事,那就是她是否后悔过杀害自己的亲生儿子。本文将带您了解武则天的权力之路,以及她在亲情与权力之间的抉择。 一、武则天的权力之路 武则天,唐朝时期的一位杰出的女性政治家,她通过自己的智慧和手段,成功地从后宫嫔妃晋升为皇后,最终成为一代女皇。在她的统治下,国家政治…

    2024年2月22日
    35
  • 想要良好的 Windows 体验? 首先关注硬件源代码

    最近有人问我建议在系统上部署哪个版本的 Windows。 他们指出了各种可用的 Windows 版本,包括企业 SKU、Windows 10 专业版和 Windows 10 家庭版。 对于大多数中小型企业 (SMB) 和家庭用户,我推荐 Windows 10 或 11 专业版——即使您最初买的是 Windows 10 或 11 家庭版,您也可以升级到这些版本…

    2024年1月12日
    141
  • 努力在未来的工作中取得更好的平衡源代码

    让新的工作世界成为旧工作方式的数字反映的诱惑仍然存在,因此需要时间来获得正确的平衡。 要真正发挥异步远程和混合工作实践的潜力,需要一定程度的想象力。 数字出勤主义不是你的朋友这就是我从最新的未来工作报告中得到的感觉。 它来自 Qatalog 和 GitLab,解释了雇主如何在这个数字时代坚持每天 9-5 小时的工作时间,从而降低生产率并增加员工流失率,而回报…

    2024年1月9日
    139
  • 有哪些网上赚钱的方法(网上写小说赚钱吗)

    在哪些网站上写 我来吧 起点,纵横,17k,山拆散昂玄幻修真与都市异能一类的书 四月天,红袖,凤鸣轩:言情小说最厉害 晋江原创文学网:最上场的是穿越和耽美同人 大致的分类就是烈这些了,你要是喜欢军事类或者灵异类的我就不清楚了,应该各个网站都有 规定响哪尼抓假克没有什么特别的,大致季苗字层兰都一样。先发表三万字,然后编辑自动审核直属年句亚立皇,可以的话他们会主…

    2024年1月30日
    102
  • 干尸和木乃伊的区别是什么(如何制作木乃伊图片)

    闻名于世的木乃伊源自于古埃及人对死后重生的信仰,他们认为,只要保持尸身不朽,就能迎来复活的那一天: 古埃及著名法老拉美西斯二世的木乃伊,年代相当于中国商朝中期,距今已有3000多年 事实上,世界上除了埃及木乃伊之外,中国新疆也出土了大量干尸: 著名的楼兰美女干尸,距今已有3800年历史,陈列于新疆博物馆,免费开放 由于气候干燥,目前新疆出土的古尸年代横跨远古…

    2023年12月12日
    183

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注