Meta 的小型 LLaMA 模型为 AI 研究人员带来了巨大的好处

Meta 的小型 LLaMA 模型为 AI 研究人员带来了巨大的好处

大型语言模型席卷了科技界。 它们为 AI 工具提供支持——例如 ChatGPT 和其他对话模型——可以解决问题回答问题、做出预测等等。 但是,使用这些工具会带来很大的风险。 众所周知,他们会做出看似合理但不真实的声明,生成有毒内容,并模仿 AI 训练数据中根深蒂固的偏见。

为了帮助研究人员解决这些问题,Meta 在周五宣布发布一种名为 LLaMA(大型语言模型元 AI)的新型大型语言模型。 该公司根据专注于研究用例的非商业许可提供它,并计划根据具体情况授予访问权限。 它将提供给学术研究人员; 隶属于政府、民间社会和学术界组织的人员; 和世界各地的行业研究实验室。

另外:这些专家正在竞相保护 AI 免受黑客攻击。 时间不多了

LLaMA 的有趣之处在于它相对较少。

顾名思义,大型语言模型非常大。 它需要大量关于语言的数据(无论是口头语言、计算机代码、遗传数据还是其他“语言”)来创建一个足够复杂的人工智能模型来解决该语言的问题、找到答案或生成自己的作品。

“在大型语言模型空间中训练像 LLaMA 这样的较小基础模型是可取的,因为它需要更少的计算能力和资源来测试新方法、验证他人的工作和探索新的用例,”Meta 指出。

为了训练一个相对“小”的 LLM,Meta 使用了“标记”——单词片段,而不是整个单词。 Meta 对 LLaMA 进行了 20 种使用人数最多的语言的文本训练,重点关注那些使用拉丁字母和西里尔字母的语言。

LLaMA 实际上是模型的集合,参数范围从 70 亿到 650 亿。 LLaMA 65B 和 LLaMA 33B 使用 1.4 万亿个令牌进行训练,而最小的模型 LLaMA 7B 使用 1 万亿个令牌进行训练。 这些模型仅使用公开可用的数据集进行训练。

另外:如何使用 ChatGPT:您需要知道的一切

LLaMA 模型虽小,但功能强大。 Meta 表示,LLaMA-13B 在大多数基准测试中都优于 GPT-3 (175B),而 LLaMA-65B 可与最佳模型 Chinchilla70B 和 PaLM-540B 竞争。

LLaMA 作为一组基础模型对研究界也很有价值。 基础模型是在未标记的数据上训练的,这意味着它们可以针对广泛的用例进行定制。

Meta 将提供多种尺寸(7B、13B、33B 和 65B 参数)的 LLaMA,并且还共享了一张 LLAMA 模型卡,详细说明了它是如何构建模型的。 该公司还提供了一套评估模型偏差和毒性的基准评估,以便研究人员能够了解 LLaMA 的局限性并推进这些领域的研究。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。商机网仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 tenspace2022@163.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.315965.com/n/66918.html 聚才发 母婴好物

(0)
上一篇 2024年1月2日 上午3:07
下一篇 2024年1月2日 上午3:17

相关推荐

  • 唐高祖李渊:一代英明君主的简介及其子女

    在中国的历史长河中,唐朝无疑是一个辉煌的时代。而作为唐朝的开国皇帝,唐高祖李渊更是以其卓越的政治智慧和军事才能,开创了中国历史上最辉煌的时期之一。本文将为您详细介绍唐高祖李渊的生平事迹以及他的子女情况。 唐高祖李渊,字叔虞,陇西成纪(今甘肃省天水市)人。他出生于隋朝大业年间,是北周武帝宇文邕的后代。李渊在隋朝末年,由于隋炀帝杨广的暴政,天下大乱,民不聊生。在…

    2024年2月11日
    47
  • 那是你消防车里的 iPad 还是我看到了什么?

    在一个经常被嘲笑的 Apple iPad 广告中,一个小孩问:“什么是电脑?” 批评者继续声称这款平板电脑不是一台真正的电脑,虽然有时这可能是真的,但情况并非总是如此。 去消防局问问就知道了。 你的 iPad 可以拨打紧急电话Fire Apparatus Magazine 的一篇文章深入探讨了 iPad 如何发展以填补移动团队所依赖的空间。 2024 年 I…

    2024年1月3日
    136
  • 2024最新抖音1到60级价格表人民币(抖音各级别需要多少钱)

    抖音1到60级价格表,抖音刷到60级需要多少人民币(2000万元) 在抖音玩过直播的朋友一定知道,当你在直播里发内容的时候,你的昵称前面会有一个级别。通过送礼物,你可以提高这个级别,一共60级,那么升到60级需要多少钱?今天就给大家介绍一下。   抖音1到60级价格表 抖音1到60级的价格如图所示,1元=10抖币,所以升到60级一共需要2000万元,其中这些…

    2023年12月2日
    4.4K
  • 人工智能能否成为房地产行业的“伟大均衡器”?

    无论是告诉 Alexa 播放您最喜欢的歌曲,还是使用人脸识别来解锁手📱机,人工智能都在让您的日常生活变得更轻松。 随着越来越多的行业继续进行数字化转型,人工智能继续优化许多不同行业开展业务的方式——甚至是房地产。 Anywhere Real Estate 正在利用 AI 技术帮助实现房屋所有权的多样化。 多年来,结构性种族主义和偏见等种族差异影响了有色人种在…

    2023年12月31日
    142
  • 奇怪了,体脂秤怎么知道我有多少脂肪?

    许多人热衷于通过控制饮食、加强锻炼等方式来降低体脂率,市场上也出现了很多号称能够测量体脂率的体脂秤产品,宣传可以帮助人们监测体脂变化,制定更好的健身方案。那么,这些体脂秤的计算结果真的准确吗?体脂率与我们的身体健康又有什么必然联系呢? 测试体脂最常用的方法就是采用生物电阻抗法 体脂率(Bodyfatpercentage),顾名思义,就是指人体的脂肪组织质量在…

    2023年12月27日
    153
  • 唐玄宗为何最后选的太子是李亨而不是李瑁?都有什么因素存在?

    唐朝是中国历史上最辉煌的时期之一,而唐玄宗则是唐朝最具传奇色彩的皇帝之一。在他的一生中,他曾经有过多位皇子,其中李亨和李瑁都是他的亲生儿子。然而,在唐玄宗晚年,他却选择了李亨作为自己的继承人,而非李瑁。这其中的原因是什么呢?本文将从历史背景、政治斗争和个人品质三个方面来探讨这个问题。 一、历史背景 唐玄宗在位期间,国家政治稳重,经济繁荣,文化昌盛,被誉为“贞…

    2024年2月12日
    49
  • 刘春霖:清朝最后一位状元,他的一生是怎样的?

    刘春霖,这个名字在中国科举历史上留下了浓厚的一笔。他不仅是清朝最后一位状元,更是中国科举制度落幕的象征。他的一生充满了曲折与辉煌,让我们一起走进他的世界,探寻这位历史人物的真实面貌。 刘春霖出生于清朝末年的一个书香门第,自幼聪明过人,博览群书。他的父亲是一位名望显赫的举人,对他的教育非常重视。在家庭的熏陶下,刘春霖对学问产生了浓厚的兴趣,立志要考取功名,为国…

    2024年2月16日
    38
  • 2024儿童动画片排行榜前十名(幼儿益智寒假片单)

    你家是否有这样一个现象: 孩子总是吵着要看手📱机,拿着手📱机就是一通乱点,看到喜欢的视频会停留,系统也会不断推荐类似视频。但是你可知道孩子很难分辨视频动画内容情节的好坏,许多视频毫无营养,低俗不堪,很容易给孩子树立不正确的三观,甚至产生不可挽回的过错。 适逢假期,家长刚好有时间,与孩子一起分享闲暇时光。今天精选了10部适合2-6岁孩子看的优质动画片,在这个暖…

    2023年8月5日
    951
  • 网络分析:您需要了解的术语源代码

    广告界有句老话:“一半的广告都被浪费了。你永远不知道是哪一半。” 传统上,企业很难知道他们何时接触到客户,以及哪些方法真正起到了作用。 这一切在网络上都发生了变化,关于客户查看、阅读和分享内容的数据随处可见。 无论您运行的是个人博客还是面向业务的网站,网络分析都是识别和指导内容的宝贵工具。 了解您可以从这些指标中学到什么,以及如何使用它们为您的网站带来更多和…

    2024年1月14日
    137
  • 营销推广策略全部在里面了-网络营销方法及应用

    2016年APP营销推广技巧有哪些,APP营销推广方案策略 网络推广方式1. 搜索引擎推广方法  搜索引擎推广是指利用搜索引擎、分类目录等具有在线检索信息功能的网络工具进行网站推广的方法。由于搜索引擎的基本形式可以分为网络蜘蛛型搜索引擎(简称搜索引擎)和基于人工分类目录的搜索引擎(简称分类目录),因此搜索引擎推广的形式也相应地有基于搜索引擎的方法和基于分类目…

    2024年1月17日
    130

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注