如何通过提示工程训练你的聊天机器人

如何通过提示工程训练你的聊天机器人

近几个月来,基于人工智能的聊天机器人风靡全球的一个原因是,它们可以为各种目的生成或处理文本,无论是创建广告活动还是撰写简历。

这些聊天机器人由大型语言模型 (LLM) 算法提供支持,该算法可以模仿人类智能并创建文本内容以及音频视频、图像和计算机代码。 法学硕士是一种人工智能,接受大量文章、书籍或基于互联网的资源和其他输入的训练,以对自然语言输入产生类似人类的反应。

越来越多的科技公司推出了基于 LLM 的生成式 AI 工具,供企业使用以自动化应用程序任务。 例如,微软上周向有限数量的用户推出了基于 OpenAI 的 ChatGPT 的聊天机器人; 它嵌入在 Microsoft 365 中,可以自动化 CRM 和 ERP 应用程序功能。

例如,可以在 Word 中使用新的 Microsoft 365 Copilot 来创建文档的初稿,从而有可能节省数小时的写作、搜索和编辑时间。 Salesforce 还宣布计划发布一个基于 GPT 的聊天机器人,用于其 CRM 。

大多数 LLM,例如 OpenAI 的 GPT-4,都被预训练为下一个词或内容预测引擎——这就是大多数企业使用它们的方式,可以说是“开箱即用”。 虽然基于 LLM 的聊天机器人产生了一些错误,但经过预训练的 LLM 在提供大部分准确且引人注目的内容方面表现相对较好,这些内容至少可以用作起点。

然而,许多行业需要更多定制化的 LLM 算法,这些算法了解他们的行话并为他们的用户生成特定的内容。 例如,医疗保健行业的 LLM 可能需要处理和解释电子健康记录 (EHR)、提出治疗建议或根据医生笔记或录音创建患者医疗保健摘要。 面向金融服务行业的 LLM 可以汇总收益电话会议、创建会议记录并执行欺诈分析以保护消费者。

在各个行业中,确保高度的响应准确性至关重要。

[立即注册 CIO 的 FutureIT 达拉斯——3 月 29 日德克萨斯州 IT 先驱的领导沉浸]
大多数 LLM 都可以通过应用程序编程接口 (API) 访问,该接口允许用户创建参数或调整 LLM 的响应方式。 发送到聊天机器人的问题或请求称为提示,因为用户正在提示响应。 提示可以是自然语言问题、代码片段或命令,但为了让 LMM 准确地完成工作,提示必须准确无误。

这种必要性催生了一项新技能:即时工程。

提示工程解释
提示工程是为大型语言模型制作和优化文本提示以实现预期结果的过程。 “[它] 帮助 LLM 在产品原型设计和探索中进行快速迭代,因为它可以定制 LLM 以快速轻松地更好地与任务定义保持一致,”硅谷初创公司 SambaNova Systems 的产品高级副总裁 Marshall Choy 说。 为人工智能 (AI) 制造半导体。

Hugging Face 的机器学习工程师 Eno Reyes 表示,对于用户而言,提示工程可能同样重要,它有望成为 IT 和业务专业人员的一项重要技能,Hugging Face 是一个创建和托管 LLM 的社区驱动。

“我在软件、IT 和咨询领域认识的很多人在他们的个人工作中一直使用即时工程,”雷耶斯在给 Computerworld 的📮回复中说。 “随着法学硕士越来越多地融入各个行业,它们提高生产力的潜力是巨大的。”

Reyes 说,通过有效地采用即时工程,业务用户可以优化 LLM 以更高效、更准确地执行他们的特定任务,从客户支持到内容生成和数据分析。

目前最著名的 LLM——OpenAI 的 GPT-3——是广受欢迎的 ChatGPT 聊天机器人的基础。 GPT-3 LLM 在一个 1750 亿参数的模型上工作,该模型可以生成带有简短书面提示的文本和计算机代码。 OpenAI 的最新版本 GPT-4 估计有多达 2800 亿个参数,使其更有可能产生准确的响应。

除了 OpenAI 的 GPT LLM,流行的生成人工智能还包括开放模型,例如 Hugging Face 的 BLOOM 和 XLM-RoBERTa、Nvidia 的 NeMO LLM、XLNet、Co:here 和 GLM-130B。

由于提示工程是一门新兴的学科,因此企业依靠小册子和提示指南来确保其 AI 应用程序的最佳响应。 甚至出现了提示的市场,例如 ChatGPT 的 100 个最佳提示。

Gartner Research 杰出的副总裁分析师 Arun Chandrasekaran 说:“人们甚至在出售即时建议。”他补充说,最近对生成人工智能的大量关注已经凸显了对更好的即时工程的需求。

“这是一个相对较新的领域,”他说。“生成式 AI 应用程序通常依赖于自我监督的巨型 AI 模型,因此从它们那里获得最佳响应需要更多的专业知识、试验和额外的努力。 我相信,随着成熟度的提高,我们可能会从 AI 模型创建者那里看到更好的指导和最佳实践,以有效的方式充分利用 AI 模型和应用程序。”

好的输入等于好的输出
LLM 的机器学习组件自动从数据输入中学习。 除了最初用于创建 LLM 的数据(例如 GPT-4)之外,OpenAI 还创建了一种称为强化学习人类反馈的东西,其中人类训练模型如何给出类似人类的答案。

例如,用户将向 LLM 提出问题,然后写下理想的答案。 然后用户会再次问模型同样的问题,模型会提供许多其他不同的回答。 如果是基于事实的问题,希望答案保持不变; 如果这是一个开放式问题,目标是产生多种类似人类的创造性回答。

例如,如果用户要求 ChatGPT 生成一首关于一个人坐在夏威夷海滩上的诗,则期望它每次都会生成一首不同的诗。 “因此,人类培训师所做的就是将答案从最好到最差打分,”Chandrasekaran 说。 “这是对模型的输入,以确保它给出更接近人类或最佳的答案,同时尽量减少最差的答案。 但是你如何构建问题 [has] 对你从模型中获得的输出有很大的影响。”

组织可以通过摄取该公司内部的自定义数据集来训练 GPT 模型。 例如,他们可能会获取企业数据并对其进行标记和注释以提高其质量,然后将其吸收到 GPT-4 模型中。 这会微调模型,使其能够回答特定于该组织的问题。

微调 cna 也是行业特定的。 已经出现了一个家庭手工业,这些初创企业采用 GPT-4 并吸收大量特定于垂直行业(例如金融服务)的信息。

“他们可能会获取 Lexus-Nexus 和 Bloomberg 的信息,他们可能会获取 SEC 信息,例如 8K 和 10K 报告。 但关键是,该模型正在学习很多非常特定于该领域的语言或信息,”Chandrasekaran 说。 “因此,微调可以发生在行业层面或组织层面。”

例如,Harvey 是一家与 OpenAI 合作的初创公司,创建了所谓的“律师副驾驶”或法律专业人士的 ChatGPT 版本。 Chandrasekaran 说,律师可以使用定制的 ChatGPT 聊天机器人来发现某些法官的任何法律优先权,以便为他们的下一个案件做准备。

“我认为销售提示的价值与其说是语言,不如说是图像,”Chandrasekaran 说。 “生成 AI 空间中有各种各样的模型,包括文本到图像模型。”

例如,用户可以请求生成式 AI 模型生成吉他手在月球上弹奏的图像。 “我认为文本到图像领域在即时市场中更受重视,”Chandrasekaran 说。

Hugging Face 作为一站式 LLM 中心
虽然 Hugging Face 创建了一些自己的 LLM,包括 BLOOM,但该组织的主要角色是成为第三方机器学习模型的中心,就像 GitHub 对代码所做的那样; Hugging Face 目前拥有超过 100,000 个机器学习模型,包括来自初创公司和大型科技公司的各种 LLM。

由于新模型是开源的,它们通常在中心上可用,为新兴的开源 LLM 创建一站式目的地。

要使用 Hugging Face 为特定企业或行业微调 LLM,用户可以利用该组织的“变形金刚”API 和“数据集”库。 例如,在金融服务中,用户可以导入预训练的 LLM(例如 Flan-UL2),加载金融新闻文章的数据集,并使用“变形金刚”训练器微调模型以生成这些文章的摘要。 与 AWS、DeepSpeed 和 Accelerate 的集成进一步简化和优化了培训。

Reyes 表示,整个过程只需不到 100 行代码即可完成。

开始提示工程的另一种方法涉及 Hugging Face 的推理 API; 根据 Reyes 的说法,它是一个简单的 HTTP 请求端点,支持超过 80,000 个转换器模型。 “这个 API 允许用户发送文本提示并接收来自我们上开源模型的响应,包括法学硕士,”Reyes 说。 “如果你想变得更简单,你实际上可以通过使用 Hugging Face hub 中 LLM 模型上的推理小部件来发送没有代码的文本。”

少样本和零样本学习
LLM 提示工程通常采用以下两种形式之一:少量和零次学习或培训。

零样本学习涉及提供一个简单的指令作为提示,从 LLM 产生预期的响应。 它旨在教 LLM 执行新任务,而无需为这些特定任务使用标记数据。 将零样本视为强化学习。

相反,少样本学习使用少量样本信息或数据来训练 LLM 以获得所需的响应。 小样本学习包括三个主要部分:

任务描述:模型应该做什么的简短描述,例如 “将英语翻译成法语”
示例:一些示例显示了模型的预期功能,例如,“sea otter => loutre de mer”
提示:新示例的开始,模型应通过生成缺失的文本来完成该示例,例如“cheese =>”
事实上,根据 Gartner 的 Chandrasekaran 的说法,如今很少有组织可以定制培训模型来满足他们的需求,因为大多数模型仍处于开发的早期阶段。 虽然小样本和零样本学习可以提供帮助,但学习提示工程作为一项技能很重要,对于 IT 和业务用户而言都是如此。

“提示工程是当今需要掌握的一项重要技能,因为基础模型擅长少样本和零样本学习,但它们的性能在很多方面受到我们如何有条不紊地制作提示的影响,”Chandrasekaran 说。 “根据用例和领域,这些技能对 IT 和业务用户都很重要。”

大多数 API 允许用户应用他们自己的提示工程技术。 Reyes 表示,每当用户向 LLM 发送文本时,就有可能改进提示以实现特定结果。

“然而,这种灵活性也为恶意用例打开了大门,例如即时注入,”雷耶斯说。 “像 [Microsoft] Bing 的 Sydney 这样的例子展示了人们如何利用提示工程来达到意想不到的目的。 作为一个不断发展的研究领域,解决恶意用例中的快速注入和渗透测试的‘红队’对于未来至关重要,确保在各种应用程序中负责任和安全地使用 LLM。”

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。商机网仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 tenspace2022@163.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.315965.com/n/67249.html 聚才发 母婴好物

(0)
上一篇 2024年1月5日 上午4:04
下一篇 2024年1月5日 上午4:15

相关推荐

  • 是时候升级到 Windows 11 了吗?源代码

    我从 1980 年代就开始关注 Windows。 在 Windows 95 发布期间,我是指定的发布分析师之一,在某些方面,我作为分析师的成功归功于那次发布。 它让我成为一名有影响力的分析师。 我回想起最初几年的一些痛苦,例如,我将 Windows 95 安装到我 CEO 的笔记本电脑上——并在此过程中将其变成砖块。 然后我听说英特尔的一名工程师将它安装在英…

    2024年1月12日
    142
  • 李白最霸气的一首诗是什么?

    李白是我国的“诗仙”,他的作品对后世诗词创作受益匪浅。李白以豪迈闻名,因为他是一个剑客;他以美酒闻名,因为他最爱买醉写诗;他以狂闻名,敢怒斥天下。在小编的眼中,李白放到现在,就是个绝世大帅哥好嘛。又能写诗又能舞剑,还能与月共舞,真的是惊才绝艳啊。那么大家知道李白最最最霸气、最最最狂的一首诗是什么吗?下面小编就带大家看看吧。 一、诗词原文 南陵别儿童入京 白酒…

    2024年2月11日
    31
  • 杜牧十首必背诗是什么?有什么内容存在?

    杜牧是唐代著名的诗人,他的诗歌作品以清新脱俗、婉约柔美著称。以下是介绍杜牧十首必背诗的内容: 1. 《赤壁怀古》 《赤壁怀古》是杜牧最著名的诗歌之一,这首诗描绘了三国时期的赤壁之战,表达了作者对历史的感慨和对人生的思考。这首诗语言优美,意境深远,被誉为中国古代文学的经典之作。 2. 《登高》 《登高》是杜牧的代表作之一,这首诗通过描写登高的景象,表达了作者对…

    2024年2月12日
    28
  • AI 能否将业余足球从裁判短缺中拯救出来?

    我妻子在女子足球联赛踢球,而且比赛往往竞争激烈。 那么,联盟为每场比赛提供两名裁判是一件好事(而且,嗯,对我妻子来说可能是坏事,因为这些裁判会带走黄牌)。 但并不是每个人都会像 Mia Hamm 这样幸运。 业余足球,尤其是青少年足球,正经历着严重的裁判短缺,部分原因是大流行,部分原因是脾气暴躁和过度激动的父母往往会忍受糟糕的裁判待遇。 这个职位的薪水往往很…

    2023年12月30日
    136
  • 双11营销文案,我写了13条

    如何做好双11 营销短信可以使用帮BOSS营销短信哦,最近出来的

    2024年1月19日
    130
  • 大学生在暑假能够通过什么方式赚钱呢

    大学生暑假做点什么比较赚钱,只有一个月的时间 最好找跟自己专业相关的公司,族片深冲难既可以赚钱,又可以增加经验 如果找不到的话,就尽量利用自己的长处比如口才,英语等去找,多加锻炼

    2024年1月30日
    116
  • 月全食的形成原理(2024年11月8日真实日全食形成过程顺序)

    2019年在美国加州拍摄到的“血月” 罕见的“血月”今天上演,这是一种月全食现象。除了月食和日食,还有星食,这些天文现象背后有什么原理? 11月8日出现被称为“血月”(blood moon)的一种月全食,亚洲、北美洲、中美洲、大洋洲都可以看到。 根据美国国家航空暨太空总署(NASA),这次月全食全长约一个半小时。 有别于日食,观察月全食可以用肉眼直接观看,不…

    2023年12月13日
    162
  • 保温材料有哪些种类(常用高效工业建筑保温材料)

    随着国家“双碳”政策的实施,节能减排已成为当今建筑的必要“功能”。因此,保温材料保温建筑节能减排的主要材料迎来了一个新的发展时期。今天,让我们来看看常用的保温材料。 岩棉 岩棉主要以玄武岩等天然矿石为原料,经高温熔化加工而成。它是一种新型的保温、隔热和吸声材料。岩棉中常用的材料是岩棉板,主要用于建筑外墙、幕墙和防火隔离带。 岩棉板具有保温、吸声降噪、明火不燃…

    2023年12月10日
    139
  • 机长工资多少钱一年(机长一年工资大概多少)

    一位民航机长的工资单: 飞行补贴:72279.92 浮动奖金:22916.92 岗位工资:4471 绩效工资:4471 住房补贴:2150 工龄工资:800 过节费:1400电脑补贴:50 减去五险一金和税,实际到手94902.09元。妥妥的年薪百万。这收入确实挺高的。 据统计一般国内三大航的机长年薪在40万至50万元,有些小航空公司的年薪估计会在70万至8…

    2023年8月1日
    318
  • 郑成功儿子郑经与奶妈的传闻:真相还是谣言?

    在历史的长河中,许多英雄人物都有着各种各样的传闻和轶事。其中,明末抗清名将郑成功的儿子郑经与奶妈私通并生下儿子的故事,就是其中一个引人关注的传闻。然而,这个故事的真实性究竟如何呢?让我们一起来揭开这个谜团。 首先,我们需要明确的是,郑成功的儿子郑经确实存在。他是郑成功的长子,也是台湾历史上的重要人物。然而,关于他与奶妈私通并生下儿子的传闻,却并没有在历史记载…

    2024年2月10日
    45

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注