通过LLM构建聊天机器人必备技巧

作者：AI研习所发布时间：2023-06-21

聊天机器人在AI领域并不稀奇，尤其是ChatGPT问世之后，很多人都把它当成一个可以随时对话随意提问的聊天机器人。而在实际应用领域，聊天机器人的场景也愈加丰富多样。

比如很多人熟知的客服聊天机器人，常用在电商领域，能够快速回答常见问题或者跟踪发货状态等等；还有医疗聊天机器人，在读取患者的症状并且持续提问后，就患者下一步应该采取的措施提出正确的建议；以及还有辅助销售的聊天机器人，用于财务计算、法务咨询相关的聊天机器人等等。

那么，如何拥有一个符合自己场景需求的聊天机器人？语言技术教育家RachaelTatman博士为使用LLM（Large LanguageModels）开发聊天机器人提供了一些建议和想法，详细说明了数据扩充的内容、原因和方式。同时还展示了以数据多样性为重点进行数据扩充的建议，以及一些使用Cohere LLM的例子。

使用LLM的建议

首先，出于对用户体验考虑，以及存在的一些不可预测性，Rachael Tatman博士不建议向用户展示原始生成的文本。这是由于，对LLM的大多数对抗性攻击都需要访问原始生成的文本，如果不公布原始数据，那么就不必应对对抗性攻击。她建议在训练或者微调聊天机器人时，可以在人机交互的方面进行数据增强，从而使得用户能够在使用时感受到温暖。

注：对抗性攻击（Adversarial attacks），由于机器学习算法的输入形式是一种数值型向量（Numeric vectors），所以攻击者就会通过设计一种有针对性的数值型向量从而让机器学习模型做出误判，这便被称为对抗性攻击。

数据增强什么时候有用？

数据增强什么时候有用呢，答案是，在没有目标用户的代表性数据的时候。她还指出，在我们有足够完善的代表性数据时，数据扩充当然是有效的，但是会缺乏一些有特殊含义或者其他意图的内容。比如说因为热点事件或者新的含义，某些事物会从不相关变成相关。，此外，在处理一些非常干净且不能完全代表用户生成文本的研究数据时，数据扩充是非常重要的。

为什么使用LLM而不是其他？

与其他基于模板规则的数据扩充技术相比，LLM可以避免重复和意外错误。并且基于模板规则的方法在生成具有不同语法的数据方面存在滞后。Rachael Tatman博士提到，对比其他模型，LLM是一种生成数据更快、更便宜、更可靠的方法。虽然LLM也会被各种各样的用户生成文本而干扰，因此，在训练我们的模型时，多样性的数据增强是非常有必要的。

Cohere是如何收集数据来训练模型的？

Cohere的Generation LargeLanguage Model是在Cohere基础设施团队从网上抓取的Google Books数据集、Common Crawl和其他文本上训练的。Cohere团队筛选出的前十个域名包括：wordpress.com,medium.com, stackexchange.com, tumblr.com, elsevier.com, genius.com, bbc.co.uk,libsyn.com, yahoo.com, nytimes.com。在这个基础上，Cohere LLM使用了各种数据来训练模型，包括干扰数据。

如何使用LLM更快构建聊天机器人？

虽然根据具体情况和实际场景，数据会各不相同，但建议通过尽可能有代表性并且齐全的数据，来进行模拟训练以生成新数据。正如Rachael Tatman博士所介绍的，她使用SLURP数据集[U1] 创建的一个例子。她之所以会使用这些数据，是因为它非常干净而且正式。

再举个例子，当你有一些训练数据时，如何利用这些训练数据来生成更多基于它的数据。在Cohere的AI聊天机器人对话框内，

我们给了一个指示：play music有了这个，我们提供了一堆例子。当我们单击生成按钮时，它将生成相关文本。

演示了使用Cohere聊天机器人生成文本的另一个示例。在这里，我们给它喂食一个意图，例如，设置闹钟或提醒。

如何为数据增加多样性？

到目前为止，我们已经看到了使用数据增强技术增加数据的方法。但是，生成的数据与现有数据类似。如果我们想增加数据多样性怎么办？她将增加多样性的方法分为两部分。

l 基于情绪或使用角色的提示

基于情绪的提示，也就是喂给一些情绪的提示。例如，当要求聊天机器人愤怒地播放音乐时，她发现播放音乐的意图发生了变化，聊天机器人生成的文本建议关闭音乐。如下图，聊天机器人给到的文本与可能我们的意图完全相反。所以，情感背景和意图不是IID（独立和相同分布）。然而，这种方法可能适合生成负面情绪的数据集。

l 基于特定用户角色的提示

在使用基于用户的特定角色时，它主要基于刻板印象。人们不太可能通过一些人口统计的数据来介绍自己，除非他们想引入一些基于此的刻板印象，比如说“我现在20岁，请播放音乐”“我是法国人，请播放音乐”。但是，使用多语言数据是个特殊情况，有可能就会由数据衍生一些结论，如下图所示。所以，我们应该谨慎地采取这种做法。

l 基于网站人口统计数据的提示

通过引用特定网站进行提示，她提供了一种风险较小的方法来使用社交媒体网站的人口统计数据来创建提示。她提到这种方法可以用作提示中角色的代理，这种方法也考虑了主题的影响。

比如说当引入不同社交网站的数据后，Twitter、Facebook、YouTube上的不同用户，对聊天机器人要求播放音乐，会得到不同的回复。

Facebook：

YouTube：

使用LLM的一些注意事项

在一些场景下，如果和聊天机器人表达的意图过于具体或独特，上述方法将无法很好生效。如果您的目标用户是大量现有社交媒体用户，那么提供的方法将最有效。此外，如果您的目标用户的确是比较独特的，那么可以尝试，以给定方式添加数据多样性，尽管这并不能完全代表您的实际用户，但是算是个权宜之计。

如何验证生成的数据？

建议在第一遍进行手动验证。如果能增肌人机交互的内容将会得到更好的性能。除此之外，她建议使用嵌入可视化来确保整个分布中真实数据和生成的数据的混合。还可以使用嵌入可视化来确定您是否对新集群感到满意。

最后的思考

总结一下，LLM可以帮助我们通过数量和多样性来增加数据，直到我们得到一些实际数据，使我们的系统的可用性更高。她补充说，我们可以提示现有和新生成的数据。最后，建议在第一遍手动验证生成的数据，以确保它符合我们正在寻找的标准和质量。

[U1]https://arxiv.org/abs/2011.13205?ref=txt.cohere.com

近期资讯

2025全球航天展望：最值得期待的10大航天任务
2025年是全球商业航天的关键之年，各国航天机构与商业公司将开展一系列引人瞩目的发射任务和开创性项目。今天我们来聊聊：2025年全球航天有哪些值得期待的任务？1、SpaceX“星舰”试飞近日，美国联邦航空管理局（FAA）正式批准了星舰第七次试飞许可，计划于2025年1月11日进行发射。在星舰第六次试飞中，因传感器问题放弃了助推器捕获，星舰飞船则成功在印度洋实现了软着陆。预计第七次试飞中，星舰飞船仍将在海洋中软着陆，同时SpaceX将再次尝试捕获超重型助推器。SpaceX计划在2025年扩大星舰发射测试规模
你好太空2022 2024-12-26

高考政治22个时政热点压题（可打印）
今天学姐给大家准备了高考政治22个时政热点压题，很多高中生都已经开始背了，你不会还不知道吧？？？我已经给大家整理好啦，电子版（可打印） [图片] [图片] [图片] [图片] [图片] [图片]
gygfth 2024-12-26

2025高考政治核心必背知识点!学霸都在背的提分秘籍！！！
给大家整理全了高中政治核心必背知识点，高中政治每一本书都是有自己的核心知识点的，大家把这些核心知识点背熟，再围绕着这些知识点向外延展，会好背很多~ [图片] [图片] [图片] [图片] [图片] [图片]
UU学姐带你上岸 2024-12-26

【新疆无人机培训】从飞行控制到数据分析：低空软件信息服务全景解读

新疆保华润天航空无人机培训中心：在当今这个快速发展的时代，低空经济正逐渐成为一个不可忽视的新领域。随着无人机和eVTOL（电动垂直起降飞行器）技术的不断进步，对于能够有效管理、监控这些低空活动的软件信息服务的需求也日益增长。信息技术的应用不仅能够显著提高效率，还能大幅度降低运营成本，同时增强整个系统的安全保障能力。首先来看飞行控制软件这一领域。这类软件专为无人机和eVTOL设计，支持自主飞行、任务规划以及避障等功能，并能在紧急情况下快速做出反应。通过集成先进的算法和技术，飞行控制软件使得无人设备的操作更加

新疆无人机培训考点 2024-12-26

与查理·芒格的两顿饭
两篇分别在 2023 年和 2019 年与芒格共进晚餐后有感而发的文章。其中大卫· 森拉（David Senra）是《创始人》播客（Founders）的主理人，这是一档聚焦于全球最成功的企业家和商业领袖生平故事及创业历程的播客。肖恩· 帕里什（Shane Parrish），是Farnam Street 网站的博主，也是 TheKnowledge Project 这档采访跨行业顶尖专家播客的主理人。 [图片] [图片] [图片] [图片] [图片] [图片] [图片] [
ggl99 2024-12-26

降噪耳机不建议乱买，几乎零差评的“四”款降噪耳机深度评选解析

随着生活节奏愈发快速,噪音污染已然成为不可忽视的一大问题。而对于许多追求安静、高品质音乐体验的用户来说,一款出色的主动降噪耳机显得尤为重要。但在市面上百花争艳的降噪耳机中,哪一款才是真正值得下手的佼佼者呢?本文将为大家深度解析四款备受好评的顶级降噪耳机,包括览邦LairPods Pro+、Bose QuietComfort 、华为 FreeBuds Pro 4 悦彰耳机、森海塞尔MOMENTUM真无线4代蓝牙耳机。从降噪性能、音质表现、功能特色等多方面对这些旗舰级产品进行全面评测,帮助您选择真正适合自己的

江诗一墨 2024-12-26

各无人机成像滤光片的差距对比
无人机技术的飞速发展，使得无人机成像系统在各种领域中的应用日益广泛。从高空拍摄、环境监测到军事侦察，无人机的成像功能都起到了至关重要的作用。而在成像系统中，滤光片作为关键的组件，对于提高成像质量和适应不同拍摄环境起到了至关重要的作用。本文将探讨各种类型无人机对于滤光片的需求，并从高低档无人机成像需求出发进行对比分析。 [图片] （图源网络，侵删）高档无人机成像需求与滤光片选择高档无人机通常用于需要高精度和高清晰度的拍摄任务，例如军事侦察、地形测绘等。这类无人机对滤光片的需求主要体现在以下几个方面：
激埃特光电 2024-12-26

Abaqus 与 Ansys不知道选哪个？快速了解二者优势
Abaqus 和 ANSYS 都是用于有限元分析 (FEA) 和计算机辅助工程 (CAE) 的软件包。这两个软件包都用于分析和模拟工程结构和机械部件在各种负载条件下的行为。 Abaqus 和 ANSYS 之间有几个区别：开发和所有权：Abaqus 由 Dassault Systèmes SIMULIA Corp. 开发和销售，而 ANSYS 由 ANSYS, Inc. 开发和销售。可用性：Abaqus 可作为独立软件包使用，也是 SIMULIA 产品套件的一部分。ANSYS 可作为独立软件包和 ANS
SOLIDWORKS硕迪科技 2024-12-26

中科致研动画制作公司：以专业实力，打造高品质二维动画

在当今数字化内容蓬勃发展的时代，二维动画以其独特的艺术魅力和广泛的应用价值，成为了众多领域传递信息、讲述故事、塑造品牌的有力工具。中科致研动画制作公司所提供的二维动画制作服务，更是为各种创意和想法注入了鲜活的生命力，使其能够以极具吸引力的形式呈现在观众眼前。一支专业的二维动画制作团队是确保服务质量的基石。这些团队通常由经验丰富的编剧、才华横溢的设计师、技艺精湛的动画师以及专业的后期制作人员等组成。编剧负责构思富有创意和吸引力的故事脚本，将客户的需求和核心信息巧妙地融入到故事情节中，使动画具有清晰的逻辑和引

中科致研 2024-12-26

美国AlphaLab 三轴DC高斯计设计用于快速识别和测量磁化区域
美国AlphaLab 三轴DC高斯计 VGM 设计用于快速识别和测量磁化区域 AlphaLab 进口代理 find I800I942024 [图片] AlphaLab VGM 三轴DC高斯计 Vector/Magnitude Gauss Meter Model VGM 显示磁场的X、Y、Z和大小，通过可选的USB数据记录和警报快速绘制和测量磁化材料。最大范围是799.99高斯。 AlphaLab VGM 三轴DC高斯计描述： VGM设计用于快速识别和测量磁化区域。这是一个DC高斯计，在探头末端有X、Y和Z
皕赫国际18001942024 2024-12-26

通过LLM构建聊天机器人必备技巧

推荐体验

相关资讯

ChatGPT 聊天机器人如何革新聊天机器人技术

使用 LangChain 和 OpenAI 构建自己的聊天机器人

程序员聊天GPT：构建文本和图像聊天机器人

聊天机器人有哪些？在线ai聊天机器人入口在哪？

如何使用 Python 快速构建自己的 ChatGPT 聊天机器人

近期资讯

2025全球航天展望：最值得期待的10大航天任务

高考政治22个时政热点压题（可打印）

2025高考政治核心必背知识点!学霸都在背的提分秘籍！！！

【新疆无人机培训】从飞行控制到数据分析：低空软件信息服务全景解读

与查理·芒格的两顿饭

降噪耳机不建议乱买，几乎零差评的“四”款降噪耳机深度评选解析

各无人机成像滤光片的差距对比

Abaqus 与 Ansys不知道选哪个？快速了解二者优势

中科致研动画制作公司：以专业实力，打造高品质二维动画

美国AlphaLab 三轴DC高斯计设计用于快速识别和测量磁化区域

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响