8个小技巧“用好”大语言模型—新闻

作者：王敏来源：中国科学报发布时间：2024/5/28 16:58:53

选择字号：小中大

8个小技巧“用好”大语言模型

用大语言模型，还需要技巧？在人们的印象中，这是个极其简单的操作：只需输入一个问题，立刻就能得到回答。

但实际上，如何有效地与这些人工智能模型互动，发挥出它们的最大潜力，却是一个经常被忽视的话题。

中国科学技术大学心理学系特任研究员林志成关注到这一话题，并在他最近的评论文章中提供了一系列的策略和指导，希望帮助人们更好地理解和“用好”这些先进的人工智能工具，生成更精准的回答。相关研究成果日前发表于《自然-人类行为》。

近日，《中国科学报》记者采访了林志成。“从本质上来看，大语言模型是一个数学模型，缺乏对语义的理解。它只能‘预测下一个文字’出现的概率，而不能生成‘真理’。”林志成建议在输入指令时，可以使用分解复杂任务、增加相关语境、角色扮演、提供具体示例等8个小技巧。

分解复杂任务

由于缺乏对语义的理解，因此想要大语言模型自己“举一反三”，是很难的。但是，它有海量的数据、珍贵的“记忆”，可以从中提取信息。这套记忆来源于训练数据——长期记忆，还有人们日常给予的指令——短期记忆。

因此，用好大语言模型，林志成给出的第一个小技巧是拆分复杂任务。

例如，不要直接给出“将文本翻译成中文”这样宽泛的指令，可以考虑把它拆解成两步：首先按字面意思翻译，保持含义不变；然后意译，让文本符合中文的语言习惯。

类似地，与其让它直接写出一篇1000字的论文，不如尝试把任务分解成子任务，用具体的指令分别生成概述、结论和中心论点。

林志成说，“清晰、逐步的指令，会降低模糊性和不确定性，因此可以生成更为准确的答案。”

添加相关语境

大语言模型比人类的“短期记忆”多太多了。因此，想要让它提供精准且符合问题语境的回复，在输入时提供相关的语境就很重要。这是第二个小技巧。

林志成说，一个限定语境的问题应当包含具体内容，将问题放在具体的细节中，这样才能引导大语言模型产生更为准确、相关的理解力，生成更有洞察力、更精细的回复。

例如，让大语言模型起草一份求职简历，事先要把企业发布的具体职位需求、个人基本情况等内容一并提供给它，如此一来，输出的简历则更具有针对性。

明确的指令

当你走进一间咖啡馆，想要点一杯喜欢的饮料，应该不会说：“请来杯咖啡。”而是会说，“来杯摩卡或者拿铁。”

同样地，你也不要期待大语言模型能读懂你的心。

林志成指出，要想降低模型预测时的不确定性，就要给出明确的指令。这是第三个小技巧。

例如，你让大语言模型修改文章，不要说“润色这篇文章”，而要具体到修改成什么风格、文章的目标受众是谁……

林志成说，一段更具体的指令甚至可以是“像个顶级期刊的顶级编辑那样，润色这篇文章，让它更为清晰流畅。”

让它提供多种选项

大语言模型还拥有巨大的“长期记忆”，超强的生产能力。你可以让它提供多种版本的选项，而不仅仅是一个版本内容。

“很多时候，人们潜意识里认为，大语言模型给出的就是最优答案。但就文本写作而言，它并不是一个简单量化的东西，它具备很多主观色彩。因此很难判断大语言模型第一次给出的就是最优答案。”林志成说，此时，可以让大语言模型提供多种选项，再鉴赏出符合个人需求的答案。这是第四个小技巧。

此外，林志成建议，除了要求大语言模型提供多种选项外，还可以考虑重复用同样的指令多次生成回复。

设定角色

大语言模型特有的“长期记忆”还意味着它能够模拟各种角色，提供专业的反馈或者独特的视角解读。

例如，模仿典型读者，提供写作上的反馈；扮演一名写作教练，帮助修订文稿；甚至可以扮演一只擅长人类生理学的西藏牦牛，以其独特的视角解释高海拔对心肺功能的影响。这是第五个小技巧。

林志成说，“让大语言模型扮演不同角色，不仅能获得更多有针对性和符合语境的回复，而且在这个过程中，还能获得更多乐趣。”

提供具体例子

大语言模型擅长小样本学习。林志成说，“一个特别有效的手段就是使用具体的例子丰富想法。就像你去理发店，对理发师描述想要的发型，最好的方法是拿一张照片，胜过千言万语。”这是第六个小技巧。

例如，不要模糊地说“以这些数据制图”，而是提供一个例子，如“为这些数据画个条形图，类似附件论文中的图”。另一个例子是，当你让大语言模型根据文稿生成摘要时，可以提供几个你打算投稿的期刊中的摘要样例。语言模型可以参考这些例子来生成符合期刊风格的摘要。

“这些具体的例子就像路线图一样，指导大语言模型朝着与你期望一致的方向生成内容。”林志成说。

声明想要的输出格式

林志成说，大语言模型经常“废话太多”。例如，让它修改一篇文章，它可能会把修改的细节一并反馈，但其实你只需要最后的成稿。

此时，可以要求大语言模型仅输出修改后的内容。类似地，可以指定回复的格式，包括列表格式、阅读水平和语气等。用列表格式和通俗的语气能够提升回复的可读性；限制回复的长度可以使内容更加简洁；设定阅读水平则有助于更好地理解。这是第七个小技巧。

例如，与其让其“总结关键发现”，不如声明回复格式：“用列表形式总结关键发现，并使用高中生能够理解的语言”。

实验、实验、再实验

“需要指出的是，如何使指令更有效，并没有确切的答案。有时，稍微调整一下，可能就会产生显著甚至意外的惊喜。”林志成说，实验、实验、再实验，是最好的办法。这也是第八个小技巧。

例如，在一系列推理问题中，在指令中简单加入“一步一步思考”就可以让大语言模型表现地更好。

更有意思的是，大语言模型还可以回应“情绪性的信息” 。假如你要让它修改一篇未经同行审议的论文，可以在指令中加入一些短语：“深呼吸一下，这事对我的职业生涯很重要。”

林志成说，这些例子证明大语言模型对指令非常敏感。但并非所有尝试都会成功，但每次尝试都会有新的收获，并在一定程度上提升工作效率，增加乐趣。

相关论文信息：https://doi.org/10.1038/s41562-024-01847-2

编辑部推荐博文
科学网博主姬扬最新译作！揭开半导体奥秘｜赠书 MDPI 2023 最佳论文奖隐含了哪些热门研究方向？阿卜杜拉国王科技大学NazekEl-Atab等：柔性光学忆阻阵列别让不会写Paper，阻挡你发Nature 建筑与土木工程领域高质量期刊一览夏日拾光：一个充实的暑期体验更多>>