LLMs之Prompt:《The Prompt Report: A Systematic Survey of Prompting Techniques》翻译与解读
导读:这篇论文主要描述了目前常用的自然语言输入技术—"提示"(prompting)。论文还收集了近1.6万篇与提示技术相关的文献,并使用机器学习算法分析这些文献,提取出58种文本提示技术和40多种多媒体提示技术。论文重点介绍了上下文学习、零示范提示、思考生成和集成这几类提示技术,并举例说明了它们在自然语言处理任务中的应用。
>> 背景痛点:虽然Prompt技术在生成式人工智能系统中得到广泛使用,但该领域缺乏统一的术语和框架,术语混乱,对什么构成Prompt缺乏本体学理解。虽然Prompt技术的文献急剧增加,但只有一小部分技术和术语为从业人员所熟知。
>> 解决方案:该论文建立了一个Prompt技术的结构化理解,包括33个词汇术语、58种纯文本Prompt技术、40种其他模态(如多语种、多模态)的技术。对自然语言前缀Prompt的全部文献进行了元分析。
>> 核心思路步骤:
● 采用PRISMA系统评审过程,识别出58种基于文本的Prompt技术,并构建一个分类法。
讨论了多语种Prompt技术,如思维链、上下文学习、示例选择等。论文首先总结了目前主流的提示技术,将其分为以下几类:
基于上下文学习(in-context learning)。使用示例来教导模型完成任务,而无需重新训练权重。
零示范提示:使用简单的说明来引导模型,而无需示例。
思考生成:使用提示来引导模型表达其推理步骤。
分解:将复杂问题分解成简单子问题。
集成:使用多个提示来综合模型预测。
自我批判:使用提示来评估和改进模型自身预测。
● 探讨了多模态Prompt技术,如图像Prompt、音频视频Prompt、3D Prompt等。
● 介绍了一些Prompt技术的扩展,如利用外部工具的代理Prompt、用于评估Prompt输出的方法等。
● 分析了Prompt技术在安全性、对齐性等方面的一些问题及相应的缓解措施。
● 通过两个案例研究,对比评测了多种Prompt技术的表现。
>> 优势:
● 建立了Prompt领域的统一术语和分类框架,有利于从业者理解和实践。
● 系统全面地调研和总结了现有的Prompt技术,为后续研究提供资源参考。
● 探讨了Prompt技术在多语种、多模态、评估、安全等多方面的扩展应用。
● 案例研究对比了不同技术的实际效果,提供了实践指导。
总的来说,这篇论文系统地梳理和归纳了Prompt技术的方方面面,为该领域的后续发展奠定了基础。系统梳理了目前提示技术的分类体系,提出了术语的明晰定义,并对代表性技术进行了详细介绍。作者通过大量文献的梳理,给出了目前研究领域的较全面综述,为进一步提高提示效果奠定了理论基础。