您的关注是对我最大的支持👇
零尝试思维链(Zero-shot-CoT)提示是对思维链(CoT)提示的一种后续方法,引入了一个极其简单的零尝试提示。他们发现,通过在问题的结尾添加“让我们一步一步地思考。”这些词,LLM能够生成一个回答问题的思维链。从这个思维链中,他们能够提取出更准确的答案。
技术上,完整的零尝试-CoT过程包括两个单独的提示/完成。在下面的图像中,左侧的顶部气泡生成了一个思维链,而右侧的顶部气泡接受了第一个提示的输出(包括第一个提示本身),并从思维链中提取答案。这第二个提示是自我增强型提示。 示例以下是一些演示(仅执行推理提取)。这个第一个演示展示了GPT-3(davinci-003)未能解决一个简单的数学问题,而第二个演示使用了零尝试-CoT提示并成功解决了这个问题。请尝试这些示例。请注意,与CoT提示相比,零尝试-CoT提示要简单得多。不正确的提示词:
如果约翰有5个梨,然后吃掉2个,再买5个,然后给朋友3个,他还有多少个梨?
AI返回结果:
约翰有8个梨。
正确的提示词:
如果约翰有5个梨,然后吃掉2个,再买5个,然后给朋友3个,他还有多少个梨? 让我们一步一步地思考。
AI返回结果:
约翰开始有5个梨。他吃了2个梨,剩下3个梨。他买了5个梨,总共有8个梨。他给了朋友3个梨,所以他只剩下5个梨。
结果
零尝试-CoT在改进算术、常识和符号推理任务的结果上也非常有效。然而,不足为奇的是,它通常不如CoT提示有效。零尝试-CoT的一个重要用例是当很难获得CoT提示的少量示例时。
兴趣消融
小岛等人尝试了许多不同的零尝试-CoT提示(例如“让我们通过分步骤解决这个问题。”或“让我们从逻辑上思考一下。”),但他们发现“让我们一步一步地思考。”对于他们选择的任务最有效。
注释
提取步骤通常必须是任务特定的,这使得零尝试-CoT不如一开始看起来的那么通用。 有时候,零尝试-CoT样式的提示在改善生成任务的完成长度方面也是有效的。例如,考虑标准提示“写一个关于一只青蛙和一朵蘑菇成为朋友的故事。”在这个提示的结尾添加“让我们一步一步地思考。”会导致更长的完成。
明日预告
《思维链的自洽性-AI基础系列文章第29篇》