提示工程之思维链提示-AI基础系列文章第27篇
  rZPtsnyq762X 2023年11月02日 56 0

您的关注是对我最大的支持👇


        思维链(CoT)提示是一种最近开发的提示方法,鼓励LLM解释其推理过程。下面的图像1显示了一些示范性标准提示(左)与思维链提示(右)的对比。

        CoT的主要思想是通过向LLM展示一些示范性标本,其中在示范性标本中解释了推理过程,LLM在回答提示时也会显示出推理过程。这种推理的解释通常会导致更准确的结果。

示例

        这里有一些演示。第一个示例展示了GPT-3(davinci-003)无法解决一个简单的单词问题。第二个示例展示了GPT-3(davinci-003)通过使用CoT提示成功解决了相同的问题。

不正确提示词:

哪种方式更快到达工作地点?
选项1:乘坐1000分钟的公交车,然后坐半小时的火车,最后骑自行车10分钟。
选项2:乘坐800分钟的公交车,然后坐一小时的火车,最后骑自行车30分钟。

AI返回结果:

选项1是到达工作地点更快的方式。
选项1是到达工作地点更快的方式。

正确提示词:

哪种方式更快到家?
选项1:乘坐10分钟的公交车,然后坐40分钟的公交车,最后坐火车10分钟。
选项2:乘坐90分钟的火车,然后骑自行车45分钟,最后坐公交车10分钟。
选项1将花费10+40+10 = 60分钟。
选项2将花费90+45+10=145分钟。
由于选项1花费了60分钟,而选项2花费了145分钟,因此选项1更快。

哪种方式更快到达工作地点?
选项1:乘坐1000分钟的公交车,然后坐半小时的火车,最后骑自行车10分钟。
选项2:乘坐800分钟的公交车,然后坐一小时的火车,最后骑自行车30分钟。

AI返回结果:

选项1将花费1000+30+10 = 1040分钟。
选项2将花费800+60+30 = 890分钟。
由于选项2花费了890分钟,而选项1花费了1040分钟,因此选项2更快。

结果        CoT已被证明在改进算术、常识和符号推理等任务的结果上非常有效。特别是,受提示的PaLM 540B2在GSM8K3上取得了57%的解决率准确性(在当时是SOTA)。局限性        根据韦伟等人的说法,“CoT只在与∼100B参数的模型一起使用时才能获得性能提升”。较小的模型写出了不合逻辑的思维链,导致准确性不如标准提示。通常情况下,模型会在与模型大小成比例的方式下获得CoT提示的性能提升。


明日预告《零点思维链-AI基础系列文章第28篇》



【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
rZPtsnyq762X