一本正经的胡说八道也有理:测试GPT-4 Turbo在接收到金钱激励(即“小费提示”)时的表现
实验方法:使用OpenAI API和GPT-4 Turbo模型,设计了一系列包含不同小费激励的提示。小费金额从0美元到100万美元不等。实验进行了五次迭代,每次都测试了完整的小费激励范围。
实验过程:初始化OpenAI客户端,定义基础提示,迭代过预设的小费金额,将每个金额附加到基础提示上,发送提示给GPT-4 Turbo模型,然后分析响应,记录有效一行代码的数量和响应长度(以字符计)。
实验结果:实验结果显示,随着小费金额的增加,质量和响应中的标记(tokens)数量总体上有所增加,但这种趋势并非严格线性或一致。例如,1万美元的小费水平相比较低的小费水平显示出显著的标记数量增加。100万美元的小费金额在实验中显示出戏剧性的标记数量增加。
- 0.1美元效果最差,还不如不给,估计对于大模型来说这就跟你微信抢红包抢了1分钱一样的感觉吧
- 20 美元性价比最高
- 10万-100万美元之间,钱越多效果越好
原文地址:
链接

