关于prompt的调试,有些问题想问一下。 问题∶在编写prompt的时候,想要尽可能详细的描述。但

关于prompt的调试,有些问题想问一下。
问题∶在编写prompt的时候,想要尽可能详细的描述。但是过长的prompt,从模型的输出结果看似乎会忽略prompt中的部分内容。想要将一个大prompt进行拆分,又不太知道应该怎么拆合适。
关于这部分问题,有什么比较好的方法论或者思考方式吗?
备注∶用的大模型(Qwen和Gemma)--------------------------------------------------
你的部分理解是对的,过于冗长复杂的提示词,会稀释大模型的注意力。我打个比方,即时对人类,一次性提出20个要求,结果可能是他一个都记不住,更别提完成的好了。大模型也一样。

所以,不是要“尽可能详细”的描述,而是“尽可能清晰的描述”,何谓清晰?主次分明,逻辑清楚。未必说得多就叫清晰。

方法论就是在足够清晰的描述前提下,约简单越好。

PS,你用的这俩模型我都没用过,为啥选这俩啊。

Ai破局

🙋 周鸿祎首堂免费AI公开课:2024年会是大模型场景应用元年 近日,2024开年AI领域迎来一场

2024-4-9 22:56:32

Ai破局

AGI时间表大公开丨神秘人士揭秘OpenAI「超级模型」计划,53页详细PDF!(速领) 今天凌晨,

2024-4-9 22:56:40

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索