关于prompt的调试,有些问题想问一下。
问题∶在编写prompt的时候,想要尽可能详细的描述。但是过长的prompt,从模型的输出结果看似乎会忽略prompt中的部分内容。想要将一个大prompt进行拆分,又不太知道应该怎么拆合适。
关于这部分问题,有什么比较好的方法论或者思考方式吗?
备注∶用的大模型(Qwen和Gemma)--------------------------------------------------
你的部分理解是对的,过于冗长复杂的提示词,会稀释大模型的注意力。我打个比方,即时对人类,一次性提出20个要求,结果可能是他一个都记不住,更别提完成的好了。大模型也一样。
所以,不是要“尽可能详细”的描述,而是“尽可能清晰的描述”,何谓清晰?主次分明,逻辑清楚。未必说得多就叫清晰。
方法论就是在足够清晰的描述前提下,约简单越好。
PS,你用的这俩模型我都没用过,为啥选这俩啊。