RWKV 的提示词格式
RWKV 是 RNN 的变体。出于架构原理,RWKV 对提示词的格式比 Transformer 更敏感。
RWKV 更适合 QA 和指令问答两种提示格式:
QA 格式 prompt
QA(问答)格式是 RWKV 的默认训练格式。
其中 User:
是用户提问的问题,Assistant:
是模型的回答。因此我们需要在最后一个 Assistant:
后面留空,让模型进行续写。
指令问答格式 prompt
指令问答是 RWKV 另一种训练格式。其中 Instruction:
是用户给模型的指令,Input:
是用户给模型的输入,Response:
是模型的回答。
Response:
后面留空,让模型进行续写。
参考的回复:
RWKV7-G1 专用格式
RWKV7-G1 模型专用的提示词格式如下:
这是 RWKV7-G1 系列的专用 Prompt 格式,尤其适合 RAG 等总结材料总结场景。其中 Question:
后面是用户给模型的问题,Answer:
后面留空,让模型进行回答。
也可以把 Question:
和 Answer:
换成 User:
和 Assistant:
:
推荐把 Temperature、Top-p、Penalty 等解码参数调整为 0。
few-shot
对于一些带上下文的问答任务,我们建议在 prompt 中重复几个同类的问题为模型作示范,这种技巧被称为 few-shot。
举个例子:如果你直接使用以下 prompt 进行续写,模型会告诉你自己是 AI 助手,所以不需要吃饭:
参考的模型回复:
如果我们使用下面这个 few-shot prompt 进行续写,模型可以从上下文中获得“我可以吃饭”这个信息,就会正常回答“你明天中午吃什么?”问题:
参考的回复:
function call
RWKV7-G1 模型包含函数调用(function call)数据,可以通过特定格式的 prompt 实现 function call 功能。
RWKV7-G1 2.9B 模型,在续写模式下构造 function call 功能:
参考的回复:
通过在 Agent 或者 RAG 系统中解析此 json 请求,可以实现 function call 功能。
RWKV 基底模型未进行后训练,因此不支持 native tool calling。如果需要保持极高的 function call 准确度,建议对模型进行微调。
视频介绍
高画质视频请跳转到 B 站观看。
意见反馈(可选)
联系方式(可选)