RWKV 中文文档
欢迎来到 RWKV 中文文档,你可以在这里学习与 RWKV 相关的知识,包括 RWKV 的架构介绍和历史版本、微调教程、训练方法,以及 RWKV 的社区生态等内容。
左侧的文档目录包含所有 RWKV 文档。当然,也可以根据您的需求,选择下列文档作为起点:
了解 RWKV
对于刚接触 RWKV 的用户,你可能想知道 RWKV 是什么。
ℹ️
RWKV 是一个大语言模型架构,基于这个架构训练出来的 RWKV 模型可以生成文本。
有一些 RWKV 的多模态模型可以生成图像、声音等多种形态的内容。
对于 RWKV,您可能想了解这些事情:
关于 RWKV
关于 RWKV 的简述,包括 RWKV 的主要架构版本、模型和论文发布情况等信息
如何体验 RWKV 模型?
我是新手,只想试用一下 RWKV 模型,该怎么做?
RWKV 的模型种类和下载方法
RWKV 都有什么类型的模型?如何下载这些 RWKV 模型?
RWKV 的架构发展历史
了解 RWKV 从创建至今的架构变更和设计思路。⚠️注意:此章节需要一定的神经网络基础
本地部署 RWKV 模型
对 RWKV 感兴趣,希望在本地部署 RWKV 模型?RWKV 有 RWKV Runner 和 Ai00 两款社区开发的本地部署工具,也支持 llama.cpp、Ollama 等常见的模型推理工具。
下列每个文档归属于不同的推理工具,请根据您的需求选择文档:
RWKV Runner 教程
RWKV 本地部署软件,带新手友好的图形化界面。支持一键安装和 API 调用
Ai00 教程
基于 WebGPU(vulkan) 的推理工具,支持大多数 GPU 和集显,支持 nf4/int8 量化推理
llamacpp 教程
一个轻量化的大语言模型运行框架,专门优化了在 CPU 上运行模型的性能。
Ollama 教程
Ollama 支持在个人电脑上一键部署和运行各类开源模型,配置简单、资源占用低
KoboldCpp 教程
简单易用的 AI 模型推理和文本生成工具,基于 llama.cpp 构建
text-generation-webui 教程
text-generation-webui 提供了一个友好的网页界面,可以轻松地在 Web 页面中配置和运行模型
改善模型的生成质量
觉得 RWKV 模型生成的内容质量不符合预期?尝试调整 RWKV 的解码参数和提示词(prompt),使模型生成的内容更符合您的需求:
微调 RWKV 模型
如果你希望 RWKV 模型能在某种任务上表现更好,可以尝试对 RWKV 模型进行微调训练。
ℹ️
微调 RWKV 模型是使用特定领域(如法律、文学、医学等)或任务(材料总结、小说续写等)的高质量数据集,调整 RWKV 模型的参数,使模型在对应任务的表现更好且更稳定。
如果您对微调感兴趣,但没有丰富的微调经验,建议依次阅读以下文档:
什么是微调
什么是微调训练?微调 RWKV 模型需要什么硬件资源?
配置微调训练的软件环境
配置微调训练的软件环境,包括 Conda 虚拟环境和 Pytorch 等软件包
准备微调数据
根据你的目标任务,收集特定格式的训练数据,将其处理为 binidx 格式
在确认您拥有微调所需的数据集、软件环境和硬件资源后,可以选择一种方法开始微调 RWKV 模型:
DiSHA 微调教程【推荐】
一种新颖的微调方法,速度更快,效果比 LoRA 更好
State Tuning 微调教程
RWKV 的特色微调方法,使模型快速学习某种生成风格,或学习特定的生成格式
LoRA 微调教程
LoRA 微调是非常经典的 PEFT 参数微调方法
Pissa 微调教程
PiSSA 微调可以看作是 LoRA 的优化版本,但效果更好
遇到问题?
如果你遇到任何文档相关的问题,请通过发送邮件或加入 QQ 交流群 224287095 向我们反馈。