RWKV 微调教程
微调环境配置

要训练 RWKV 模型,请先遵循以下步骤,为你的 Linux 系统配置训练环境。

配置虚拟环境(conda)

RWKV 模型的微调训练默认虚拟环境为 conda ,如果不知道如何配置 Linux 系统的 conda ,请参考此文章 (opens in a new tab)

安装训练所需的软件

要获得 RWKV 模型的最佳训练性能,你需要安装如下软件:

  • python 3.10
  • torch 2.1.2+cu121(或最新版本)
  • cuda 12.3+
  • 最新的 deepspeed
  • 保持 pytorch-lightning ==1.9.5

在 Linux 环境中依次运行以下命令:

pip install torch --upgrade --extra-index-url https://download.pytorch.org/whl/cu121
pip install pytorch-lightning==1.9.5 deepspeed wandb ninja --upgrade

第一条命令通过指定 url 安装 cu121 版本的 torch :

FT-Environment-install-torch

第二条命令安装 PyTorch LightningDeepspeedWandB(Weights & Biases)Ninja 包,并指定安装 1.9.5 版本的 PyTorch Lightning

FT-Environment-install-other

-- upgrade 参数意味着如果环境中已经安装了对应的软件包,则将其升级到最新版本。

ℹ️

推荐的软件版本为 RWKV 训练的最佳实践,你也可以选择安装新版本的软件,只要保证兼容性即可。

检查 CUDA 环境

上述依赖安装完毕后,你应该已经同时安装好最新版本的 Torch 和 CUDA 12.1 工具包。

依次运行以下命令,检查 PyTorch 的版本和 CUDA 工具是否可用:

python3 # 启动 python3
 
import torch # 导入 torch 包
 
# 打印 PyTorch 版本
print(f"PyTorch version: {torch.__version__}") 
 
# 检查 CUDA 是否可用
print(f"CUDA available: {torch.cuda.is_available()}")
 
# 打印 CUDA 版本
print(f"CUDA version: {torch.version.cuda}")
 
# 打印可用的 GPU 数量
print(f"Number of GPUs: {torch.cuda.device_count()}")
 

如果 CUDA available: True ,证明 CUDA 环境可用。如果返回 False ,请重新安装 CUDA 环境(cuda 12.3+)。

参考检查结果:

ft-environmen-check-cuda