NVIDIA 硬件

此页面的数据来自:RWKV 推理性能测试指南,欢迎大家参照仓库的指引进行测试,并提交 NVIDIA 硬件的性能数据。

NVIDIA RTX 4090

RWKV 模型在 NVIDIA RTX 4090 上的性能表现:

推理工具Model精度每秒生成的 Token 数显存用量
RWKV pipRWKV7-G1 2.9Bfp1656.185.52 GB
llama.cppRWKV7-G1 2.9Bfp1689.165.75GB
llama.cppRWKV7-G1 2.9BQ8_0110.33.47GB
web-rwkvRWKV7-G1 2.9Bfp1695.985.9GB
web-rwkvRWKV7-G1 2.9Bint8108.223.9GB
web-rwkvRWKV7-G1 2.9Bnf4115.462.4GB

测试环境:

  • CPU:Intel(R) Xeon(R) Platinum 8331C
  • OS: ubuntu 22.04 Linux-6.8.0-60-generic-x86_64-with-glibc2.35
  • python_version: 3.10.16
  • pytorch_version: 2.5.1+cu121

NVIDIA RTX 4060Ti 8GB

RWKV 模型在 NVIDIA RTX 4060Ti 8GB 上的性能表现:

推理工具Model精度每秒生成的 Token 数显存用量
RWKV pipRWKV7-G1 2.9Bfp1636.615.52 GB
web-rwkvRWKV7-G1 2.9Bfp1643.925.9GB
web-rwkvRWKV7-G1 2.9Bint862.933.9GB
web-rwkvRWKV7-G1 2.9Bnf486.032.4GB

测试环境:

  • CPU:Intel i7-13700F
  • OS version: Windows10 专业版
  • driver version: 576.02
  • CUDA version: 12.9
这份文档对您有帮助吗?

意见反馈(可选)

联系方式(可选)

On this page