NVIDIA 硬件

RWKV 模型在 NVIDIA 硬件上的推理性能,包含 RTX 5090、RTX 4090 等显卡的性能数据。

NVIDIA RTX 5090

推理工具Model精度每秒生成的 Token 数显存用量
RWKV pipRWKV7-G1 2.9Bfp1639.55 TPS5.52 GB

测试环境:

  • CPU:AMD EPYC 7302
  • GPU:NVIDIA GeForce RTX 5090

NVIDIA RTX 4090

RWKV 模型在 NVIDIA RTX 4090 上的性能表现:

推理工具Model精度每秒生成的 Token 数显存用量
RWKV pipRWKV7-G1 2.9Bfp1626.585.52 GB
llama.cppRWKV7-G1 2.9Bfp1689.165.75GB
llama.cppRWKV7-G1 2.9BQ8_0110.33.47GB
web-rwkvRWKV7-G1 2.9Bfp16615.9GB
web-rwkvRWKV7-G1 2.9Bint868.753.9GB
web-rwkvRWKV7-G1 2.9Bnf477.762.4GB

测试环境:

  • CPU:Intel(R) Core(TM) Ultra 5 125H
  • GPU:NVIDIA GeForce RTX 4090
这份文档对您有帮助吗?

意见反馈(可选)

联系方式(可选)

On this page