淘先锋技术网

首页 1 2 3 4 5 6 7

paddle 无法使用多卡分布式

看 warning 信息可知,是缺少 nccl

You may need to install ‘nccl2’ from NVIDIA official website: https://developer.nvidia.com/nccl/nccl-downloadbefore install PaddlePaddle.

在这里插入图片描述

安装 nccl

英伟达官网 https://developer.nvidia.com/nccl/nccl-legacy-downloads
根据自己的 cuda 选择对应的nccl,这里以cuda11.2为例,
后面根据自己的 nccl2 和 cuda 版本修改相关命令

# 查看cuda版本
nvcc -V

在这里插入图片描述
也可使用命令行下载
在这里插入图片描述
下载完成
在这里插入图片描述
安装镜像库

apt-key add /var/nccl-local-repo-ubuntu1804-2.8.4-cuda11.2/7fa2af80.pub
dpkg -i nccl-local-repo-ubuntu1804-2.8.4-cuda11.2_1.0-1_amd64.deb

在这里插入图片描述
安装nccl

apt update
apt install libnccl2=2.8.4-1+cuda11.2 libnccl-dev=2.8.4-1+cuda11.2

在这里插入图片描述
将nccl添加到环境变量中

# 修改~/.bashrc文件
vim ~/.bashrc

# 将以下内容写入文件末尾,cuda版本修改成自己的版本
export LD_LIBRARY_PATH=/usr/local/cuda-11.2/lib64
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/lib/x86_64-linux-gnu
# 使文件的配置生效
source ~/.bashrc

nccl 安装完成

在这里插入图片描述