一、docker 配置 gpu版pyhorch環(huán)境
1、顯卡驅(qū)動(dòng)、cuda版本、pytorch cuda版本三者對(duì)應(yīng)
- 自行查看:三者對(duì)應(yīng)版本信息
2、拉取鏡像
-
直接在
docker.hub
中拉取pytorch
鏡像:???????找到自己所需要的環(huán)境 pytorch鏡像 -
點(diǎn)擊復(fù)制 devel 版鏈接
docker pull pytorch/pytorch:1.9.1-cuda11.1-cudnn8-devel
二、部署Anomalib
1、下載Anomalib
- Anomalib github 地址
2、創(chuàng)建容器并且運(yùn)行
我們需要docker容器中運(yùn)行Anomalib,所以需要把主機(jī)文件掛載到容器中
- 主機(jī)路徑:
/home/dell/ljn/anomalib
docker run -it --name="pytorch_docker" \
--gpus=all \
--shm-size=64G \
-v /home/dell/ljn/anomalib:/workspace/anomalib \
pytorch/pytorch:1.9.1-cuda11.1-cudnn8-devel /bin/bash
沒(méi)有加這一行--shm-size=64G
在docker中運(yùn)行pytorch會(huì)報(bào)錯(cuò)
ERROR: Unexpected bus error encountered in worker. This might be caused by insufficient shared memory (shm).
- 由于在docker鏡像中默認(rèn)限制了shm(shared memory),然而數(shù)據(jù)處理時(shí)pythorch則使用了shm。這就導(dǎo)致了在運(yùn)行多線程時(shí)會(huì)將超出限制的DataLoader并直接被kill掉。
-
--shm-size=64G
:這里設(shè)置為64G,根據(jù)自身電腦性能進(jìn)行設(shè)置 - 容器運(yùn)行后可以看到掛載的目錄
jn@ljn-Alienware-13:~/ai_project/anomalib$ ./run_docker.sh
root@440738bd07a3:/workspace# ls
anomalib
root@440738bd07a3:/workspace#
- 驗(yàn)證
ncvv -V
nvidia-smi
3、安裝Anomalib
進(jìn)入項(xiàng)目路徑
cd anomalib/anomalib-main
安裝依賴
pip install update
pip install -e .
pip install wandb
測(cè)試:
-
執(zhí)行
python tools/train.py
-
運(yùn)行報(bào)錯(cuò):
ImportError: libGL.so.1: cannot open shared object file: No such file or directory
-
需要安裝opencv
apt-get update apt-get install libopencv-dev
-
再次執(zhí)行:
python tools/train.py
-
報(bào)錯(cuò)
ImportError: cannot import name 'KeypointRCNN_ResNet50_FPN_Weights' from 'torchvision.models.detection' (/opt/conda/lib/python3.7/site-packages/torchvision/models/detection/__init__.py)
-
torchvision
版本不兼容或缺少相關(guān)模塊導(dǎo)致的,更新版本pip install --upgrade torchvision
-
再次執(zhí)行:
python tools/train.py
文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-732051.html -
運(yùn)行成功:到此Anomalib項(xiàng)目部署完成
文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-732051.html
到了這里,關(guān)于docker 配置 gpu版pytorch環(huán)境--部署缺陷檢測(cè)--Anomalib的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!