重現(xiàn)論文里的代碼
我準備復現(xiàn)的是Point2roof的代碼。這是第一次復現(xiàn)論文代碼,所以記錄一下^ _ ^。
從GitHub找到他的項目point2roof項目。
先把工程down下來 ^ _ ^ 。
看他工程里面提供的README。
這篇里面提到他的數(shù)據(jù)集,我也順便下載下來了。目前只是想跑一下代碼,好像沒必要下載數(shù)據(jù)集?
接下來按照他說的安裝環(huán)境。
我這里是先從網(wǎng)上把PyTorch下載到本地,然后通過WinSCP拖到實驗室的服務器里面。WinSCP使用過程就不介紹了。
主要是下載時要注意服務器里面的python的版本。
服務器里面已經(jīng)安裝了CUDA驅(qū)動和 Anaconda ,我們幾個共用一個賬號,前面的兄弟已經(jīng)裝起來了,所以我直接用現(xiàn)成的。
他記錄的配置環(huán)境的博客Linux服務器上配置論文代碼環(huán)境。
先看服務器上的python版本。
烏龍了!我之前服務器沒沒進去,查看的時本地的python版本,所以下載的時3.9版本的。(T_T)。
PyTorch下載的時候要看CUDA的版本和自己python的版本。
查看CUDA版本命令如下:
對了CUDA是使用GPU的時候選的版本,如果時使用CPU的話,選CPU的版本就好。下載地址PyTorch下載地址
感覺python版本是不是可以根據(jù)
更新服務器python版本
搞錯了,這里應該先用conda創(chuàng)建虛擬環(huán)境,之后再安裝更新python。
conda 創(chuàng)建虛擬環(huán)境
先查看一下已經(jīng)創(chuàng)建的虛擬環(huán)境。
conda 創(chuàng)建虛擬環(huán)境的命令為:conda create -n your_env_name python=3.9
在這里就可以選擇python的版本。
刪除配置的虛擬環(huán)境:conda env remove --name your_env_name
刪除前面測試時配置的虛擬環(huán)境pointnet
現(xiàn)在激活我們創(chuàng)建的point2roof虛擬環(huán)境。conda activate your_env_name
推出命令是:conda deactivate
現(xiàn)在開始安裝PyTorch (灬oωo灬)
先進入自己下載的安裝包的路徑下。然后使用pip install torch-1.9.1+cu102-cp39-cp39-linux_x86_64.whl
開始安裝
安裝完成進入python驗證一下。
安裝成功。
按照README提示的命令運行一下。
然后到有test.py 的路勁下命令行輸入:python test.py
按照提示缺什么包就安裝什么包。
需要注意的是
安裝 yaml這個庫pip 里要加py前綴
安裝sklearn時使用的時scikit-learn這個包。
——>遇到找不到路徑的問題時,按照提示修改路勁。
程序提示torch 找不到CUDA!!!
我在外面檢查torch時顯示找到了CUDA,但是程序開始跑的時候,就找不到CUDA?。。?br>
看了這篇No CUDA GPUs are available問題解決我在最前面加了
print(torch.cuda.is_available())
不在報這個錯誤了?。?/p>
文件中路徑的選擇
看清楚服務器中當前程序運行時的路徑是什么?。?!
我的是在這里
完整的路徑應該是“/home/c1316/hqq/point2roof/Point2Roof-master/model_cfg.yaml”
要看vscode打開的路勁,而不是test.py文件所在路徑
(感覺理解有點問題?。。。?
test.txt中的路徑修改為如下
batch size 的設置與程序的運行有關系?
原始程序batch size設置為1.我運行,就會莫名奇妙奔潰,有時會如下錯誤報錯
報錯如下:
看這篇<測試模型時RuntimeError: >說調(diào)整batch size 大小就可以改善。我設置為20 有時能跑,有時又跑不起來,始終跑不完.如下:
運行到這就奔潰了?。?!T_T
值調(diào)整為40 程序能跑完,但是結(jié)果不太正確!
邊緣精度為nan.
不知道哪里出錯了!!文章來源:http://www.zghlxwxcb.cn/news/detail-674822.html
但是這個環(huán)境應該是可以了吧!
(batch size 不會影響影響程序的,如果過大會導致資源不夠會溢出,過小應該不會又問題?。?!)
后面針對這個問題在找一下具體原因。- _ -!!!文章來源地址http://www.zghlxwxcb.cn/news/detail-674822.html
到了這里,關于服務器上運行跑深度學習代碼(一)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!