iDRAC
參考:http://dbase.cc/2017/05/23/tools/Dell%20iDRAC%E6%9C%8D%E5%8A%A1%E5%99%A8%E8%BF%9C%E7%A8%8B%E6%8E%A7%E5%88%B6%E5%9B%BE%E8%A7%A3/
iDRAC又稱為Integrated Dell Remote Access Controller(集成式戴爾遠(yuǎn)程控制卡),是戴爾服務(wù)器的獨(dú)有功能。
iDRAC相當(dāng)于是附加在服務(wù)器上的一個(gè)計(jì)算機(jī),可以實(shí)現(xiàn)一對一的服務(wù)器遠(yuǎn)程管理與監(jiān)控,通過與服務(wù)器主板上的管理芯片BMC進(jìn)行通信,監(jiān)控與管理服務(wù)器的硬件狀態(tài)信息。
iDRAC擁有自己的系統(tǒng)和IP地址,與服務(wù)器上的OS無關(guān),是管理員進(jìn)行遠(yuǎn)程訪問和管理的利器,戴爾服務(wù)器集成了iDRAC控制卡,我們就可以扔掉價(jià)格昂貴的KVM設(shè)備了。
服務(wù)器帶外管理和iDRAC 接口
也就是標(biāo)識為iDRAC的接口
使用時(shí),將筆記本直接通過網(wǎng)線連接到這個(gè)接口
筆記本上設(shè)置以太網(wǎng)連接的屬性為手動(dòng)IP,例如192.168.0.100
然后ping 192.168.0.120(服務(wù)器的默認(rèn)的帶外IP)
理論上應(yīng)該是好使的
查看服務(wù)器的iDRAC地址
可以參考:http://dbase.cc/2017/05/23/tools/Dell%20iDRAC%E6%9C%8D%E5%8A%A1%E5%99%A8%E8%BF%9C%E7%A8%8B%E6%8E%A7%E5%88%B6%E5%9B%BE%E8%A7%A3/
以R750為例
在開機(jī)過程中不斷按F2,進(jìn)入這里:
這里就能看到iDRAC的IPV4地址是192.168.0.120
設(shè)置iDRAC地址:官方教程
https://www.dell.com/support/kbdoc/zh-cn/000181641/14g%e6%9c%8d%e5%8a%a1%e5%99%a8idrac%e8%bf%9c%e7%a8%8b%e6%8e%a7%e5%88%b6%e5%8d%a1%e7%9a%84%e4%bd%bf%e7%94%a8%e6%96%b9%e6%b3%95?lang=zh
設(shè)置iDRAC地址
以R750為例
在開機(jī)過程中不斷按F2,進(jìn)入這里:
之后不用管,會(huì)進(jìn)入這里:
進(jìn)入iDRAC Settings,之后進(jìn)入Network:
之后就可以設(shè)置iDRAC的IP地址了:
這里將服務(wù)器的iDRAC IP設(shè)置為了192.168.0.120
之后使用筆記本 通過網(wǎng)線連接服務(wù)器iDRAC接口
筆記本以太網(wǎng)地址手動(dòng)設(shè)置為類似192.168.0.100這種
然后再筆記本上 ping 192.168.0.120 -t
應(yīng)該就可以ping得通
用筆記本的瀏覽器訪問192.168.0.120就能進(jìn)行服務(wù)器硬件的各種管理了
恢復(fù)iDRAC出廠配置
機(jī)器重啟按F2進(jìn)BIOS ,選擇iDRAC Settings
重置iDRAC(根據(jù)實(shí)際情況選擇)
- 選擇Reset iDRAC configurations to defaults
將iDRAC重置為出廠默認(rèn)值將從非易失性存儲設(shè)置恢復(fù)。但保留iDRAC網(wǎng)絡(luò)設(shè)置和用戶帳戶 - 選擇Reset iDRAC configurations to defaults all
將iDRAC重置為出廠默認(rèn)值將從非易失性存儲設(shè)置恢復(fù)。注意:(iDRAC Settings的所有設(shè)置都恢復(fù)成默認(rèn)值) - 選擇Reset iDRAC configurations to default factory settings
將iDRAC配置重置為默認(rèn)出廠設(shè)置將從非易失性存儲設(shè)置中恢復(fù)。注意:用戶名和密碼重置為系統(tǒng)前面板上系統(tǒng)信息標(biāo)簽上的默認(rèn)裝運(yùn)值
我這次選的是第二個(gè)
重置之后,iDRAC的IP配置會(huì)回到DHCP狀態(tài)
這之后需要重新配置為靜態(tài)IP
R750 消費(fèi)者級NVIDIA顯卡風(fēng)扇異響
Dell R750 機(jī)架式服務(wù)器安裝NVIDIA消費(fèi)者級顯卡后,顯卡一使用,顯卡風(fēng)扇就發(fā)出異響:間歇性嘯叫。
可以通過iDRAC進(jìn)行硬件配置,來緩解此問題:
筆記本接入iDRAC接口,筆記本配置好靜態(tài)IP,使用ssh連接iDRAC:
ssh root@192.168.0.120
其中root為用戶名,口令為BIOS中設(shè)置的iDRAC口令,也就是192.168.0.120網(wǎng)頁界面所使用的口令
之后:
racadm get System.PCIESlotLFM //查看所有槽位信息
racadm get System.PCIESlotLFM.5 // get對應(yīng)槽位的信息,8 代表需要設(shè)定的具體槽位
racadm set System.PCIESlotLFM.5.LFMMode 2 //對PCIe Slot8 的LFM mode設(shè)置成custom, 0 auto(默認(rèn)), 1 disabled , 2 custom.
其中System.PCIESlotLFM.5
要換成實(shí)際有顯卡的槽位
再次racadm get System.PCIESlotLFM.5
,應(yīng)該可以看到LFMMode
變?yōu)?code>Custom:
測試顯卡風(fēng)扇情況
(請ChatGPT幫忙)寫了一小段代碼,用來提高GPU使用率,觀察顯卡情況:
conda activate project
python testfan.py
testfan.py內(nèi)容如下:
import subprocess
import torch
# 檢查GPU是否可用
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
def get_gpu_utilization():
try:
result = subprocess.check_output(['nvidia-smi', '--query-gpu=utilization.gpu', '--format=csv,noheader'], universal_newlines=True)
utilization = float(result.split('\n')[0].strip().rstrip('%'))
return utilization
except (subprocess.CalledProcessError, OSError):
return 0.0
def test_gpu_fan():
# 設(shè)置GPU設(shè)備
torch.cuda.set_device(0)
# 使用一個(gè)大型的矩陣進(jìn)行計(jì)算,以增加GPU使用率
matrix_size = 10000
matrix = torch.randn(matrix_size, matrix_size).to(device)
while True:
# 連續(xù)計(jì)算兩個(gè)隨機(jī)矩陣的乘積
result = torch.mm(matrix, matrix)
result = torch.mm(result, matrix)
# 同步當(dāng)前設(shè)備,確保所有計(jì)算已完成
torch.cuda.synchronize()
# 輸出GPU使用率
utilization = get_gpu_utilization()
print("GPU使用率: {:.2f}%".format(utilization))
if __name__ == "__main__":
print("開始測試GPU風(fēng)扇...")
test_gpu_fan()
此時(shí)GPU利用率很高,如果此過程中顯卡不異響,說明沒問題了。文章來源:http://www.zghlxwxcb.cn/news/detail-759061.html
文章來源地址http://www.zghlxwxcb.cn/news/detail-759061.html
到了這里,關(guān)于【服務(wù)器】帶外管理 | iDRAC接口 | R750顯卡風(fēng)扇異響 | GPU測試程序的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!