轉(zhuǎn)載請注明出處:小鋒學(xué)長生活大爆炸[xfxuezhang.cn]
一些概念
- Package:處理器封裝。在多處理器系統(tǒng)中,每個物理 CPU 芯片通常被封裝在一個單獨的封裝中,這個封裝被稱為 Package。一個 Package 可以包含一個或多個物理 CPU 核心。每個 Package 通常連接到一個或多個內(nèi)存控制器,以提供對系統(tǒng)內(nèi)存的訪問。
- NUMA Node:NUMA 節(jié)點。NUMANode 是 NUMA 架構(gòu)中的一個重要概念。在 NUMA 架構(gòu)中,系統(tǒng)內(nèi)存被劃分為多個 NUMA Node。每個 NUMA Node 包含與之關(guān)聯(lián)的一部分系統(tǒng)內(nèi)存和一組 CPU 核心。NUMA Node 是處理器和內(nèi)存的邏輯組合,它們共享一定的物理資源,如內(nèi)存控制器和高速緩存。
- Socket:插槽。通常用于描述物理 CPU 芯片的插槽或座槽,它是在主板上插入 CPU 芯片的物理接口。家用 PC 通常為單 socket,服務(wù)器通??芍С?2 socket,也有 4 或者 8 socket。不同的 socket 之間通常通過高速總線連接。
- NUMA affinity:NUMA 親和性。指的是將任務(wù)或進(jìn)程與特定 NUMA 節(jié)點相關(guān)聯(lián)的能力。通過設(shè)置 NUMA affinity,可以指定任務(wù)在特定 NUMA 節(jié)點上運行,以最大程度地減少遠(yuǎn)程內(nèi)存訪問和提高性能。當(dāng)一個任務(wù)與特定 NUMA 節(jié)點相關(guān)聯(lián)時,它將更有可能使用與該節(jié)點關(guān)聯(lián)的本地內(nèi)存。本地內(nèi)存是指與任務(wù)運行在同一 NUMA 節(jié)點上的 CPU 相關(guān)聯(lián)的內(nèi)存。這種本地內(nèi)存訪問速度更快,因為它與 CPU 直接相連,而遠(yuǎn)程內(nèi)存訪問則需要通過跨節(jié)點的內(nèi)存互連進(jìn)行訪問,速度較慢。
- CPU Affinity:CPU親和性。指的是將特定的計算任務(wù)或進(jìn)程與特定的CPU核心或CPU組進(jìn)行關(guān)聯(lián)的能力。它用于指定將任務(wù)分配給哪個CPU核心或一組CPU核心來執(zhí)行。通過設(shè)置CPU Affinity,可以控制任務(wù)在多核系統(tǒng)中的調(diào)度和執(zhí)行方式,以優(yōu)化性能或滿足特定的需求。
- Root Complex:一個PCIe總線結(jié)構(gòu)中的頂級主機橋。它通常位于CPU芯片上,負(fù)責(zé)連接CPU與其他設(shè)備,如GPU、網(wǎng)卡、存儲控制器等。Root complex是整個PCIe總線層次結(jié)構(gòu)的起點,它通過PCIe連接到其他設(shè)備或橋接器,形成一個擴展的PCIe網(wǎng)絡(luò)。Root complex扮演著PCIe總線的控制器角色,它管理和協(xié)調(diào)數(shù)據(jù)流經(jīng)過PCIe總線的交互。它負(fù)責(zé)在不同的PCIe設(shè)備之間進(jìn)行數(shù)據(jù)傳輸和通信,以及處理地址分配和DMA(直接內(nèi)存訪問)請求。
- PCIe:是一種高速串行擴展總線標(biāo)準(zhǔn),用于在計算機系統(tǒng)中連接各種外部設(shè)備和擴展卡。它是 PCI總線的一種進(jìn)化和替代。PCIe 總線采用串行數(shù)據(jù)傳輸,相比于并行傳輸?shù)?PCI 總線,具有更高的帶寬和更低的延遲。它是現(xiàn)代計算機系統(tǒng)中常用的連接標(biāo)準(zhǔn),用于連接GPU、網(wǎng)絡(luò)適配器、存儲控制器、聲卡等各種設(shè)備。PCIe 標(biāo)準(zhǔn)定義了不同的物理插槽尺寸和版本,例如 PCIe x1、PCIe x4、PCIe x8 和 PCIe x16,表示不同的物理通道數(shù)量和帶寬。PCIe 還支持多代鏈接和多級拓?fù)浣Y(jié)構(gòu),以滿足更高的性能需求和系統(tǒng)配置。
拓?fù)浣Y(jié)構(gòu)
- 查看NUMA節(jié)點數(shù)、socket數(shù)、核心數(shù)、每個socket的核心數(shù)、每個核心的線程數(shù)等信息
lscpu
因此,有2個物理插槽+2塊CPU,每塊CPU插在一個插槽里。每塊CPU有20個核心,每個核心有2個超線程。主板型號為Intel,NUDA使用連續(xù)編號方式,每個NUMA節(jié)點分到2組CPU核心。
- 查看GPU拓?fù)浣Y(jié)構(gòu)
nvidia-smi topo -m
因此,GPU0、GPU1、GPU2連接到了同一個PCIe Switch上;GPU3、NIC0、NIC1連接到了另一個PCIe Switch上。并且,這兩個PCIe switch連在同一個CPU的兩個Root Complex下;
- 查看GPU信息
nvidia-smi
- 查看GPU對應(yīng)PCIe的版本
nvidia-smi -q
- 查看硬件連接
sudo apt install hwloc
lstopo
系統(tǒng)信息
sudo apt install hardinfo
hardinfo
可以查看系統(tǒng)的各類硬件信息。文章來源:http://www.zghlxwxcb.cn/news/detail-606141.html
文章來源地址http://www.zghlxwxcb.cn/news/detail-606141.html
到了這里,關(guān)于【教程】查看CPU、GPU架構(gòu)的拓?fù)浣Y(jié)構(gòu)和系統(tǒng)信息的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!