国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

K8S部署后的使用:dashboard啟動(dòng)、使用+docker鏡像拉取、容器部署(ubuntu環(huán)境+gpu3080+3主機(jī)+部署深度學(xué)習(xí)模型)

這篇具有很好參考價(jià)值的文章主要介紹了K8S部署后的使用:dashboard啟動(dòng)、使用+docker鏡像拉取、容器部署(ubuntu環(huán)境+gpu3080+3主機(jī)+部署深度學(xué)習(xí)模型)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

0、k8s安裝、docker安裝

參考:前兩步Ubuntu云原生環(huán)境安裝,docker+k8s+kubeedge(親測(cè)好用)_愛吃關(guān)東煮的博客-CSDN博客_ubantu部署kubeedge

?配置節(jié)點(diǎn)gpu:

K8S調(diào)用GPU資源配置指南_思影影思的博客-CSDN博客_k8s 使用gpu

1、重置和清除舊工程:每個(gè)節(jié)點(diǎn)主機(jī)都要運(yùn)行

kubeadm reset
iptables -F && iptables -t nat -F && iptables -t mangle -F && iptables -X

2、部署新的k8s項(xiàng)目:

只在主節(jié)點(diǎn)運(yùn)行,apiserver-advertise-address填寫主節(jié)點(diǎn)ip

sudo kubeadm init \
--apiserver-advertise-address=192.168.1.117 \
--control-plane-endpoint=node4212 \
--image-repository  registry.cn-hangzhou.aliyuncs.com/google_containers \
--kubernetes-version v1.21.10 \
--service-cidr=10.96.0.0/12 \
--pod-network-cidr=10.244.0.0/16
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

主節(jié)點(diǎn)完成后,子節(jié)點(diǎn)運(yùn)行主節(jié)點(diǎn)完成后展示的join命令

3、裝網(wǎng)絡(luò)插件

curl https://docs.projectcalico.org/manifests/calico.yaml -O
kubectl apply -f calico.yaml

等待完成

4、裝bashboard:主節(jié)點(diǎn)運(yùn)行

sudo kubectl apply -f /dashbord.yaml

sudo kubectl edit svc kubernetes-dashboard -n kubernetes-dashboard
將type: ClusterIP 改為 type: NodePort
# 找到端口,關(guān)閉對(duì)應(yīng)防火墻
sudo kubectl get svc -A |grep kubernetes-dashboard

K8S部署后的使用:dashboard啟動(dòng)、使用+docker鏡像拉取、容器部署(ubuntu環(huán)境+gpu3080+3主機(jī)+部署深度學(xué)習(xí)模型)

任意主機(jī)ip:31678為實(shí)際訪問連接(https://192.168.1.109:31678/)

?驗(yàn)證所有pod為run狀態(tài),否則檢查前面步驟

kubectl get pods --all-namespaces -o wide
#查看pod狀態(tài)
kubectl describe pod  kubernetes-dashboard-57c9bfc8c8-lmb67 --namespace kubernetes-dashboard
#打印log
kubectl logs nvidia-device-plugin-daemonset-xn7hx --namespace kube-system

創(chuàng)建訪問賬號(hào)

kubectl apply -f /dashuser.yaml

獲取訪問令牌,在主節(jié)點(diǎn)運(yùn)行,每天都會(huì)更新

kubectl -n kubernetes-dashboard get secret $(kubectl -n kubernetes-dashboard get sa/admin-user -o jsonpath="{.secrets[0].name}") -o go-template="{{.data.token | base64decode}}"

?填入token

K8S部署后的使用:dashboard啟動(dòng)、使用+docker鏡像拉取、容器部署(ubuntu環(huán)境+gpu3080+3主機(jī)+部署深度學(xué)習(xí)模型)

5、創(chuàng)建鏡像并上傳dockerhub:

查看本地鏡像:docker images

登陸docker賬戶

給docker打標(biāo)簽,左:本地名:tag 右hub用戶名/倉庫名:tag
docker tag deeplabv3plus:1.0.0 chenzishu/deepmodel:labv3

上傳hub
docker push chenzishu/deepmodel:labv3

6、dashboard使用

?創(chuàng)建deploymentK8S部署后的使用:dashboard啟動(dòng)、使用+docker鏡像拉取、容器部署(ubuntu環(huán)境+gpu3080+3主機(jī)+部署深度學(xué)習(xí)模型)

應(yīng)用名隨意,鏡像地址填寫docherhub上對(duì)應(yīng)鏡像地址(chenzishu/deepmodel:pytorch)

等待容器運(yùn)行,需要時(shí)間

K8S部署后的使用:dashboard啟動(dòng)、使用+docker鏡像拉取、容器部署(ubuntu環(huán)境+gpu3080+3主機(jī)+部署深度學(xué)習(xí)模型)

########
#pod啟動(dòng)后一直重啟,并報(bào)Back-off restarting failed container
#找到對(duì)應(yīng)的deployment添加 
command: ["/bin/bash", "-ce", "tail -f /dev/null"]
########

?K8S部署后的使用:dashboard啟動(dòng)、使用+docker鏡像拉取、容器部署(ubuntu環(huán)境+gpu3080+3主機(jī)+部署深度學(xué)習(xí)模型)

7、運(yùn)行pod:

顯示本地容器:docker ps -a?

找到容器:

kubectl get pods --all-namespaces -o wide

?進(jìn)入容器:

kubectl exec -it segnet-747b798bf5-4bjqk /bin/bash

查看容器中文件:

ls

?nvidia-smi查看容器是否可以調(diào)用gpu

8、容器使用顯卡資源,gpu資源分片

https://gitcode.net/mirrors/AliyunContainerService/gpushare-scheduler-extender/-/blob/master/docs/install.md

先安裝nvidia-docker2:

distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
      && curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
      && curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | \
            sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
            sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

?

sudo apt-get update

sudo apt-get install -y nvidia-docker2

sudo systemctl restart docker

#測(cè)試
sudo docker run --rm --gpus all nvidia/cuda:11.6.2-base-ubuntu20.04 nvidia-smi

update可能會(huì)報(bào)錯(cuò):參見官方文檔Conflicting values set for option Signed-By error when running apt update

E: Conflicting values set for option Signed-By regarding source https://nvidia.github.io/libnvidia-container/stable/ubuntu18.04/amd64/ /: /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg !=
E: The list of sources could not be read.

解決方法:

grep -l "nvidia.github.io" /etc/apt/sources.list.d/* | grep -vE "/nvidia-container-toolkit.list\$"

刪除列出的文件即可

安裝 gpushare-device-plugin 之前,確保在 GPU 節(jié)點(diǎn)上已經(jīng)安裝 Nvidia-Driver 以及 Nvidia-Docker2,同時(shí)已將 docker 的默認(rèn)運(yùn)行時(shí)設(shè)置為 nvidia:

配置runtime:/etc/docker/daemon.json

{
    "default-runtime": "nvidia",
    "runtimes": {
        "nvidia": {
            "path": "/usr/bin/nvidia-container-runtime",
            "runtimeArgs": []
        }
    }
}

GPU Sharing 部署

再參考阿里開發(fā)文檔,寫的很詳細(xì)?:配置、使用nvidia-share:https://developer.aliyun.com/article/690623

K8S 集群使用阿里云 GPU sharing 實(shí)現(xiàn) GPU 調(diào)度 - 點(diǎn)擊領(lǐng)取 (dianjilingqu.com)

部署 GPU 共享調(diào)度插件 gpushare-schd-extender

cd /tmp/
curl -O https://raw.githubusercontent.com/AliyunContainerService/gpushare-scheduler-extender/master/config/gpushare-schd-extender.yaml
kubectl create -f gpushare-schd-extender.yaml
# 需要能夠在 master 上進(jìn)行調(diào)度,在 gpushare-schd-extender.yaml 中將
# nodeSelector:
#    node-role.kubernetes.io/master: ""
# 這兩句刪除,使 k8s 能夠在 master 上進(jìn)行 GPU 調(diào)度

### 無法下載參考如下鏈接:
wget http://49.232.8.65/yaml/gpushare-schd-extender.yaml

部署設(shè)備插件?gpushare-device-plugin

cd /tmp/
wget https://raw.githubusercontent.com/AliyunContainerService/gpushare-device-plugin/master/device-plugin-rbac.yaml
kubectl create -f device-plugin-rbac.yaml
wget https://raw.githubusercontent.com/AliyunContainerService/gpushare-device-plugin/master/device-plugin-ds.yaml
# 默認(rèn)情況下,GPU 顯存以 GiB 為單位,若需要使用 MiB 為單位,需要在這個(gè)文件中,將 --memory-unit=GiB 修改為 --memory-unit=MiB
kubectl create -f device-plugin-ds.yaml

### 無法下載參考如下鏈接:
wget http://49.232.8.65/yaml/device-plugin-rbac.yaml
wget http://49.232.8.65/yaml/device-plugin-ds.yaml

??為?GPU?節(jié)點(diǎn)打標(biāo)簽

# 為了將 GPU 程序調(diào)度到帶有 GPU 的服務(wù)器,需要給服務(wù)打標(biāo)簽 gpushare=true

kubectl get nodes
# 選取 GPU 節(jié)點(diǎn)打標(biāo)
kubectl label node <target_node> gpushare=true
kubectl describe node <target_node>

更新?kubectl?可執(zhí)行程序

wget https://github.com/AliyunContainerService/gpushare-device-plugin/releases/download/v0.3.0/kubectl-inspect-gpushare
chmod u+x kubectl-inspect-gpushare
mv kubectl-inspect-gpushare /usr/local/bin

### 無法下載參考如下鏈接:
wget http://49.232.8.64/k8s/kubectl-inspect-gpushare

?查看?GPU?信息:若能看到 GPU 信息,則代表安裝成功

root@dell21[/root]# kubectl inspect gpushare
NAME         IPADDRESS    GPU0(Allocated/Total)  PENDING(Allocated)  GPU Memory(GiB)
10.45.61.22  10.45.61.22  0/7                    2                   2/7
------------------------------------------------------
Allocated/Total GPU Memory In Cluster:
2/7 (28%)  

9、部分問題

pod無法啟動(dòng)、資源不足

#設(shè)置污點(diǎn)閾值
systemctl status -l kubelet
#文件路徑
/etc/systemd/system/kubelet.service.d/
#放寬閾值
#修改配置文件增加傳參數(shù),添加此配置項(xiàng) --eviction-hard=nodefs.available<3%
Environment="KUBELET_KUBECONFIG_ARGS=--bootstrap-kubeconfig=/etc/kubernetes/bootstrap-kubelet.conf --kubeconfig=/etc/kubernetes/kubelet.conf --eviction-hard=nodefs.available<3%"

systemctl daemon-reload
systemctl  restart kubelet

pod反復(fù)重啟:文章來源地址http://www.zghlxwxcb.cn/news/detail-419279.html

pod啟動(dòng)后一直重啟,并報(bào)Back-off restarting failed container
找到對(duì)應(yīng)的deployment 
command: ["/bin/bash", "-ce", "tail -f /dev/null"]

spec:
    containers:
    - name: test-file
    image: xxx:v1
    command: ["/bin/bash", "-ce", "tail -f /dev/null"]
    imagePullPolicy: IfNotPresent

到了這里,關(guān)于K8S部署后的使用:dashboard啟動(dòng)、使用+docker鏡像拉取、容器部署(ubuntu環(huán)境+gpu3080+3主機(jī)+部署深度學(xué)習(xí)模型)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • Sentinel-dashboard安裝(k8s部署)

    目錄 Sentinel-dashboard安裝(k8s部署) 一.拉取鏡像并推送到私庫 二.準(zhǔn)備sentinel statefulset部署配置文件 三.部署并訪問sentinel 一.拉取鏡像并推送到私庫 這里選擇的是docker hub已經(jīng)有人制作好的Sentinel鏡像 二.準(zhǔn)備sentinel statefulset部署配置文件 因?yàn)樵撆渲檬褂昧薖VC,所以要新增一個(gè)

    2024年02月08日
    瀏覽(20)
  • K8s:部署 CNI 網(wǎng)絡(luò)組件+k8s 多master集群部署+負(fù)載均衡及Dashboard k8s儀表盤圖像化展示

    K8s:部署 CNI 網(wǎng)絡(luò)組件+k8s 多master集群部署+負(fù)載均衡及Dashboard k8s儀表盤圖像化展示

    目錄 1 部署 CNI 網(wǎng)絡(luò)組件 1.1 部署 flannel 1.2 部署 Calico 1.3 部署 CoreDNS 2 負(fù)載均衡部署 3 部署 Dashboard K8S 中 Pod 網(wǎng)絡(luò)通信: ●Pod 內(nèi)容器與容器之間的通信 在同一個(gè) Pod 內(nèi)的容器(Pod 內(nèi)的容器是不會(huì)跨宿主機(jī)的)共享同一個(gè)網(wǎng)絡(luò)命令空間,相當(dāng)于它們?cè)谕慌_(tái)機(jī)器上一樣,可以用

    2024年02月05日
    瀏覽(26)
  • Kubeadm 部署 k8s 使用國(guó)內(nèi)鏡像源

    Kubernetes官方文檔的安裝過程中,有些地方需要使用國(guó)內(nèi)的鏡像源才能完成 這篇文章整合了所有需要替換國(guó)內(nèi)鏡像的地方,供參考 操作系統(tǒng):Rocky 9(最小安裝) 容器運(yùn)行時(shí):containerd k8s阿里云源 docker-ce阿里云源 安裝containerd時(shí)需要,實(shí)測(cè)輸入這一行命令就可以了

    2024年02月11日
    瀏覽(23)
  • Kubernetes - 一鍵安裝部署 K8S(附:Kubernetes Dashboard)

    Kubernetes - 一鍵安裝部署 K8S(附:Kubernetes Dashboard)

    不知道大伙是如何安裝?K8s,特別還是集群的時(shí)候,我上一次安裝搭建的時(shí)候,那個(gè)惡心到我了,真的是一步一個(gè)腳印走完整個(gè)搭建流程,爬了不少坑。 于是,才有了今天的文章,到底有沒有可以一鍵完美部署 k8s 并且附帶 Dashboard……?那這么問了肯定是有的,否則豈不是在

    2024年02月03日
    瀏覽(27)
  • 【 云原生 | K8S 】部署 CNI 網(wǎng)絡(luò)組件+k8s 多master集群部署+負(fù)載均衡及Dashboard k8s儀表盤圖像化展示管理

    【 云原生 | K8S 】部署 CNI 網(wǎng)絡(luò)組件+k8s 多master集群部署+負(fù)載均衡及Dashboard k8s儀表盤圖像化展示管理

    目錄 1 部署 CNI 網(wǎng)絡(luò)組件 1.1 部署 flannel 1.2 部署 Calico 1.3 部署 CoreDNS 2 負(fù)載均衡部署 3 部署 Dashboard K8S 中 Pod 網(wǎng)絡(luò)通信: ●Pod 內(nèi)容器與容器之間的通信 在同一個(gè) Pod 內(nèi)的容器(Pod 內(nèi)的容器是不會(huì)跨宿主機(jī)的)共享同一個(gè)網(wǎng)絡(luò)命令空間,相當(dāng)于它們?cè)谕慌_(tái)機(jī)器上一樣,可以用

    2024年01月22日
    瀏覽(31)
  • K8s(kubernetes)集群搭建及dashboard安裝、基礎(chǔ)應(yīng)用部署

    K8s(kubernetes)集群搭建及dashboard安裝、基礎(chǔ)應(yīng)用部署

    本質(zhì)是一組服務(wù)器集群,在集群每個(gè)節(jié)點(diǎn)上運(yùn)行特定的程序,來對(duì)節(jié)點(diǎn)中的容器進(jìn)行管理。實(shí)現(xiàn)資源管理的自動(dòng)化。 自我修復(fù) 彈性伸縮 服務(wù)發(fā)現(xiàn) 負(fù)載均衡 版本回退 存儲(chǔ)編排 控制節(jié)點(diǎn)(master)-控制平面 APIserver :資源操作的唯一入口 scheduler :集群資源調(diào)度,將Pod調(diào)度到node節(jié)

    2024年02月08日
    瀏覽(32)
  • 通過docker+cri-dockerd部署k8s集群環(huán)境(含harbor鏡像倉庫)

    通過docker+cri-dockerd部署k8s集群環(huán)境(含harbor鏡像倉庫)

    目錄 一.虛擬機(jī)準(zhǔn)備 二.基礎(chǔ)環(huán)境配置(各個(gè)節(jié)點(diǎn)都做) 1.IP和hosts解析 2.防火墻和selinux 3.安裝基本軟件 4.配置時(shí)間同步 5.禁用swap分區(qū) 6.修改內(nèi)核參數(shù)并重載 7.配置ipvs 三.docker環(huán)境(各個(gè)節(jié)點(diǎn)都做) 1.配置軟件源并安裝docker-ce 2.配置docker加速 四.cri環(huán)境配置(各個(gè)節(jié)點(diǎn)都做)

    2024年02月05日
    瀏覽(25)
  • k8s使用helm部署Harbor鏡像倉庫并啟用SSL

    k8s使用helm部署Harbor鏡像倉庫并啟用SSL

    參照:https://zhaoll.blog.csdn.net/article/details/128155767 有多種安裝方式,根據(jù)自己的k8s版本選擇合適的helm版本 參考:https://blog.csdn.net/qq_30614345/article/details/131669319 我們這里使用helm安裝harbor,項(xiàng)目地址:https://github.com/goharbor/harbor-helm (1)拉取項(xiàng)目文件 (2)解壓并修改配置 tar -z

    2024年02月16日
    瀏覽(30)
  • 【云原生-K8s】鏡像漏洞安全掃描工具Trivy部署及使用

    【云原生-K8s】鏡像漏洞安全掃描工具Trivy部署及使用

    基礎(chǔ)描述 Trivy是一個(gè)開源的容器鏡像漏洞掃描器,可以掃描常見的操作系統(tǒng)和應(yīng)用程序依賴項(xiàng)的漏洞。它可以與Docker和Kubernetes集成,幫助用戶在構(gòu)建和部署容器鏡像時(shí)發(fā)現(xiàn)安全漏洞。Trivy支持多種漏洞數(shù)據(jù)庫,包括Red Hat、Debian、Alpine等,可以根據(jù)用戶的需求進(jìn)行配置。Trivy還

    2024年02月05日
    瀏覽(21)
  • K8S的dashboard使用賬號(hào)密碼登錄

    K8S的dashboard使用賬號(hào)密碼登錄

    原文網(wǎng)址:K8S的dashboard使用賬號(hào)密碼登錄-CSDN博客 本文介紹K8S的dashboard使用賬號(hào)密碼登錄的方法。 ----------------------------------------------------------------------------------------------- 分享Java真實(shí)高頻面試題,吊打面試官: Java后端真實(shí)面試題大全 - 自學(xué)精靈 分享靠譜的Java高級(jí)實(shí)戰(zhàn),包

    2024年02月02日
    瀏覽(30)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包