国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<form id="jk1ni"><nav id="jk1ni"></nav></form>

<form id="jk1ni"><ruby id="jk1ni"><tbody id="jk1ni"></tbody></ruby></form>

K8S部署后的使用：dashboard啟動(dòng)、使用+docker鏡像拉取、容器部署（ubuntu環(huán)境+gpu3080+3主機(jī)+部署深度學(xué)習(xí)模型）

2年前作者：橙子樹下分類：Toy博客閱讀(28)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了K8S部署后的使用：dashboard啟動(dòng)、使用+docker鏡像拉取、容器部署（ubuntu環(huán)境+gpu3080+3主機(jī)+部署深度學(xué)習(xí)模型）。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

0、k8s安裝、docker安裝

參考：前兩步Ubuntu云原生環(huán)境安裝，docker+k8s+kubeedge（親測(cè)好用）_愛吃關(guān)東煮的博客-CSDN博客_ubantu部署kubeedge

?配置節(jié)點(diǎn)gpu：

K8S調(diào)用GPU資源配置指南_思影影思的博客-CSDN博客_k8s 使用gpu

1、重置和清除舊工程：每個(gè)節(jié)點(diǎn)主機(jī)都要運(yùn)行

kubeadm reset
iptables -F && iptables -t nat -F && iptables -t mangle -F && iptables -X

2、部署新的k8s項(xiàng)目：

只在主節(jié)點(diǎn)運(yùn)行，apiserver-advertise-address填寫主節(jié)點(diǎn)ip

sudo kubeadm init \
--apiserver-advertise-address=192.168.1.117 \
--control-plane-endpoint=node4212 \
--image-repository  registry.cn-hangzhou.aliyuncs.com/google_containers \
--kubernetes-version v1.21.10 \
--service-cidr=10.96.0.0/12 \
--pod-network-cidr=10.244.0.0/16

mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

主節(jié)點(diǎn)完成后，子節(jié)點(diǎn)運(yùn)行主節(jié)點(diǎn)完成后展示的join命令

3、裝網(wǎng)絡(luò)插件

curl https://docs.projectcalico.org/manifests/calico.yaml -O
kubectl apply -f calico.yaml

等待完成

4、裝bashboard：主節(jié)點(diǎn)運(yùn)行

sudo kubectl apply -f /dashbord.yaml

sudo kubectl edit svc kubernetes-dashboard -n kubernetes-dashboard
將type: ClusterIP 改為 type: NodePort

# 找到端口，關(guān)閉對(duì)應(yīng)防火墻
sudo kubectl get svc -A |grep kubernetes-dashboard

K8S部署后的使用：dashboard啟動(dòng)、使用+docker鏡像拉取、容器部署（ubuntu環(huán)境+gpu3080+3主機(jī)+部署深度學(xué)習(xí)模型）

任意主機(jī)ip:31678為實(shí)際訪問連接（https://192.168.1.109:31678/）

?驗(yàn)證所有pod為run狀態(tài)，否則檢查前面步驟

kubectl get pods --all-namespaces -o wide
#查看pod狀態(tài)
kubectl describe pod  kubernetes-dashboard-57c9bfc8c8-lmb67 --namespace kubernetes-dashboard
#打印log
kubectl logs nvidia-device-plugin-daemonset-xn7hx --namespace kube-system

創(chuàng)建訪問賬號(hào)

kubectl apply -f /dashuser.yaml

獲取訪問令牌，在主節(jié)點(diǎn)運(yùn)行，每天都會(huì)更新

kubectl -n kubernetes-dashboard get secret $(kubectl -n kubernetes-dashboard get sa/admin-user -o jsonpath="{.secrets[0].name}") -o go-template="{{.data.token | base64decode}}"

?填入token

K8S部署后的使用：dashboard啟動(dòng)、使用+docker鏡像拉取、容器部署（ubuntu環(huán)境+gpu3080+3主機(jī)+部署深度學(xué)習(xí)模型）

5、創(chuàng)建鏡像并上傳dockerhub：

查看本地鏡像：docker images

登陸docker賬戶

給docker打標(biāo)簽，左：本地名：tag 右hub用戶名/倉庫名：tag
docker tag deeplabv3plus:1.0.0 chenzishu/deepmodel:labv3

上傳hub
docker push chenzishu/deepmodel:labv3

6、dashboard使用

?創(chuàng)建deployment

應(yīng)用名隨意，鏡像地址填寫docherhub上對(duì)應(yīng)鏡像地址（chenzishu/deepmodel:pytorch）

等待容器運(yùn)行，需要時(shí)間

K8S部署后的使用：dashboard啟動(dòng)、使用+docker鏡像拉取、容器部署（ubuntu環(huán)境+gpu3080+3主機(jī)+部署深度學(xué)習(xí)模型）

########
#pod啟動(dòng)后一直重啟，并報(bào)Back-off restarting failed container
#找到對(duì)應(yīng)的deployment添加 
command: ["/bin/bash", "-ce", "tail -f /dev/null"]
########

? K8S部署后的使用：dashboard啟動(dòng)、使用+docker鏡像拉取、容器部署（ubuntu環(huán)境+gpu3080+3主機(jī)+部署深度學(xué)習(xí)模型）

7、運(yùn)行pod：

顯示本地容器：docker ps -a?

找到容器：

kubectl get pods --all-namespaces -o wide

?進(jìn)入容器：

kubectl exec -it segnet-747b798bf5-4bjqk /bin/bash

查看容器中文件：

ls

?nvidia-smi查看容器是否可以調(diào)用gpu

8、容器使用顯卡資源，gpu資源分片

https://gitcode.net/mirrors/AliyunContainerService/gpushare-scheduler-extender/-/blob/master/docs/install.md

先安裝nvidia-docker2：

distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
      && curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
      && curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | \
            sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
            sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

?

sudo apt-get update

sudo apt-get install -y nvidia-docker2

sudo systemctl restart docker

#測(cè)試
sudo docker run --rm --gpus all nvidia/cuda:11.6.2-base-ubuntu20.04 nvidia-smi

update可能會(huì)報(bào)錯(cuò)：參見官方文檔Conflicting values set for option Signed-By error when running apt update

E: Conflicting values set for option Signed-By regarding source https://nvidia.github.io/libnvidia-container/stable/ubuntu18.04/amd64/ /: /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg !=
E: The list of sources could not be read.

解決方法：

grep -l "nvidia.github.io" /etc/apt/sources.list.d/* | grep -vE "/nvidia-container-toolkit.list\$"

刪除列出的文件即可

安裝 gpushare-device-plugin 之前，確保在 GPU 節(jié)點(diǎn)上已經(jīng)安裝 Nvidia-Driver 以及 Nvidia-Docker2，同時(shí)已將 docker 的默認(rèn)運(yùn)行時(shí)設(shè)置為 nvidia：

配置runtime:/etc/docker/daemon.json

{
    "default-runtime": "nvidia",
    "runtimes": {
        "nvidia": {
            "path": "/usr/bin/nvidia-container-runtime",
            "runtimeArgs": []
        }
    }
}

GPU Sharing 部署

再參考阿里開發(fā)文檔，寫的很詳細(xì)?：配置、使用nvidia-share：https://developer.aliyun.com/article/690623

K8S 集群使用阿里云 GPU sharing 實(shí)現(xiàn) GPU 調(diào)度 - 點(diǎn)擊領(lǐng)取 (dianjilingqu.com)

部署 GPU 共享調(diào)度插件 gpushare-schd-extender

cd /tmp/
curl -O https://raw.githubusercontent.com/AliyunContainerService/gpushare-scheduler-extender/master/config/gpushare-schd-extender.yaml
kubectl create -f gpushare-schd-extender.yaml
# 需要能夠在 master 上進(jìn)行調(diào)度，在 gpushare-schd-extender.yaml 中將
# nodeSelector:
#    node-role.kubernetes.io/master: ""
# 這兩句刪除，使 k8s 能夠在 master 上進(jìn)行 GPU 調(diào)度

### 無法下載參考如下鏈接：
wget http://49.232.8.65/yaml/gpushare-schd-extender.yaml

部署設(shè)備插件?gpushare-device-plugin

cd /tmp/
wget https://raw.githubusercontent.com/AliyunContainerService/gpushare-device-plugin/master/device-plugin-rbac.yaml
kubectl create -f device-plugin-rbac.yaml
wget https://raw.githubusercontent.com/AliyunContainerService/gpushare-device-plugin/master/device-plugin-ds.yaml
# 默認(rèn)情況下，GPU 顯存以 GiB 為單位，若需要使用 MiB 為單位，需要在這個(gè)文件中，將 --memory-unit=GiB 修改為 --memory-unit=MiB
kubectl create -f device-plugin-ds.yaml

### 無法下載參考如下鏈接：
wget http://49.232.8.65/yaml/device-plugin-rbac.yaml
wget http://49.232.8.65/yaml/device-plugin-ds.yaml

??為?GPU?節(jié)點(diǎn)打標(biāo)簽

# 為了將 GPU 程序調(diào)度到帶有 GPU 的服務(wù)器，需要給服務(wù)打標(biāo)簽 gpushare=true

kubectl get nodes
# 選取 GPU 節(jié)點(diǎn)打標(biāo)
kubectl label node <target_node> gpushare=true
kubectl describe node <target_node>

更新?kubectl?可執(zhí)行程序

wget https://github.com/AliyunContainerService/gpushare-device-plugin/releases/download/v0.3.0/kubectl-inspect-gpushare
chmod u+x kubectl-inspect-gpushare
mv kubectl-inspect-gpushare /usr/local/bin

### 無法下載參考如下鏈接：
wget http://49.232.8.64/k8s/kubectl-inspect-gpushare

?查看?GPU?信息：若能看到 GPU 信息，則代表安裝成功

root@dell21[/root]# kubectl inspect gpushare
NAME         IPADDRESS    GPU0(Allocated/Total)  PENDING(Allocated)  GPU Memory(GiB)
10.45.61.22  10.45.61.22  0/7                    2                   2/7
------------------------------------------------------
Allocated/Total GPU Memory In Cluster:
2/7 (28%)

9、部分問題

pod無法啟動(dòng)、資源不足

#設(shè)置污點(diǎn)閾值
systemctl status -l kubelet
#文件路徑
/etc/systemd/system/kubelet.service.d/
#放寬閾值
#修改配置文件增加傳參數(shù),添加此配置項(xiàng) --eviction-hard=nodefs.available<3%
Environment="KUBELET_KUBECONFIG_ARGS=--bootstrap-kubeconfig=/etc/kubernetes/bootstrap-kubelet.conf --kubeconfig=/etc/kubernetes/kubelet.conf --eviction-hard=nodefs.available<3%"

systemctl daemon-reload
systemctl  restart kubelet

pod反復(fù)重啟：文章來源地址http://www.zghlxwxcb.cn/news/detail-419279.html

pod啟動(dòng)后一直重啟，并報(bào)Back-off restarting failed container
找到對(duì)應(yīng)的deployment 
command: ["/bin/bash", "-ce", "tail -f /dev/null"]

spec:
    containers:
    - name: test-file
    image: xxx:v1
    command: ["/bin/bash", "-ce", "tail -f /dev/null"]
    imagePullPolicy: IfNotPresent

到了這里，關(guān)于K8S部署后的使用：dashboard啟動(dòng)、使用+docker鏡像拉取、容器部署（ubuntu環(huán)境+gpu3080+3主機(jī)+部署深度學(xué)習(xí)模型）的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

Sentinel-dashboard安裝（k8s部署）
目錄 Sentinel-dashboard安裝（k8s部署）一.拉取鏡像并推送到私庫二.準(zhǔn)備sentinel statefulset部署配置文件三.部署并訪問sentinel 一.拉取鏡像并推送到私庫這里選擇的是docker hub已經(jīng)有人制作好的Sentinel鏡像二.準(zhǔn)備sentinel statefulset部署配置文件因?yàn)樵撆渲檬褂昧薖VC，所以要新增一個(gè)
2024年02月08日
瀏覽(20)
K8s：部署 CNI 網(wǎng)絡(luò)組件+k8s 多master集群部署+負(fù)載均衡及Dashboard k8s儀表盤圖像化展示
目錄 1 部署 CNI 網(wǎng)絡(luò)組件 1.1 部署 flannel 1.2 部署 Calico 1.3 部署 CoreDNS 2 負(fù)載均衡部署 3 部署 Dashboard K8S 中 Pod 網(wǎng)絡(luò)通信： ●Pod 內(nèi)容器與容器之間的通信在同一個(gè) Pod 內(nèi)的容器（Pod 內(nèi)的容器是不會(huì)跨宿主機(jī)的）共享同一個(gè)網(wǎng)絡(luò)命令空間，相當(dāng)于它們?cè)谕慌_(tái)機(jī)器上一樣，可以用
2024年02月05日
瀏覽(26)
Kubeadm 部署 k8s 使用國(guó)內(nèi)鏡像源
Kubernetes官方文檔的安裝過程中，有些地方需要使用國(guó)內(nèi)的鏡像源才能完成這篇文章整合了所有需要替換國(guó)內(nèi)鏡像的地方，供參考操作系統(tǒng)：Rocky 9（最小安裝）容器運(yùn)行時(shí)：containerd k8s阿里云源 docker-ce阿里云源安裝containerd時(shí)需要，實(shí)測(cè)輸入這一行命令就可以了
2024年02月11日
瀏覽(23)
Kubernetes - 一鍵安裝部署 K8S（附：Kubernetes Dashboard）
不知道大伙是如何安裝?K8s，特別還是集群的時(shí)候，我上一次安裝搭建的時(shí)候，那個(gè)惡心到我了，真的是一步一個(gè)腳印走完整個(gè)搭建流程，爬了不少坑。于是，才有了今天的文章，到底有沒有可以一鍵完美部署 k8s 并且附帶 Dashboard……？那這么問了肯定是有的，否則豈不是在
2024年02月03日
瀏覽(27)
【云原生 | K8S 】部署 CNI 網(wǎng)絡(luò)組件+k8s 多master集群部署+負(fù)載均衡及Dashboard k8s儀表盤圖像化展示管理
目錄 1 部署 CNI 網(wǎng)絡(luò)組件 1.1 部署 flannel 1.2 部署 Calico 1.3 部署 CoreDNS 2 負(fù)載均衡部署 3 部署 Dashboard K8S 中 Pod 網(wǎng)絡(luò)通信： ●Pod 內(nèi)容器與容器之間的通信在同一個(gè) Pod 內(nèi)的容器（Pod 內(nèi)的容器是不會(huì)跨宿主機(jī)的）共享同一個(gè)網(wǎng)絡(luò)命令空間，相當(dāng)于它們?cè)谕慌_(tái)機(jī)器上一樣，可以用
2024年01月22日
瀏覽(31)
K8s（kubernetes）集群搭建及dashboard安裝、基礎(chǔ)應(yīng)用部署
本質(zhì)是一組服務(wù)器集群，在集群每個(gè)節(jié)點(diǎn)上運(yùn)行特定的程序，來對(duì)節(jié)點(diǎn)中的容器進(jìn)行管理。實(shí)現(xiàn)資源管理的自動(dòng)化。自我修復(fù) 彈性伸縮服務(wù)發(fā)現(xiàn) 負(fù)載均衡版本回退存儲(chǔ)編排控制節(jié)點(diǎn)(master)-控制平面 APIserver ：資源操作的唯一入口 scheduler ：集群資源調(diào)度，將Pod調(diào)度到node節(jié)
2024年02月08日
瀏覽(32)
通過docker+cri-dockerd部署k8s集群環(huán)境(含harbor鏡像倉庫)
目錄一.虛擬機(jī)準(zhǔn)備二.基礎(chǔ)環(huán)境配置（各個(gè)節(jié)點(diǎn)都做） 1.IP和hosts解析 2.防火墻和selinux 3.安裝基本軟件 4.配置時(shí)間同步 5.禁用swap分區(qū) 6.修改內(nèi)核參數(shù)并重載 7.配置ipvs 三.docker環(huán)境（各個(gè)節(jié)點(diǎn)都做） 1.配置軟件源并安裝docker-ce 2.配置docker加速四.cri環(huán)境配置（各個(gè)節(jié)點(diǎn)都做）
2024年02月05日
瀏覽(25)
k8s使用helm部署Harbor鏡像倉庫并啟用SSL
參照：https://zhaoll.blog.csdn.net/article/details/128155767 有多種安裝方式，根據(jù)自己的k8s版本選擇合適的helm版本參考：https://blog.csdn.net/qq_30614345/article/details/131669319 我們這里使用helm安裝harbor，項(xiàng)目地址：https://github.com/goharbor/harbor-helm （1）拉取項(xiàng)目文件（2）解壓并修改配置 tar -z
2024年02月16日
瀏覽(30)
【云原生-K8s】鏡像漏洞安全掃描工具Trivy部署及使用
基礎(chǔ)描述 Trivy是一個(gè)開源的容器鏡像漏洞掃描器，可以掃描常見的操作系統(tǒng)和應(yīng)用程序依賴項(xiàng)的漏洞。它可以與Docker和Kubernetes集成，幫助用戶在構(gòu)建和部署容器鏡像時(shí)發(fā)現(xiàn)安全漏洞。Trivy支持多種漏洞數(shù)據(jù)庫，包括Red Hat、Debian、Alpine等，可以根據(jù)用戶的需求進(jìn)行配置。Trivy還
2024年02月05日
瀏覽(21)
K8S的dashboard使用賬號(hào)密碼登錄
原文網(wǎng)址：K8S的dashboard使用賬號(hào)密碼登錄-CSDN博客本文介紹K8S的dashboard使用賬號(hào)密碼登錄的方法。 ----------------------------------------------------------------------------------------------- 分享Java真實(shí)高頻面試題，吊打面試官： Java后端真實(shí)面試題大全 - 自學(xué)精靈分享靠譜的Java高級(jí)實(shí)戰(zhàn)，包
2024年02月02日
瀏覽(30)