背景:
算是一個(gè)騰訊云深度用戶,用了78年左右,由于業(yè)務(wù)需求,今年五月份開(kāi)始逐步在阿里云跑了一些服務(wù)。不吹不黑。發(fā)自內(nèi)心的吐槽一下阿里云的ack服務(wù)。其他服務(wù)沒(méi)有多大發(fā)言權(quán)。都差不多。但是作為一個(gè)算是比較早期的kubernetes用戶有必要吐槽一下阿里云的ack服務(wù),沒(méi)有辦法。圈子里面沒(méi)有阿里云容器組的人,像是騰訊云的tke的服務(wù)有問(wèn)題可以直接找到相關(guān)人員反映,提交一下個(gè)人意見(jiàn)了。
深度吐槽阿里云ack服務(wù)
1.從創(chuàng)建集群開(kāi)始吧
1. 關(guān)于虛擬交換機(jī)
關(guān)于這個(gè)選擇虛擬交換機(jī)我就很不能理解,比如我現(xiàn)在有四個(gè)交換機(jī),ok,我選擇了三個(gè),是不是我另外一個(gè)交換機(jī)的服務(wù)器就不能加入集群?前提是我選擇了專用網(wǎng)絡(luò)了,理論上我的專用網(wǎng)絡(luò)內(nèi)任何一臺(tái)服務(wù)器是不是都可以加入集群?為什么要給我加一個(gè)這個(gè)的限制呢?不知道我的理解有沒(méi)有問(wèn)題,也歡迎各位阿里云的大佬指正!
2.關(guān)于容器的網(wǎng)絡(luò)
這個(gè)地方更是惡心…默認(rèn)的pod 的cidr 172網(wǎng)段的,service cidr192.168.0.0/16段的?這只是我的截圖阿,反正就是 兩個(gè)網(wǎng)絡(luò)的段不會(huì)是一個(gè)大的網(wǎng)段默認(rèn)的…
pod 網(wǎng)絡(luò) service網(wǎng)絡(luò)默認(rèn)會(huì)是兩個(gè)不一樣的私網(wǎng)…可是我有點(diǎn)強(qiáng)迫癥…我想pod service cidr在一個(gè)網(wǎng)絡(luò)內(nèi)可不可以?請(qǐng)看一下騰訊的我只設(shè)置了容器網(wǎng)絡(luò)172.1716.0/20,然后我的容器pod網(wǎng)絡(luò)自動(dòng)設(shè)置為了172.17.16.0/20,service cidr設(shè)置為了172.17.28.0/22:
這樣他不香嗎?關(guān)鍵是這樣,我后面如果多vpc,多地域集群作互聯(lián)是不是會(huì)方便一些?
可能手動(dòng)的可以設(shè)置。但是用戶引導(dǎo)這方面設(shè)置為兩個(gè)不同的私網(wǎng)是很惡心的,請(qǐng)考慮一下多集群互聯(lián),和網(wǎng)絡(luò)資源的規(guī)劃!
這只是集群創(chuàng)建過(guò)程中體驗(yàn)的不爽的…
2.當(dāng)集群創(chuàng)建完成之后:
1.資源的擴(kuò)容添加服務(wù)器到集群
這個(gè)問(wèn)題我提交過(guò)工單,工單可見(jiàn)服務(wù)編號(hào)000D0585GS。過(guò)程是這樣的。我要添加一臺(tái)已有的服務(wù)器加入集群,然后竟然加不進(jìn)去,查了一圈問(wèn)題,客服告訴我,要先把這臺(tái)服務(wù)器加入到ack節(jié)點(diǎn)的安全祖我才能操作…what這是什么鬼操作?我添加機(jī)器進(jìn)入集群,安全祖不應(yīng)該默認(rèn)添加嗎?還需要我手動(dòng)先將機(jī)器加入安全祖我才能添加機(jī)器進(jìn)入集群?這是什么神仙操作?很讓我費(fèi)解。工單中提交了個(gè)人意見(jiàn)希望能更改這個(gè)流程,不知道后續(xù)是否有什么修改
2.詭異的alb
事情是這樣的:我應(yīng)該三四月份創(chuàng)建的ack集群,然后當(dāng)時(shí)看網(wǎng)絡(luò)路由有ALB ingress,咱沒(méi)有用過(guò)阿…體驗(yàn)一下吧!結(jié)果就是我沒(méi)有創(chuàng)建成功…有點(diǎn)憂傷,作為一個(gè)用了kubernetes5-6年的用戶我竟然沒(méi)有搞成功,好吧一氣之下刪除了,換成了traefik作代理。詭異的時(shí)期 14天后的一個(gè)夜晚發(fā)生了…自動(dòng)創(chuàng)建了ALB服務(wù)。完全懵了…我不是刪除了嗎?為什么是14天的周期自動(dòng)創(chuàng)建了?
我關(guān)心的是刪除了服務(wù) ,為什么沒(méi)有刪除干凈?為什么14天后服務(wù)自動(dòng)創(chuàng)建了?這都是什么神仙操作?
3.日志服務(wù)關(guān)于Job日志的采集
誰(shuí)家還沒(méi)有幾個(gè)job服務(wù)呢對(duì)吧?然后接入了阿里云的日志采集服務(wù)。恩關(guān)鍵是日志完全沒(méi)有采集到阿…怎么會(huì)事情?問(wèn) 了一下我的job退出太快了…
關(guān)鍵是job就算退出了也是complete狀態(tài)吧?默認(rèn)的可以看到最新的三個(gè)任務(wù)的日志吧?起碼kubectl logs -f?采集不到…好吧,修改代碼打完了日志等待30秒再推出…這也太惡心了…我起碼filebeat啥的采集也能采集到吧?怎么就不能呢?能不能別讓我修改阿…
4.可惡的報(bào)警…
先吐槽一下這個(gè)報(bào)警模板,大家的審美觀看一下可還順眼?
第一眼ack 好的我默認(rèn)打開(kāi)ACK
TMD報(bào)警模板里面的實(shí)例名稱能不能給ack集群中節(jié)點(diǎn)名稱一致我那里下手阿?哦對(duì)有公網(wǎng)IP我湊 ,這ack控制臺(tái)顯示公網(wǎng)Ip嗎?點(diǎn)開(kāi)詳情ip這里才能發(fā)現(xiàn)是這一臺(tái)
這里我希望報(bào)警模板實(shí)例能與ACK節(jié)點(diǎn)名稱規(guī)范化一下。ack控制臺(tái)節(jié)點(diǎn)相關(guān)信息顯示也能夠更完善一下。
然后接著吐槽,報(bào)警這里fs.inode.utilization_device設(shè)置的閾值是85%沒(méi)有問(wèn)題,看一下kubelet的垃圾回收:–eviction-hard=imagefs.available<15%,memory.available<300Mi,nodefs.available<10%,nodefs.inodesFree<5%
**。**這是默認(rèn)的吧壓根就沒(méi)有修改吧?那這個(gè)報(bào)警與垃圾回收有什么用呢?我就想知道?
好吧我自己去修改kubelet配置文件行不行?
eviction-hard=imagefs.available<15%,memory.available<300Mi,nodefs.available<20%,nodefs.inodesFree<15%
找了一圈我竟然無(wú)法確定改修改哪個(gè)文件
我這里修改可以嗎?
重啟服務(wù)后
ps -ef|grep kubelet
還是這樣 我慫了 ,惹不起!文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-463168.html
我改一下報(bào)警行了不?,惹不起我躲了!
看一下正常kubeadm集群的配置:
我修改了一下kubeadm-flags.env好歹是生效的阿?對(duì)不
惹不起我躲了…先修改監(jiān)控報(bào)警策略了!而且從根本上來(lái)說(shuō),托管的服務(wù)。這些東西應(yīng)該是優(yōu)化好的盡量去減少用戶的操作不是嗎?你的 報(bào)警跟垃圾回收策略都不一致,搞毛線呢?問(wèn)題是我個(gè)人修改參數(shù)他也不生效阿…這讓我怎么玩?毫無(wú)舒適感,不想動(dòng)了!
希望阿里云ack的小伙伴能看到我的吐槽,沒(méi)有辦法阿吐槽無(wú)門(mén)阿…太高高在上了…希望能聽(tīng)一下用戶的心聲!文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-463168.html
到了這里,關(guān)于深度吐槽阿里云ack服務(wù)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!