前置介紹
Nightingale | 夜鶯監(jiān)控,一款先進(jìn)的開(kāi)源云原生監(jiān)控分析系統(tǒng),采用 All-In-One 的設(shè)計(jì),集數(shù)據(jù)采集、可視化、監(jiān)控告警、數(shù)據(jù)分析于一體,與云原生生態(tài)緊密集成,提供開(kāi)箱即用的企業(yè)級(jí)監(jiān)控分析和告警能力。于 2022 年 5 月 11 日,捐贈(zèng)予中國(guó)計(jì)算機(jī)學(xué)會(huì)開(kāi)源發(fā)展委員會(huì)(CCF ODC),為 CCF ODC 成立后接受捐贈(zèng)的首個(gè)開(kāi)源項(xiàng)目。
寫(xiě)在前面
Nightingale 的定位,是企業(yè)級(jí) Prometheus,不是說(shuō) Prometheus 不好。舉個(gè)例子,比如你們團(tuán)隊(duì)自己搭建了一套 Prometheus 自己使用,大家寫(xiě) yaml 配置都很溜,其實(shí)挺好的,這里暫不考慮學(xué)習(xí)成本。但是,如果你們團(tuán)隊(duì)想在公司內(nèi)部建立更大的影響力,想要把這套指標(biāo)監(jiān)控系統(tǒng)的能力讓其他團(tuán)隊(duì)也可以使用,那就要做一些工作了,典型的比如:
- 需要一套有權(quán)限管控的 WEB UI,不能誰(shuí)都來(lái)直接修改 yaml 文件,否則容易弄亂,特別是 yaml 還是縮進(jìn)敏感型的配置文件
- 希望有一些最佳實(shí)踐沉淀在平臺(tái)上,讓大家開(kāi)箱即用,畢竟,不是所有團(tuán)隊(duì)都像你們團(tuán)隊(duì)這樣,可以對(duì) Prometheus 玩得這么溜
- 可以接入多個(gè) Prometheus 集群,因?yàn)?Prometheus 單點(diǎn)是有容量上限的,所以企業(yè)中可能會(huì)做業(yè)務(wù)切分或地域切分,這就需要能用一套系統(tǒng)對(duì)接多個(gè) Prometheus
當(dāng)然,夜鶯的能力并非只是一套 Prometheus 的 WEB UI,夜鶯還可以做的事情比如:
- 提供告警屏蔽、訂閱規(guī)則,以及更豐富特性的告警規(guī)則
- 貫通故障自愈,可以在觸發(fā)告警的時(shí)候自動(dòng)執(zhí)行某個(gè)腳本
- 提供告警事件管理、歷史存檔、活躍告警聚合查看視圖
- 提供開(kāi)箱即用的告警規(guī)則和監(jiān)控大盤(pán),可以導(dǎo)入直接使用
- 提供監(jiān)控?cái)?shù)據(jù)查看的快捷視圖,可以非常方便的點(diǎn)點(diǎn)點(diǎn)即可看圖
- 等等
近期更新
業(yè)務(wù)組,在夜鶯中是一個(gè)管理概念,大一些的公司可能會(huì)有幾千條告警規(guī)則,幾百個(gè)大盤(pán),如果用一個(gè)表格扁平羅列,顯然沒(méi)法管理,所以夜鶯引入了一個(gè)業(yè)務(wù)組的概念,可以管理這些規(guī)則和大盤(pán)。近期更新:可以為業(yè)務(wù)組啟用自動(dòng)打標(biāo)簽的功能,這樣歸屬于這個(gè)業(yè)務(wù)組的機(jī)器上報(bào)的監(jiān)控?cái)?shù)據(jù)就會(huì)自動(dòng)打上 busigroup=xx
的標(biāo)簽,比較方便。
快捷視圖,這個(gè)更新動(dòng)作比較大,去掉了之前的對(duì)象視角,這個(gè)考慮是:機(jī)器設(shè)備我們可能希望有個(gè)列表能查看,點(diǎn)擊不同的機(jī)器設(shè)備,就可以查看不同的監(jiān)控對(duì)象,也可以同時(shí)查看多個(gè)機(jī)器的監(jiān)控?cái)?shù)據(jù),整個(gè)過(guò)程無(wú)需輸入,只要點(diǎn)選即可。那既然機(jī)器設(shè)備有這個(gè)需求,MySQL實(shí)例、Redis實(shí)例、MQ實(shí)例、交換機(jī)等,其實(shí)都有這個(gè)需求,所以,我們把對(duì)象視角做了升級(jí),變成了快捷視圖,可以自定義各種視角,算是一個(gè)功能上的小創(chuàng)新。
監(jiān)控大盤(pán),新版本增加了更多的圖表類型的支持,而且可以直接導(dǎo)入 Grafana 大盤(pán),當(dāng)然,因?yàn)橐国L的大盤(pán)和Grafana的大盤(pán)的配置并非完全一致,所以沒(méi)法完全導(dǎo)入,常用的圖表類型都是OK的。
告警發(fā)送,郵件、釘釘、企微、飛書(shū),這些發(fā)送通道都內(nèi)置到夜鶯的代碼中了,如果想要自定義發(fā)送機(jī)制,也可以通過(guò)python腳本,或者webhook,或者Redis的pubsub機(jī)制,或者動(dòng)態(tài)鏈接庫(kù)把代碼加載進(jìn)來(lái),等等多種方式,這樣一來(lái),就可以非常方便的和企業(yè)內(nèi)部的系統(tǒng)做整合了。
另外,新版本支持了最大告警次數(shù)的限制,之前的版本就已經(jīng)支持了通道靜默時(shí)間,或稱為重復(fù)發(fā)送頻率,很多朋友反饋還不夠,有些低級(jí)別的告警可能只需要重復(fù)通知個(gè)兩三次就夠了(高級(jí)別的告警如果沒(méi)有恢復(fù)希望按照某個(gè)頻率一直發(fā)通知),所以就引入了最大告警次數(shù)的限制。
告警聚合展示,這是一個(gè)小創(chuàng)新,為了更好的定位問(wèn)題,我們通常會(huì)在時(shí)間維度做聚合,比如查看今天下午2點(diǎn)左右產(chǎn)生的所有告警事件,通過(guò)分析,可以發(fā)現(xiàn)里邊哪個(gè)是根因。但是,只有時(shí)間維度的聚合還不夠,還應(yīng)該支持不同的標(biāo)簽做聚合,所以新版本,引入了活躍告警卡片視圖,支持通過(guò)標(biāo)簽和事件屬性做聚合,這個(gè)功能廣受好評(píng)。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-457831.html
如上,便是夜鶯近期更新的功能,歡迎大家試用,如有問(wèn)題可以給我們提 issue。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-457831.html
到了這里,關(guān)于Nightingale發(fā)布v5.9.2,新功能解決多個(gè)生產(chǎn)痛點(diǎn),真香的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!