受限于撥測(cè)節(jié)點(diǎn)自身的環(huán)境,單一節(jié)點(diǎn)的撥測(cè)結(jié)果可能并不能反映出監(jiān)控實(shí)例的真實(shí)運(yùn)行狀態(tài)
本期EasyOps產(chǎn)品使用最佳實(shí)踐,我們將為您揭曉:
-
如何基于多點(diǎn)決策配置撥測(cè)監(jiān)控,以避免撥測(cè)機(jī)自身網(wǎng)絡(luò)問(wèn)題而誤告警?
-
如何對(duì)指標(biāo)實(shí)現(xiàn)“降維”,從而匯聚指標(biāo)?
「 背 景 」
撥測(cè)監(jiān)控作為監(jiān)控體系中重要的一環(huán),為管理員提供最為直接的狀態(tài)監(jiān)控。然而,受限于撥測(cè)節(jié)點(diǎn)自身的環(huán)境和網(wǎng)絡(luò)環(huán)境,可能單一撥測(cè)節(jié)點(diǎn)的結(jié)果并不能反映出監(jiān)控實(shí)例的實(shí)際運(yùn)行狀態(tài)。比如,當(dāng)撥測(cè)節(jié)點(diǎn)所在的網(wǎng)絡(luò)發(fā)生故障時(shí),或者和監(jiān)控實(shí)例的網(wǎng)絡(luò)中斷時(shí),此時(shí)會(huì)認(rèn)為監(jiān)控實(shí)例的服務(wù)不可用。
但是,這種判斷可能是錯(cuò)誤的。
因此,多點(diǎn)決策的需求就產(chǎn)生了。它基于這樣一種監(jiān)控邏輯:假設(shè)有兩個(gè)撥測(cè)節(jié)點(diǎn),分布于兩個(gè)不同的環(huán)境或者網(wǎng)絡(luò),同時(shí)對(duì)目標(biāo)實(shí)例撥測(cè)。僅當(dāng)超過(guò)半數(shù)的撥測(cè)節(jié)點(diǎn)(也就是兩臺(tái)撥測(cè)機(jī)都發(fā)生告警時(shí)),才認(rèn)為目標(biāo)實(shí)例異常時(shí),才發(fā)出撥測(cè)告警。
before:
after:
「 配 置 說(shuō) 明 」
1.針對(duì)主機(jī)配置撥測(cè)采集策略,并且指定兩臺(tái)撥測(cè)機(jī)。
2.配置匯聚指標(biāo),這里作詳細(xì)說(shuō)明:
撥測(cè)的指標(biāo):detect_code包含著多個(gè)維度,而我們希望把detectAgentId和detectAgentName這兩個(gè)維度降維了,讓detect_code可通過(guò)jobId來(lái)匯聚成一個(gè)指標(biāo)。
因此,需要作如下配置表達(dá)式:avg(detect_code ) by (stepName,jobId,customTag)
上述表達(dá)式,說(shuō)明新指標(biāo)的維度是stepName,jobId,customTag,把a(bǔ)gent相關(guān)的維度聚合在一起了。
此時(shí),兩臺(tái)撥測(cè)機(jī)的匯聚結(jié)果可參考如下表格:
可知,只有當(dāng)兩臺(tái)撥測(cè)機(jī)都返回1的返回碼時(shí),也就是兩臺(tái)撥測(cè)機(jī)都認(rèn)為實(shí)例故障時(shí),多點(diǎn)決策返回碼才大于0.5,因此0.5可以作為多點(diǎn)決策的判斷閾值。
3.配置告警規(guī)則
此時(shí),當(dāng)兩臺(tái)撥測(cè)機(jī)都探測(cè)目標(biāo)實(shí)例失敗時(shí),才會(huì)發(fā)出撥測(cè)失敗的告警。如果只有一臺(tái)撥測(cè)機(jī)認(rèn)為撥測(cè)失敗,并不會(huì)發(fā)出告警,以實(shí)現(xiàn)了半數(shù)以上判斷為失敗才失敗的邏輯。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-739634.html
該實(shí)踐提供了多點(diǎn)決策的能力,彌補(bǔ)了撥測(cè)節(jié)點(diǎn)的單點(diǎn)缺陷。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-739634.html
到了這里,關(guān)于優(yōu)維產(chǎn)品最佳實(shí)踐第13期:如何避免撥測(cè)機(jī)自身網(wǎng)絡(luò)問(wèn)題?的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!