一、前言
??某業(yè)務系統(tǒng)因OS改造,原先的Zabbix監(jiān)控系統(tǒng)推倒后未重建,本來計劃用外部企業(yè)內(nèi)其他監(jiān)控系統(tǒng)接入,后又通知需要自建才能對接,考慮之前zabbix的一些不便,本次計劃采用一個類Prometheus的監(jiān)控系統(tǒng),鏡調(diào)研后發(fā)現(xiàn)Nightingale兼容Prometheus,又有一些其他功能增強,又在一些大的企業(yè)經(jīng)過較大規(guī)模部署實踐,故本次采用Nightingale作為監(jiān)控系統(tǒng)來進行重建。
??Nightingale(夜鶯) 是由滴滴開源,捐贈給中國計算機學會開源發(fā)展委員會(CCF ODC)的, 它是在 Open-Falcon 的基礎上,結(jié)合滴滴內(nèi)部的最佳實踐,在性能、可維護性、易用性方面做了大量的改進,逐漸成熟為滴滴集團統(tǒng)一的監(jiān)控解決方案,支撐了滴滴內(nèi)部數(shù)十億監(jiān)控指標,覆蓋了從OS、容器、到應用等各層面的監(jiān)控需求,周活躍用戶數(shù)千。(Nightingale)作為一個企業(yè)級云原生監(jiān)控解決方案,旨在滿足云原生時代企業(yè)級的監(jiān)控需求,側(cè)重云原生,同上兼顧云原生和裸金屬,支持應用監(jiān)控和系統(tǒng)監(jiān)控,插件機制靈活,插件豐富完善,具有高度的靈活性和可擴展性。它可滿足不同規(guī)模用戶的場景,小到幾臺服務,大到數(shù)十萬都可以完美支撐。官網(wǎng)號稱:它具備All-in-One部署和開箱即用特性,集合了 Prometheus 和 Grafana 的優(yōu)點,集成了數(shù)據(jù)收集、可視化和監(jiān)控警報三大主要功能,還可以對分布在多個 Region 的指標、日志、鏈路追蹤數(shù)據(jù)進行統(tǒng)一的可視化和分析。
通過上述系統(tǒng),我們需要解決如下問題:
- 當環(huán)境中主機系統(tǒng)出現(xiàn)問題后 , 能及時感知,并告警通知,有方便的告警配置方式和多樣的通知方式
- 可通過歷史數(shù)據(jù)了解當前環(huán)境運行趨勢,預測未來可能出問題,為服務擴縮容提供數(shù)據(jù)支撐
- 配置簡單,功能完善,文檔豐富,有成熟的結(jié)構(gòu)可參考
- 支持多種指標檢測,尤其可及時感知業(yè)務異常,并支持一定的告警自我恢復
相關資源:官網(wǎng)、官方手冊、nightingale Gitee、官方文檔、社區(qū)問答、Bug報告、open-falcon、Netdata、TSDB
二、產(chǎn)品特性及架構(gòu)
2.1、產(chǎn)品特性
目前官方最新版是6.5.0版本。從 v6 版本開始,夜鶯嘗試轉(zhuǎn)型為統(tǒng)一可觀測性平臺,n9e 不再僅支持接入時序數(shù)據(jù)源(Prometheus、Victoriametrics、M3DB、Thanos),也可以接入日志類數(shù)據(jù)源(Elasticsearch,Loki【預】),鏈路追蹤數(shù)據(jù)源(Jaeger)。
1)開箱即用:Nightingale支持Docker、Helm Chart和云服務等多種部署方式,它將數(shù)據(jù)收集、監(jiān)控和警報集成到了一個系統(tǒng)中,并配有各種監(jiān)控面板、快速視圖和警報規(guī)則模板,這大大降低了云原生監(jiān)控系統(tǒng)的建設成本、學習成本和使用成本,從 v6 版本開始,支持接入 ElasticSearch、Jaeger 數(shù)據(jù)源,實現(xiàn)日志、鏈路、指標多維度的統(tǒng)一可觀測,更好的UI界面也讓用戶使用更簡單,更加友好。
2)專業(yè)的告警管理:它可提供可視化警報配置和管理,支持各種警報規(guī)則,提供配置靜默和訂閱規(guī)則的功能,支持多個警報傳遞通道(多種告警方式),并具有警報自我修復和事件管理等功能。支持對接 Prometheus、VictoriaMetrics、Thanos、Mimir、M3DB 等多種時序庫,可實現(xiàn)統(tǒng)的一告警管理。另外它無縫搭配 Flashduty,實現(xiàn)了告警聚合收斂、認領、升級、排班、IM集成,確保告警處理不遺漏,減少打擾,更好協(xié)同。文章來源:http://www.zghlxwxcb.cn/news/detail-763296.html
3&文章來源地址http://www.zghlxwxcb.cn/news/detail-763296.html
到了這里,關于開源運維監(jiān)控系統(tǒng)-Nightingale(夜鶯)應用實踐(未完)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!