一、前言
- 隨著 HiredScore 的產(chǎn)品和客戶群越來(lái)越大,已經(jīng)開(kāi)始向 Kubernetes 過(guò)渡并迅速采用它,它是我們重要的障礙之一,也可能是最大的監(jiān)控基礎(chǔ)設(shè)施。我們?cè)谑褂?Prometheus / Grafana 堆棧進(jìn)行監(jiān)控方面有一些經(jīng)驗(yàn),了解到希望創(chuàng)建一個(gè)更好、高可用性和彈性的基礎(chǔ)架構(gòu),具有可行且具有成本效益的數(shù)據(jù)保留,此外,它還允許 HiredScore 的高速增長(zhǎng)做好準(zhǔn)備。
- CNCF 推廣了多種基礎(chǔ)設(shè)施,可以解決這些監(jiān)控痛點(diǎn),并實(shí)現(xiàn)具有高可用性、數(shù)據(jù)保留和成本效益的監(jiān)控。
- 要求:
-
- 單點(diǎn)可觀察性將聚合來(lái)自任何區(qū)域的所有集群的所有數(shù)據(jù);
-
- Prometheus 的高可用性和彈性基礎(chǔ)架構(gòu);
-
- 我們所有應(yīng)用程序數(shù)據(jù)的數(shù)據(jù)保留;
-
- 經(jīng)濟(jì)高效的解決方案。
- 最終選擇 Bitnami 的 Kube-Prometheus 解決方案和 Thanos-io 的 Kube-Thanos 解決方案,該解決方案效果很好,并成功滿足了所有需求?,F(xiàn)在來(lái)認(rèn)識(shí)一下 players:
-
- Prometheus — 是用于事件監(jiān)控和警報(bào)的免費(fèi)軟件應(yīng)用程序,它在使用 HTTP 拉取模型構(gòu)建的時(shí)間序列數(shù)據(jù)庫(kù)中記錄實(shí)時(shí)指標(biāo),具有靈活的查詢和實(shí)時(shí)警報(bào);
-
- Thanos — 一個(gè)基于 Prometheus 組件的開(kāi)源 CNCF 沙盒項(xiàng)目,用于創(chuàng)建全球規(guī)模的高可用性監(jiān)控系統(tǒng),它通過(guò)幾個(gè)簡(jiǎn)單的步驟無(wú)縫地?cái)U(kuò)展了 Prometheus。
文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-787430.html
文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-787430.html
到了這里,關(guān)于云原生之深入解析Thanos在EKS多集群架構(gòu)上存儲(chǔ)多個(gè)集群Prometheus的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!