国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

玩轉(zhuǎn)prometheus告警 alertmanger(一)之prometheus告警規(guī)則

這篇具有很好參考價(jià)值的文章主要介紹了玩轉(zhuǎn)prometheus告警 alertmanger(一)之prometheus告警規(guī)則。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

目錄

1. 告警系統(tǒng)原理概述

2.??配置prometheus規(guī)則

2.1 配置告警規(guī)則目錄

2.2 告警規(guī)則

3. 查看效果


1. 告警系統(tǒng)原理概述

在開始之前,需要了解下prometheus和altermanger之間的關(guān)系是什么?從prometheus的架構(gòu)及生態(tài)系統(tǒng)組件來看

prometheus配置alerts,prometheus,linux,運(yùn)維,服務(wù)器

??Prometheus從targets中抓取指標(biāo)(metric)并存儲,通過對指標(biāo)進(jìn)行分析生成告警(alert),并將告警(alert)推送(push)到Alertmanger,Alertmanger對告警進(jìn)行分組、聚合等處理后,通過郵件、Slack、webhook等方式對用戶進(jìn)行發(fā)送告警信息。

總結(jié)整個(gè)告警系統(tǒng)工作流程:

1)制定prometheus告警規(guī)則,當(dāng)監(jiān)控指標(biāo)觸發(fā)告警規(guī)則時(shí),向altermanger發(fā)送告警;

2)altermanger接收prometheus發(fā)送的告警,管理告警信息,通過分組、靜默、抑制、聚合等處理,將告警通過路由發(fā)送到對應(yīng)的接收器上,按不同的規(guī)則發(fā)送給不同的模塊負(fù)責(zé)人,支持郵件、salck及webhook(對接企業(yè)微信/釘釘/飛書)方式發(fā)送告警通知。

2.??配置prometheus規(guī)則

prometheus告警規(guī)則主要依賴于采集指標(biāo)(metric),通過對指標(biāo)進(jìn)行分析設(shè)置閥值來達(dá)到告警的目的

  • node監(jiān)控指標(biāo)可參考:node_exporter監(jiān)控項(xiàng)說明https://lnsyyj.github.io/2019/05/27/prometheus-node-exporter-%E7%9B%91%E6%8E%A7%E9%A1%B9/
  • ?mysql exporter指標(biāo)可參考:
  • GitHub - prometheus/mysqld_exporter: Exporter for MySQL server metricshttps://github.com/prometheus/mysqld_exporter

2.1 配置告警規(guī)則目錄

創(chuàng)建rules目錄,用于統(tǒng)一存放告警規(guī)則

# 在prometheus根目錄下創(chuàng)建rules目錄
mkdir -p /usr/local/prometheus/rules

# 配置prometheus.yml rule_files路徑
# vim /usr/local/prometheus/prometheus.yml

global:
  scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration
alerting:   # 增加alertmanager配置
  alertmanagers:
    - static_configs:
        - targets: ['localhost:9093']
# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files: # 配置告警規(guī)則目錄
  - rules/*.yml

重啟prometheus生效規(guī)則

# 熱重載
curl -X POST http://127.0.0.1:9090/-/reload

2.2 告警規(guī)則

?告警規(guī)則示例以服務(wù)器資源監(jiān)控指標(biāo)為準(zhǔn),包括主機(jī)CPU/內(nèi)存/硬盤/網(wǎng)絡(luò)/TCP等告警規(guī)則,所有告警規(guī)則以*.yml的后綴存放到/usr/local/prometheus/rules目錄下,目錄可自定義(詳看2.1配置告警規(guī)則目錄)

2.2.1?主機(jī)存活

groups:
- name: 主機(jī)存活告警  # 命名
  rules:
  - alert: 主機(jī)存活告警 # 命名
    expr: up == 0 # 表達(dá)式,分析指標(biāo)判定告警
    for: 60s  # 觸發(fā)告警持續(xù)時(shí)間
    labels:   # 自定義告警標(biāo)簽
      severity: warning
    annotations:   # 告警內(nèi)容注釋,根據(jù)需要制定
      summary: "{{ $labels.instance }} 宕機(jī)超過1分鐘!"  

2.2.2 內(nèi)存利用

groups:
- name: 主機(jī)內(nèi)存使用率告警
  rules:
  - alert: 主機(jī)內(nèi)存使用率告警
    expr: (1 - (node_memory_MemAvailable_bytes / (node_memory_MemTotal_bytes))) * 100 > 80
    for: 15m
    labels:
      severity: warning
    annotations:
      summary: "內(nèi)存利用率大于80%, 實(shí)例: {{ $labels.instance }},當(dāng)前值:{{ $value }}%"

2.2..3 cpu利用

groups:
- name: 主機(jī)CPU使用率告警
  rules:
  - alert: 主機(jī)CPU使用率告警
    expr: 100 - (avg by (instance)(irate(node_cpu_seconds_total{mode="idle"}[1m]) )) * 100 > 80
    for: 15m
    labels:
      severity: warning
    annotations:
      summary: "CPU近15分鐘使用率大于80%, 實(shí)例: {{ $labels.instance }},當(dāng)前值:{{ $value }}%"

2.2..4 磁盤利用

# 磁盤利用>80%
groups:
- name: 主機(jī)磁盤使用率告警
  rules:
  - alert: 主機(jī)磁盤使用率告警
    expr: 100 - node_filesystem_free_bytes{fstype=~"xfs|ext4"} / node_filesystem_size_bytes{fstype=~"xfs|ext4"} * 100 > 80 
    for: 15m
    labels:
      severity: warning
    annotations:
      summary: "磁盤使用率大于80%, 實(shí)例: {{ $labels.instance }},當(dāng)前值:{{ $value }}%"

2.2.5 tcp time_wait

groups:
- name: 主機(jī)Tcp TimeWait數(shù)量過多告警
  rules:
  - alert: 主機(jī)Tcp TimeWait數(shù)量過多告警
    expr: node_sockstat_TCP_tw >= 5000
    for: 1m
    labels:
      severity: warning
    annotations:
      summary: "Tcp TimeWait數(shù)量大于5000, 實(shí)例: {{ $labels.instance }},當(dāng)前值:{{ $value }}%"

2.2.6 iowait

groups:
- name: 主機(jī)iowait較高
  rules:
  - alert: 主機(jī)iowait較高
    expr: (sum(increase(node_cpu_seconds_total{mode='iowait'}[5m]))by(instance)) / (sum(increase(node_cpu_seconds_total[5m]))by(instance))  *100 >= 10
    for: 5m
    labels:
      severity: warning
    annotations:
      summary: "CPU ioWait近5分鐘占比大于等于10%, 實(shí)例: {{ $labels.instance }},當(dāng)前值:{{ $value }}%"

2.2.7 磁盤讀過大

groups:
- name: 主機(jī)磁盤讀過大
  rules:
  - alert: 主機(jī)磁盤讀過大
    expr: sum by (instance) (rate(node_disk_read_bytes_total[2m])) > 50*1024 *1024 
    for: 5m
    labels:
      severity: warning
    annotations:
      summary: "磁盤讀過大, 實(shí)例: {{$labels.instance}},當(dāng)前值: {{ $value | humanize1024 }}。"

2.2.8 磁盤寫過大

# 寫入 > 50MB/s
groups:
- name: 主機(jī)磁盤寫過大
  rules:
  - alert: 主機(jī)磁盤寫過大
    expr: sum by (instance) (rate(node_disk_written_bytes_total[2m])) > 50 * 1024 * 1024
    for: 5m
    labels:
      severity: warning
    annotations:
      summary: "磁盤寫過大, 實(shí)例: {{$labels.instance}},當(dāng)前值: {{ $value | humanize1024 }}。"

2.2.9?重啟prometheus生效規(guī)則

# 熱重載
curl -X POST http://127.0.0.1:9090/-/reload

3. 查看效果

查看:http://127.0.0.1:9090/alerts?search=

Prometheus Alert 告警狀態(tài)有三種狀態(tài):Inactive、Pending、Firing。

  • Inactive:非活動狀態(tài),表示正在監(jiān)控,但是還未有任何警報(bào)觸發(fā)。
  • Pending:表示這個(gè)警報(bào)必須被觸發(fā)。由于警報(bào)可以被分組、壓抑/抑制或靜默/靜音,所以等待驗(yàn)證,一旦所有的驗(yàn)證都通過,則將轉(zhuǎn)到 Firing 狀態(tài)。
  • Firing:將警報(bào)發(fā)送到 AlertManager,它將按照配置將警報(bào)的發(fā)送給所有接收者。一旦警報(bào)解除,則將狀態(tài)轉(zhuǎn)到 Inactive,如此循環(huán)。

prometheus配置alerts,prometheus,linux,運(yùn)維,服務(wù)器

?至此,prometheus告警系統(tǒng)告警規(guī)則部分就完成了,其它告警規(guī)則根據(jù)需要自行添加,這里就不做分享了

覺得好用就點(diǎn)個(gè)收藏 吧~文章來源地址http://www.zghlxwxcb.cn/news/detail-641461.html

到了這里,關(guān)于玩轉(zhuǎn)prometheus告警 alertmanger(一)之prometheus告警規(guī)則的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 阿里云ACK托管版安裝Prometheus并配置kafka告警

    阿里云ACK托管版安裝Prometheus并配置kafka告警

    前提條件: 1.已有ACK集群。 一、ACK集群中創(chuàng)建prometheus、alert的持久化的存儲類(總共創(chuàng)建2個(gè),步驟一致,名稱和掛載的nas盤或者子目錄不同而已)。grafana的dashboard持久化通過添加配置文件并打標(biāo)簽實(shí)現(xiàn)。 一、在應(yīng)用市場找到ack-prometheus-operator,點(diǎn)擊進(jìn)入后選擇\\\"一鍵部署\\\"。 ?二、

    2024年01月22日
    瀏覽(17)
  • prometheus 配置服務(wù)器監(jiān)控、服務(wù)監(jiān)控、容器中服務(wù)監(jiān)控與告警

    prometheus 配置服務(wù)器監(jiān)控、服務(wù)監(jiān)控、容器中服務(wù)監(jiān)控與告警

    ? ? ? ?最近公司有幾個(gè)服務(wù)遇到了瓶頸,也就是數(shù)據(jù)量增加了,沒有人發(fā)現(xiàn),這不是缺少一個(gè)監(jiān)控服務(wù)和告警的系統(tǒng)嗎??? ? ? ? 主要需求是監(jiān)控每個(gè)服務(wù),順帶監(jiān)控一下服務(wù)器和一些中間件,這里采集的2種,zabbix和prometheus,由于我們要監(jiān)控的是Docker容器中的服務(wù),最終

    2024年02月14日
    瀏覽(24)
  • Springboot 集成Prometheus 數(shù)據(jù)采集 使用grafana 監(jiān)控報(bào)告告警 郵件配置

    Springboot 集成Prometheus 數(shù)據(jù)采集 使用grafana 監(jiān)控報(bào)告告警 郵件配置

    目錄 Springboot 相關(guān) Pom 重點(diǎn)包 如果有需要可以增加安全包-一般內(nèi)部機(jī)房沒啥事-(非必選) Application.yml配置文件-(非必選) Application.properties management.endpoints.web.exposure.include介紹 啟動類 查看監(jiān)控信息 Prometheus Prometheus.yml 配置 如果使用類安全包-(非必選) 啟動就可以看到了

    2024年02月11日
    瀏覽(28)
  • Prometheus接入AlterManager配置郵件告警(基于K8S環(huán)境部署)

    Prometheus接入AlterManager配置郵件告警(基于K8S環(huán)境部署)

    基于 此環(huán)境做實(shí)驗(yàn) 1.創(chuàng)建AlertManager ConfigMap資源清單 執(zhí)行YAML資源清單: 2.配置文件核心配置說明 group_by: [alertname]:采用哪個(gè)標(biāo)簽來作為分組依據(jù)。 group_wait:10s:組告警等待時(shí)間。就是告警產(chǎn)生后等待10s,如果有同組告警一起發(fā)出。 group_interval: 10s :上下兩組發(fā)送告警的間隔

    2024年04月17日
    瀏覽(26)
  • prometheus進(jìn)程監(jiān)控配置告警及解決grafana監(jiān)控面板不展示主機(jī)名問題

    prometheus進(jìn)程監(jiān)控配置告警及解決grafana監(jiān)控面板不展示主機(jī)名問題

    process_exporter進(jìn)程監(jiān)控及告警 監(jiān)控服務(wù)器全部或某些進(jìn)程是否健康,以及進(jìn)程所占用資源是否異常使用process_exporter監(jiān)測器進(jìn)行進(jìn)程信息的采集與node_exporter監(jiān)測器相同,需要監(jiān)測哪臺服務(wù)器的進(jìn)程,就將process_exporter監(jiān)測器部署在哪臺 安裝process_exporter wget Release v0.7.10 · ncabato

    2024年02月13日
    瀏覽(24)
  • Prometheus接入AlterManager配置企業(yè)微信告警(基于K8S環(huán)境部署)

    Prometheus接入AlterManager配置企業(yè)微信告警(基于K8S環(huán)境部署)

    注意:請基于 Prometheus+Grafana監(jiān)控K8S集群(基于K8S環(huán)境部署)文章之上做本次實(shí)驗(yàn)。 1、創(chuàng)建企業(yè)微信機(jī)器人 點(diǎn)擊登入企業(yè)微信網(wǎng)頁版: 應(yīng)用管理 機(jī)器人 創(chuàng)建應(yīng)用 創(chuàng)建好之后如上圖,我們獲取 點(diǎn)擊查看獲取 Secret 值。 2、獲取企業(yè)ID 1、創(chuàng)建AlterManager ConfigMap資源清單 執(zhí)行YAML資源

    2024年02月04日
    瀏覽(18)
  • 【Linux】部署Prometheus + Grafana簡介、監(jiān)控及設(shè)置告警詳細(xì)操作(多種方式安裝,親測無問題)

    【Linux】部署Prometheus + Grafana簡介、監(jiān)控及設(shè)置告警詳細(xì)操作(多種方式安裝,親測無問題)

    ?? 博主簡介 ????云計(jì)算領(lǐng)域優(yōu)質(zhì)創(chuàng)作者 ????華為云開發(fā)者社區(qū)專家博主 ????阿里云開發(fā)者社區(qū)專家博主 ?? 交流社區(qū): 運(yùn)維交流社區(qū) 歡迎大家的加入! 服務(wù)器類型 IP地址 組件 Prometheus 服務(wù)器、agent 服務(wù)器、grafana 服務(wù)器 172.16.11.209 Prometheus、node_exporter、Grafana

    2024年02月13日
    瀏覽(24)
  • Linux部署docker以及prometheus+node_exporter+mysqld-exporter+grafana+cadvisor+Alertmanager(告警)

    Linux部署docker以及prometheus+node_exporter+mysqld-exporter+grafana+cadvisor+Alertmanager(告警)

    Linux安裝docker以及部署prometheus+node_exporter+mysqld-exporter+grafana+cadvisor+Alertmanager(告警) 1、官方安裝腳本自動安裝docker curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun 2、啟動docker systemctl start docker 3、搜索鏡像-例如搜索prometheus docker search prom/prometheus 4、拉取鏡像--這里僅列出我

    2024年03月15日
    瀏覽(28)
  • 容器云平臺監(jiān)控告警體系(五)—— Prometheus發(fā)送告警機(jī)制

    容器云平臺監(jiān)控告警體系(五)—— Prometheus發(fā)送告警機(jī)制

    在Prometheus的架構(gòu)中告警被劃分為兩個(gè)部分,在Prometheus Server中定義告警規(guī)則以及產(chǎn)生告警,Alertmanager組件則用于處理這些由Prometheus產(chǎn)生的告警。本文主要講解Prometheus發(fā)送告警機(jī)制也就是在Prometheus Server中定義告警規(guī)則和產(chǎn)生告警部分,不過多介紹Alertmanager組件。 在Prometheus中

    2023年04月23日
    瀏覽(21)
  • prometheus告警處理

    一.告警簡介 1.工作流程 prometheus收集監(jiān)測的信息 prometheus.yml 文件中定義 rules 文件,rules 里包含告警信息 prometheus 把告警信息 push 給 altermanager,alertmanager 里定義收件人和發(fā)件人 altermanager 發(fā)送文件到郵箱或微信 2.告警生命周期 定期采集監(jiān)控?cái)?shù)據(jù) 定期掃描告警規(guī)則,發(fā)現(xiàn)告警

    2023年04月08日
    瀏覽(15)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包