国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<option id="da0yt"></option>

<strong id="da0yt"><center id="da0yt"></center></strong>

<bdo id="da0yt"></bdo>

<option id="da0yt"><rt id="da0yt"></rt></option><strong id="da0yt"><center id="da0yt"></center></strong>

玩轉(zhuǎn)prometheus告警 alertmanger（一）之prometheus告警規(guī)則

2年前作者：lv2分類：Toy博客閱讀(16)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了玩轉(zhuǎn)prometheus告警 alertmanger（一）之prometheus告警規(guī)則。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

目錄

1. 告警系統(tǒng)原理概述

2.??配置prometheus規(guī)則

2.1 配置告警規(guī)則目錄

2.2 告警規(guī)則

3. 查看效果

1. 告警系統(tǒng)原理概述

在開始之前，需要了解下prometheus和altermanger之間的關(guān)系是什么？從prometheus的架構(gòu)及生態(tài)系統(tǒng)組件來看

prometheus配置alerts,prometheus,linux,運(yùn)維,服務(wù)器

??Prometheus從targets中抓取指標(biāo)（metric）并存儲，通過對指標(biāo)進(jìn)行分析生成告警（alert），并將告警（alert）推送（push）到Alertmanger，Alertmanger對告警進(jìn)行分組、聚合等處理后，通過郵件、Slack、webhook等方式對用戶進(jìn)行發(fā)送告警信息。

總結(jié)整個(gè)告警系統(tǒng)工作流程：

1）制定prometheus告警規(guī)則，當(dāng)監(jiān)控指標(biāo)觸發(fā)告警規(guī)則時(shí)，向altermanger發(fā)送告警；

2）altermanger接收prometheus發(fā)送的告警，管理告警信息，通過分組、靜默、抑制、聚合等處理，將告警通過路由發(fā)送到對應(yīng)的接收器上，按不同的規(guī)則發(fā)送給不同的模塊負(fù)責(zé)人，支持郵件、salck及webhook（對接企業(yè)微信/釘釘/飛書）方式發(fā)送告警通知。

2.??配置prometheus規(guī)則

prometheus告警規(guī)則主要依賴于采集指標(biāo)（metric），通過對指標(biāo)進(jìn)行分析設(shè)置閥值來達(dá)到告警的目的

node監(jiān)控指標(biāo)可參考：node_exporter監(jiān)控項(xiàng)說明https://lnsyyj.github.io/2019/05/27/prometheus-node-exporter-%E7%9B%91%E6%8E%A7%E9%A1%B9/
?mysql exporter指標(biāo)可參考：
GitHub - prometheus/mysqld_exporter: Exporter for MySQL server metricshttps://github.com/prometheus/mysqld_exporter

2.1 配置告警規(guī)則目錄

創(chuàng)建rules目錄，用于統(tǒng)一存放告警規(guī)則

# 在prometheus根目錄下創(chuàng)建rules目錄
mkdir -p /usr/local/prometheus/rules

# 配置prometheus.yml rule_files路徑
# vim /usr/local/prometheus/prometheus.yml

global:
  scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration
alerting:   # 增加alertmanager配置
  alertmanagers:
    - static_configs:
        - targets: ['localhost:9093']
# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files: # 配置告警規(guī)則目錄
  - rules/*.yml

重啟prometheus生效規(guī)則

# 熱重載
curl -X POST http://127.0.0.1:9090/-/reload

2.2 告警規(guī)則

?告警規(guī)則示例以服務(wù)器資源監(jiān)控指標(biāo)為準(zhǔn)，包括主機(jī)CPU/內(nèi)存/硬盤/網(wǎng)絡(luò)/TCP等告警規(guī)則，所有告警規(guī)則以*.yml的后綴存放到/usr/local/prometheus/rules目錄下，目錄可自定義（詳看2.1配置告警規(guī)則目錄）

2.2.1?主機(jī)存活

groups:
- name: 主機(jī)存活告警  # 命名
  rules:
  - alert: 主機(jī)存活告警 # 命名
    expr: up == 0 # 表達(dá)式，分析指標(biāo)判定告警
    for: 60s  # 觸發(fā)告警持續(xù)時(shí)間
    labels:   # 自定義告警標(biāo)簽
      severity: warning
    annotations:   # 告警內(nèi)容注釋，根據(jù)需要制定
      summary: "{{ $labels.instance }} 宕機(jī)超過1分鐘！"

2.2.2 內(nèi)存利用

groups:
- name: 主機(jī)內(nèi)存使用率告警
  rules:
  - alert: 主機(jī)內(nèi)存使用率告警
    expr: (1 - (node_memory_MemAvailable_bytes / (node_memory_MemTotal_bytes))) * 100 > 80
    for: 15m
    labels:
      severity: warning
    annotations:
      summary: "內(nèi)存利用率大于80%, 實(shí)例: {{ $labels.instance }}，當(dāng)前值：{{ $value }}%"

2.2..3 cpu利用

groups:
- name: 主機(jī)CPU使用率告警
  rules:
  - alert: 主機(jī)CPU使用率告警
    expr: 100 - (avg by (instance)(irate(node_cpu_seconds_total{mode="idle"}[1m]) )) * 100 > 80
    for: 15m
    labels:
      severity: warning
    annotations:
      summary: "CPU近15分鐘使用率大于80%, 實(shí)例: {{ $labels.instance }}，當(dāng)前值：{{ $value }}%"

2.2..4 磁盤利用

# 磁盤利用>80%
groups:
- name: 主機(jī)磁盤使用率告警
  rules:
  - alert: 主機(jī)磁盤使用率告警
    expr: 100 - node_filesystem_free_bytes{fstype=~"xfs|ext4"} / node_filesystem_size_bytes{fstype=~"xfs|ext4"} * 100 > 80 
    for: 15m
    labels:
      severity: warning
    annotations:
      summary: "磁盤使用率大于80%, 實(shí)例: {{ $labels.instance }}，當(dāng)前值：{{ $value }}%"

2.2.5 tcp time_wait

groups:
- name: 主機(jī)Tcp TimeWait數(shù)量過多告警
  rules:
  - alert: 主機(jī)Tcp TimeWait數(shù)量過多告警
    expr: node_sockstat_TCP_tw >= 5000
    for: 1m
    labels:
      severity: warning
    annotations:
      summary: "Tcp TimeWait數(shù)量大于5000, 實(shí)例: {{ $labels.instance }}，當(dāng)前值：{{ $value }}%"

2.2.6 iowait

groups:
- name: 主機(jī)iowait較高
  rules:
  - alert: 主機(jī)iowait較高
    expr: (sum(increase(node_cpu_seconds_total{mode='iowait'}[5m]))by(instance)) / (sum(increase(node_cpu_seconds_total[5m]))by(instance))  *100 >= 10
    for: 5m
    labels:
      severity: warning
    annotations:
      summary: "CPU ioWait近5分鐘占比大于等于10%, 實(shí)例: {{ $labels.instance }}，當(dāng)前值：{{ $value }}%"

2.2.7 磁盤讀過大

groups:
- name: 主機(jī)磁盤讀過大
  rules:
  - alert: 主機(jī)磁盤讀過大
    expr: sum by (instance) (rate(node_disk_read_bytes_total[2m])) > 50*1024 *1024 
    for: 5m
    labels:
      severity: warning
    annotations:
      summary: "磁盤讀過大, 實(shí)例: {{$labels.instance}}，當(dāng)前值: {{ $value | humanize1024 }}。"

2.2.8 磁盤寫過大

# 寫入 > 50MB/s
groups:
- name: 主機(jī)磁盤寫過大
  rules:
  - alert: 主機(jī)磁盤寫過大
    expr: sum by (instance) (rate(node_disk_written_bytes_total[2m])) > 50 * 1024 * 1024
    for: 5m
    labels:
      severity: warning
    annotations:
      summary: "磁盤寫過大, 實(shí)例: {{$labels.instance}}，當(dāng)前值: {{ $value | humanize1024 }}。"

2.2.9?重啟prometheus生效規(guī)則

# 熱重載
curl -X POST http://127.0.0.1:9090/-/reload

3. 查看效果

查看：http://127.0.0.1:9090/alerts?search=

Prometheus Alert 告警狀態(tài)有三種狀態(tài)：Inactive、Pending、Firing。

Inactive：非活動狀態(tài)，表示正在監(jiān)控，但是還未有任何警報(bào)觸發(fā)。
Pending：表示這個(gè)警報(bào)必須被觸發(fā)。由于警報(bào)可以被分組、壓抑/抑制或靜默/靜音，所以等待驗(yàn)證，一旦所有的驗(yàn)證都通過，則將轉(zhuǎn)到 Firing 狀態(tài)。
Firing：將警報(bào)發(fā)送到 AlertManager，它將按照配置將警報(bào)的發(fā)送給所有接收者。一旦警報(bào)解除，則將狀態(tài)轉(zhuǎn)到 Inactive，如此循環(huán)。

prometheus配置alerts,prometheus,linux,運(yùn)維,服務(wù)器

?至此，prometheus告警系統(tǒng)告警規(guī)則部分就完成了，其它告警規(guī)則根據(jù)需要自行添加，這里就不做分享了

覺得好用就點(diǎn)個(gè)收藏吧~文章來源地址http://www.zghlxwxcb.cn/news/detail-641461.html

到了這里，關(guān)于玩轉(zhuǎn)prometheus告警 alertmanger（一）之prometheus告警規(guī)則的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

阿里云ACK托管版安裝Prometheus并配置kafka告警
前提條件: 1.已有ACK集群。一、ACK集群中創(chuàng)建prometheus、alert的持久化的存儲類(總共創(chuàng)建2個(gè)，步驟一致，名稱和掛載的nas盤或者子目錄不同而已)。grafana的dashboard持久化通過添加配置文件并打標(biāo)簽實(shí)現(xiàn)。一、在應(yīng)用市場找到ack-prometheus-operator,點(diǎn)擊進(jìn)入后選擇\\\"一鍵部署\\\"。 ?二、
2024年01月22日
瀏覽(17)
prometheus 配置服務(wù)器監(jiān)控、服務(wù)監(jiān)控、容器中服務(wù)監(jiān)控與告警
? ? ? ?最近公司有幾個(gè)服務(wù)遇到了瓶頸，也就是數(shù)據(jù)量增加了，沒有人發(fā)現(xiàn)，這不是缺少一個(gè)監(jiān)控服務(wù)和告警的系統(tǒng)嗎？?? ? ? ? 主要需求是監(jiān)控每個(gè)服務(wù)，順帶監(jiān)控一下服務(wù)器和一些中間件，這里采集的2種，zabbix和prometheus，由于我們要監(jiān)控的是Docker容器中的服務(wù)，最終
2024年02月14日
瀏覽(24)
Springboot 集成Prometheus 數(shù)據(jù)采集使用grafana 監(jiān)控報(bào)告告警郵件配置
目錄 Springboot 相關(guān) Pom 重點(diǎn)包如果有需要可以增加安全包-一般內(nèi)部機(jī)房沒啥事-（非必選） Application.yml配置文件-（非必選） Application.properties management.endpoints.web.exposure.include介紹啟動類查看監(jiān)控信息 Prometheus Prometheus.yml 配置如果使用類安全包-（非必選）啟動就可以看到了
2024年02月11日
瀏覽(28)
Prometheus接入AlterManager配置郵件告警(基于K8S環(huán)境部署)
基于此環(huán)境做實(shí)驗(yàn) 1.創(chuàng)建AlertManager ConfigMap資源清單執(zhí)行YAML資源清單： 2.配置文件核心配置說明 group_by: [alertname]：采用哪個(gè)標(biāo)簽來作為分組依據(jù)。 group_wait：10s：組告警等待時(shí)間。就是告警產(chǎn)生后等待10s，如果有同組告警一起發(fā)出。 group_interval: 10s ：上下兩組發(fā)送告警的間隔
2024年04月17日
瀏覽(26)
prometheus進(jìn)程監(jiān)控配置告警及解決grafana監(jiān)控面板不展示主機(jī)名問題
process_exporter進(jìn)程監(jiān)控及告警監(jiān)控服務(wù)器全部或某些進(jìn)程是否健康，以及進(jìn)程所占用資源是否異常使用process_exporter監(jiān)測器進(jìn)行進(jìn)程信息的采集與node_exporter監(jiān)測器相同，需要監(jiān)測哪臺服務(wù)器的進(jìn)程，就將process_exporter監(jiān)測器部署在哪臺安裝process_exporter wget Release v0.7.10 · ncabato
2024年02月13日
瀏覽(24)
Prometheus接入AlterManager配置企業(yè)微信告警(基于K8S環(huán)境部署)
注意：請基于 Prometheus+Grafana監(jiān)控K8S集群(基于K8S環(huán)境部署)文章之上做本次實(shí)驗(yàn)。 1、創(chuàng)建企業(yè)微信機(jī)器人點(diǎn)擊登入企業(yè)微信網(wǎng)頁版: 應(yīng)用管理機(jī)器人創(chuàng)建應(yīng)用創(chuàng)建好之后如上圖，我們獲取點(diǎn)擊查看獲取 Secret 值。 2、獲取企業(yè)ID 1、創(chuàng)建AlterManager ConfigMap資源清單執(zhí)行YAML資源
2024年02月04日
瀏覽(18)
【Linux】部署Prometheus + Grafana簡介、監(jiān)控及設(shè)置告警詳細(xì)操作（多種方式安裝，親測無問題）
?? 博主簡介 ????云計(jì)算領(lǐng)域優(yōu)質(zhì)創(chuàng)作者 ????華為云開發(fā)者社區(qū)專家博主 ????阿里云開發(fā)者社區(qū)專家博主 ?? 交流社區(qū)：運(yùn)維交流社區(qū) 歡迎大家的加入！服務(wù)器類型 IP地址組件 Prometheus 服務(wù)器、agent 服務(wù)器、grafana 服務(wù)器 172.16.11.209 Prometheus、node_exporter、Grafana
2024年02月13日
瀏覽(24)
Linux部署docker以及prometheus+node_exporter+mysqld-exporter+grafana+cadvisor+Alertmanager(告警)
Linux安裝docker以及部署prometheus+node_exporter+mysqld-exporter+grafana+cadvisor+Alertmanager(告警) 1、官方安裝腳本自動安裝docker curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun 2、啟動docker systemctl start docker 3、搜索鏡像-例如搜索prometheus docker search prom/prometheus 4、拉取鏡像--這里僅列出我
2024年03月15日
瀏覽(28)
容器云平臺監(jiān)控告警體系（五）—— Prometheus發(fā)送告警機(jī)制
在Prometheus的架構(gòu)中告警被劃分為兩個(gè)部分，在Prometheus Server中定義告警規(guī)則以及產(chǎn)生告警，Alertmanager組件則用于處理這些由Prometheus產(chǎn)生的告警。本文主要講解Prometheus發(fā)送告警機(jī)制也就是在Prometheus Server中定義告警規(guī)則和產(chǎn)生告警部分，不過多介紹Alertmanager組件。在Prometheus中
2023年04月23日
瀏覽(21)
prometheus告警處理
一.告警簡介 1.工作流程 prometheus收集監(jiān)測的信息 prometheus.yml 文件中定義 rules 文件，rules 里包含告警信息 prometheus 把告警信息 push 給 altermanager，alertmanager 里定義收件人和發(fā)件人 altermanager 發(fā)送文件到郵箱或微信 2.告警生命周期定期采集監(jiān)控?cái)?shù)據(jù) 定期掃描告警規(guī)則，發(fā)現(xiàn)告警
2023年04月08日
瀏覽(15)

<form id="gncks"></form>

<fieldset id="gncks"></fieldset>

<bdo id="gncks"></bdo>

<option id="gncks"><rt id="gncks"></rt></option>