国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

統(tǒng)信軟件高級系統(tǒng)研發(fā)工程師:sysOM 在系統(tǒng)可靠性與安全上實踐

這篇具有很好參考價值的文章主要介紹了統(tǒng)信軟件高級系統(tǒng)研發(fā)工程師:sysOM 在系統(tǒng)可靠性與安全上實踐。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

一、系統(tǒng)可靠性

sysom,大數(shù)據(jù),阿里云,云計算

SRE是判斷系統(tǒng)是否可靠、可用、有效重要標準,它包括:

  • 服務水平指標SLI:衡量服務使用情況量化指標。 比如IO讀寫速率、網(wǎng)絡延遲。通常量化指標會轉換為比率、平均值或百分比。
  • 服務水平目標SLO:一段時間、區(qū)間內的目標。 SLO的表達式通常為: SLI <= target 或 lower bound ≤ SLI ≤ upper bound。比如SLO可以為每個請求的平均延遲<=10ms。
  • 服務水平協(xié)議SLA:測量指標應與商業(yè)目標密切相關。

sysom,大數(shù)據(jù),阿里云,云計算

穩(wěn)定性99.99% 和 99.999% 在大部分情況下對用戶體驗差異不大,但每增加一個9,會顯著增加成本。

基于時間的可用性=可用時間/總時間,但該指標通常意義不大。比如某訂單系統(tǒng)在7天內有1小時不可用,其影響將是致命的。

基于成功率的可靠性=成功請求數(shù)/總請求數(shù)。選擇何種可靠性級別主要依賴于用戶風險承受能力,在創(chuàng)新和可靠性之間找到恰當?shù)钠胶狻?/p>

sysom,大數(shù)據(jù),阿里云,云計算

度量建模首先需要對指標進行標準化,比如聚合間隔、聚合區(qū)域、測量頻率、包括哪些請求、如何獲取數(shù)據(jù)以及數(shù)據(jù)訪問延遲。進行度量選擇時,應關注用戶關心的內容,而不是能夠衡量的內容。關注標準化指標時,需關注SLI分布而不是平均值。

sysom,大數(shù)據(jù),阿里云,云計算

以上圖為例,紫色區(qū)域整體較為穩(wěn)定,狀態(tài)較好;而藍色區(qū)域毛刺突出,意味著系統(tǒng)在某一個時間點資源占用出現(xiàn)問題。

sysom,大數(shù)據(jù),阿里云,云計算

在事件處理中,需要在事件發(fā)生前做異常演練、趨勢分析、告警等,在事件發(fā)生后及時呼叫相關工程師做根因分析,現(xiàn)場補救,進行錯誤修復。然后將補救經(jīng)驗沉淀到知識庫,后續(xù)用于自動化修復。

sysom,大數(shù)據(jù),阿里云,云計算

不同業(yè)務會有不一樣的監(jiān)控指標,不同的商業(yè)目標也會有不同的SLO。

sysom,大數(shù)據(jù),阿里云,云計算

上圖展示了操作系統(tǒng)的可觀測維度。

sysom,大數(shù)據(jù),阿里云,云計算

這里我們列了一個矩陣,Y軸是可靠性通用度量方法,X軸是系統(tǒng)的可觀維度,通過X和Y軸的組合,可以生成操作系統(tǒng)的SLI度量項。

sysom,大數(shù)據(jù),阿里云,云計算

對于SRE而言,監(jiān)控也十分重要。監(jiān)控可以分析長期趨勢,比如查看每日活動用戶數(shù)據(jù)量、增加或減少、數(shù)據(jù)庫使用了多大的磁盤、何時需要做擴容;也可以用來比較不同時間或實驗組,比如不同組件查詢速度比較、內存命中率比較、網(wǎng)站運行速度比較等。

監(jiān)控可以大幅提升運維效率,不再需要運維人員、用戶手動登錄檢查系統(tǒng)狀態(tài)。另外,它也可以用于臨時性的回顧分析,查看某個時間點具體發(fā)生了什么、哪些指標出現(xiàn)了異常。

sysom,大數(shù)據(jù),阿里云,云計算

監(jiān)控的基本原則是癥狀與原因,監(jiān)控系統(tǒng)應該解決兩個問題:什么壞了?為什么?

監(jiān)控具有四個黃金信號,分別為延遲、流量、錯誤,飽和度。監(jiān)控的工作內容應盡量簡單,最常捕獲真實事件的規(guī)則應盡可能簡單、可預測和可靠,很少使用的數(shù)據(jù)收集、聚合和警報配置應被移除,已收集但未在任何儀表板中公開或被任何警報使用的信號應刪除,方能達到高效分析問題的目的。

sysom,大數(shù)據(jù),阿里云,云計算

系統(tǒng)自動化能夠解決一致性、一個平臺、更快的維修與行動以及計劃的問題,后續(xù),我們也期待能夠通過AI OPS實現(xiàn)智能識別、智能介入以及智能修復。

sysom,大數(shù)據(jù),阿里云,云計算

sysOM致力于打造一個集主機管理、配置部署、監(jiān)控報警、異常診斷、安全審計等一系列功能的自動化運維平臺。目前我們對資源管理做了納管、監(jiān)控,對配置管理做了安全、包管理、自動化,對權限管理做了權限細分、審計攔截,也實現(xiàn)了主動診斷。

sysom,大數(shù)據(jù),阿里云,云計算

上圖為SYSOM的主機管理圖,可以做主機的批量導入、導出、刪除,也可以根據(jù)集群做分門別類的梳理,支持在線終端,為運維人員帶來了極大的方便,無需額外安裝專門的客戶端軟件,只需一臺電腦,登錄SYSOM服務即可直接訪問外部終端,達到運維目的。

sysom,大數(shù)據(jù),阿里云,云計算

上圖為SYSOM 診斷中心,負責檢查調度、內存、IO網(wǎng)絡、補丁 CPU 等,并針對問題進行告警。

sysom,大數(shù)據(jù),阿里云,云計算

sysom,大數(shù)據(jù),阿里云,云計算

上圖為網(wǎng)絡診斷圖。

二、系統(tǒng)安全性

sysom,大數(shù)據(jù),阿里云,云計算

系統(tǒng)安全性包括靜態(tài)應用程序安全檢查、動態(tài)應用程序安全檢查以及軟件生命周期保護。靜態(tài)應用程序安全檢查一般為在開發(fā)階段做源碼掃描勘測,判斷哪些編碼可能會出現(xiàn)漏洞;動態(tài)應用程序一般對正在運行的二進制開啟端口滲透,查看是否存在漏洞。

sysom,大數(shù)據(jù),阿里云,云計算

軟件生命周期維護分為三個部分:

  • 基線:包含軟件版本和配置文件。告知用戶安全的軟件版本和配置文件,即使出現(xiàn)高危漏洞也不會產生太大影響。
  • 漏洞庫:存儲軟件出現(xiàn)的漏洞以及出現(xiàn)漏洞的版本。
  • 修復:對軟件包進行升級或補丁。

sysom,大數(shù)據(jù),阿里云,云計算

上圖為SYSOM 安全中心,能夠直觀地為用戶展示需要修復的漏洞數(shù)量、高危漏洞數(shù)量、修復漏洞影響的主機數(shù)量、今天修復的數(shù)量、累計修復的數(shù)量等。安全中心既能支持多個漏洞批量修復,也支持多個主機漏洞批量修復,可以一次性將所有主機的所有漏洞進行修復。

sysom,大數(shù)據(jù),阿里云,云計算

不同漏洞數(shù)據(jù)庫包含的漏洞數(shù)據(jù)可能有缺失,SYSOM安全中心支持第三方數(shù)據(jù)庫接入,只需配置名稱、連接地址、請求方式等,即可將第三方漏洞數(shù)庫數(shù)據(jù)導入到 SYSOM 安全中心,進行系統(tǒng)掃描。

sysom,大數(shù)據(jù),阿里云,云計算

上圖為安全掃描結果展示。

三、展望與挑戰(zhàn)

sysom,大數(shù)據(jù),阿里云,云計算

當前,系統(tǒng)穩(wěn)定性存在若干痛點。

首先,事件現(xiàn)場的保留。故障事件發(fā)生之后,現(xiàn)場難以保留,分析時需要花費較大代價。因此,保留事件現(xiàn)場尤為重要。

其次,底躁問題。監(jiān)控時,監(jiān)控指標會對系統(tǒng)帶來一些負載,做巡檢和指標計算也會對系統(tǒng)帶來負載,我們期望以盡可能低的底噪來達到更全面的監(jiān)控,也是將來需要解決的問題。

最后,修復依據(jù)。做安全基線配置或問題修復時,大多依靠專家經(jīng)驗和廠商經(jīng)驗。但是每個廠商或每個專家各有自己的觀點,我們需要將其形成一套標準化規(guī)范。

原文鏈接

本文為阿里云原創(chuàng)內容,未經(jīng)允許不得轉載。文章來源地址http://www.zghlxwxcb.cn/news/detail-797222.html

到了這里,關于統(tǒng)信軟件高級系統(tǒng)研發(fā)工程師:sysOM 在系統(tǒng)可靠性與安全上實踐的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉載,請注明出處: 如若內容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • 研發(fā)工程師玩轉Kubernetes——hostPath

    研發(fā)工程師玩轉Kubernetes——hostPath

    有別于《研發(fā)工程師玩轉Kubernetes——使用emptyDir在同一Pod不同容器間共享數(shù)據(jù)》一文中介紹的emptyDir,hostPath可以在 同一個Node的不同Pod間共享 卷。 下面的清單文件利用了Pod親和性,讓Pod集中到一個Node上。 我們觀察創(chuàng)建的兩個Pod中文件的內容 hostpath-deployment-65cddc7df8-9qtlv wri

    2024年02月14日
    瀏覽(27)
  • 研發(fā)工程師玩轉Kubernetes——定時任務

    研發(fā)工程師玩轉Kubernetes——定時任務

    定時任務是指可以制定周期的任務,比如每周二0點1分執(zhí)行一次。在《研發(fā)工程師玩轉Kubernetes——非定時任務》中,我們介紹了單次執(zhí)行的任務?,F(xiàn)在我們只要對其清單稍作修改,就可以實現(xiàn)定時任務。 和單次任務清單相比,主要的修改點是:新增了spec.schedule字段。它用于

    2024年02月07日
    瀏覽(27)
  • 一些研發(fā)工程師在Springboot注意點

    一些研發(fā)工程師在Springboot注意點

    1. 正確設計代碼目錄結構 雖然您有很大的自由度,但有一些基本規(guī)則值得遵循來設計您的源代碼結構。 避免使用默認包。確保所有內容(包括入口點)都在命名良好的包中,這樣您就可以避免與組裝和組件掃描相關的意外情況; 將 Application.java(應用程序的入口類)放在頂

    2024年02月08日
    瀏覽(22)
  • 研發(fā)工程師玩轉Kubernetes——emptyDir

    研發(fā)工程師玩轉Kubernetes——emptyDir

    kubernets可以通過emptyDir實現(xiàn)在 同一Pod的不同容器間 共享文件系統(tǒng)。 正如它的名字,當Pod被創(chuàng)建時,emptyDir卷會被創(chuàng)建,這個時候它是一個空的文件夾;當Pod被刪除時,emptyDir卷也會被 永久 刪除。 我們使用上面這段腳本,會檢測/tempdir/lockfile文件是否存在。如果不存在則創(chuàng)建

    2024年02月14日
    瀏覽(18)
  • 研發(fā)工程師玩轉Kubernetes——自動擴縮容

    研發(fā)工程師玩轉Kubernetes——自動擴縮容

    在《研發(fā)工程師玩轉Kubernetes——使用Deployment進行多副本維護》一文中,我們通過Deployment實現(xiàn)了多副本維護——即維持在一個確定數(shù)量的副本個數(shù)。而在現(xiàn)實場景中,我們往往需要根據(jù)服務的壓力,采用水平(橫向)擴容的方式——即增加多個副本,來分擔壓力。當服務壓力

    2024年02月06日
    瀏覽(18)
  • 技術精英求職必備:大數(shù)據(jù)研發(fā)工程師簡歷模板

    原則 撰寫針對大數(shù)據(jù)研發(fā)工程師職位的簡歷時,關鍵在于準確展現(xiàn)您在 大數(shù)據(jù)處理、分析和應用開發(fā)方面的綜合技能、項目經(jīng)驗和技術成就 。簡歷應作為您展示跨多個技術棧的 編程能力、構建完整大數(shù)據(jù)解決方案和有效解決大數(shù)據(jù)技術問題 的能力的窗口。確保每一項經(jīng)歷

    2024年02月21日
    瀏覽(26)
  • 研發(fā)工程師玩轉Kubernetes——啟動、存活和就緒探針

    研發(fā)工程師玩轉Kubernetes——啟動、存活和就緒探針

    啟動(Startup Probe)、存活(Liveness Probe)和就緒探針(Readiness Probe)有其不同的用途和優(yōu)先級。 啟動探針(Startup Probe)用于Pod內程序告訴kubernetes,其準備工作已經(jīng)做好。這些準備工作主要是指業(yè)務運行前的前置條件,比如資源文件下載完畢,內置數(shù)據(jù)庫文件下載完畢等。這步

    2024年02月13日
    瀏覽(27)
  • 技術精英求職必備:AIGC(圖像生成)研發(fā)工程師簡歷指南

    核心原則 撰寫針對AIGC(圖像生成)研發(fā)工程師職位的簡歷時,關鍵在于準確展現(xiàn)您在深度學習、計算機視覺和圖像生成算法方面的綜合技能、項目經(jīng)驗和技術成就。簡歷應作為您展示跨多個技術棧的編程能力、構建完整的圖像生成解決方案和有效解決AIGC技術問題的能力的窗口

    2024年03月25日
    瀏覽(28)
  • 《研發(fā)效能(DevOps)工程師》課程簡介(二)丨IDCF

    《研發(fā)效能(DevOps)工程師》課程簡介(二)丨IDCF

    為貫徹落實《關于深化人才發(fā)展體制機制改革的意見》,推動實施人才強國戰(zhàn)略,促進專業(yè)技術人員提升職業(yè)素養(yǎng)、補充新知識新技能,實現(xiàn)人力資源深度開發(fā),推動經(jīng)濟社會全面發(fā)展,根據(jù)《中華人民共和國勞動法》有關規(guī)定,工業(yè)和信息化部教育與考試中心聯(lián)合有關部門

    2024年02月07日
    瀏覽(22)
  • 博冠光電8K事業(yè)部招聘研發(fā)工程師及產品經(jīng)理

    一、高級結構工程師 工作職責:1、負責公司產品的機械結構設計、模具開發(fā)和量產導入;2、負責機械結構方向的技術預研,包括技術專題研究,技術難題攻關;?3、負責結構組的技術管理工作,包括帶新人,材料選型,設計審核;4、領導安排的其他工作。任職要求:1.、本

    2024年02月12日
    瀏覽(28)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包