?構(gòu)建雙態(tài)IT系統(tǒng),AIOps已經(jīng)是必然的選擇。運(yùn)維數(shù)字化轉(zhuǎn)型已是大勢(shì)所趨,實(shí)體業(yè)務(wù)的逐步線上化對(duì)IT系統(tǒng)的穩(wěn)定與安全提出更高要求,同時(shí)隨著雙態(tài)IT等復(fù)雜系統(tǒng)的建立,如何平衡IT運(yùn)維效率與成本成為區(qū)域性銀行面臨的重要問(wèn)題,智能運(yùn)維AIOps成為主要解決方案。
智能運(yùn)維AIOps,根據(jù)Gartner的最新定義,指基于大數(shù)據(jù)、機(jī)器學(xué)習(xí)等能力提取和分析IT數(shù)據(jù),為IT運(yùn)維管理產(chǎn)品提供支撐。目前AIOps在銀行業(yè)的主要落地場(chǎng)景有精準(zhǔn)告警、異常檢測(cè)、根因定位和容量分析等場(chǎng)景,明顯優(yōu)化運(yùn)維成本且提高運(yùn)維效率;同時(shí),基于數(shù)據(jù)的深度分析優(yōu)化運(yùn)維質(zhì)量,值得說(shuō)明的是,為最大程度發(fā)揮IT數(shù)據(jù)的價(jià)值,基于統(tǒng)一平臺(tái)整合多維數(shù)據(jù),以全局運(yùn)營(yíng)視角解讀IT運(yùn)維,將是未來(lái)趨勢(shì)。
一、案例背景
某國(guó)有銀行(E銀行)是五大國(guó)有銀行之一。近年來(lái),E銀行將數(shù)字化轉(zhuǎn)型上升至集團(tuán)戰(zhàn)略層面,充分發(fā)揮金融科技特色優(yōu)勢(shì),持續(xù)加大金融科技資金投入強(qiáng)度,在財(cái)富管理、數(shù)字化發(fā)展、綠色金融等各業(yè)務(wù)層面都取得了積極成效。
-
多重問(wèn)題并存,銀行傳統(tǒng)運(yùn)維系統(tǒng)急需轉(zhuǎn)型升級(jí)
隨著E銀行數(shù)字化轉(zhuǎn)型進(jìn)程的不斷推進(jìn),銀行業(yè)務(wù)系統(tǒng)和基礎(chǔ)架構(gòu)愈發(fā)復(fù)雜,運(yùn)維數(shù)據(jù)日益增長(zhǎng),運(yùn)維能力越來(lái)越成為E銀行數(shù)字化轉(zhuǎn)型的重要關(guān)注點(diǎn)。業(yè)務(wù)量的不斷增長(zhǎng),為傳統(tǒng)IT運(yùn)維帶來(lái)了以下幾個(gè)方面的問(wèn)題:
第一,數(shù)據(jù)治理難。隨著數(shù)字化的演進(jìn)和全行改革的深入,E銀行業(yè)務(wù)量增多,數(shù)據(jù)規(guī)模急劇擴(kuò)大,且數(shù)據(jù)種類與數(shù)據(jù)結(jié)構(gòu)愈發(fā)復(fù)雜多樣,由于數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,因此數(shù)據(jù)質(zhì)量較低;且E銀行數(shù)據(jù)分散在各應(yīng)用處、集中度不高,數(shù)據(jù)之間存在孤島現(xiàn)象,數(shù)據(jù)可復(fù)用能力欠缺。
第二,發(fā)現(xiàn)問(wèn)題難。E銀行在過(guò)去便建立了運(yùn)維系統(tǒng),但隨著該系統(tǒng)在業(yè)務(wù)中的不斷實(shí)踐,出現(xiàn)了不少問(wèn)題。首先,監(jiān)控不全面,缺乏對(duì)整體業(yè)務(wù)運(yùn)行狀態(tài)的監(jiān)控;其次,原有運(yùn)維監(jiān)控系統(tǒng)采用固定閾值告警,誤報(bào)漏報(bào)率高;另外,原有運(yùn)維系統(tǒng)發(fā)現(xiàn)問(wèn)題較為被動(dòng),缺乏趨勢(shì)預(yù)測(cè)能力,無(wú)法在用戶受影響之前及時(shí)識(shí)別問(wèn)題,嚴(yán)重依賴運(yùn)維人員經(jīng)驗(yàn),導(dǎo)致運(yùn)維成本高、運(yùn)維效率低。
第三,根因定位難。E銀行原有運(yùn)維系統(tǒng)和工具基本為事后統(tǒng)計(jì)分析,缺乏實(shí)時(shí)分析能力,缺乏以業(yè)務(wù)指標(biāo)驅(qū)動(dòng)的根因分析能力、場(chǎng)景化的相關(guān)性分析能力和告警、指標(biāo)、日志等多維數(shù)據(jù)的交叉分析能力,對(duì)運(yùn)維排障能力的提升作用很有限,導(dǎo)致運(yùn)維故障處理能力較低。
第四,運(yùn)營(yíng)分析難。E銀行傳統(tǒng)運(yùn)維系統(tǒng)主要依賴人工經(jīng)驗(yàn)、通過(guò)報(bào)表來(lái)分析數(shù)據(jù),缺乏智能化的手段進(jìn)行動(dòng)態(tài)數(shù)據(jù)分析;過(guò)去的運(yùn)維數(shù)據(jù)分析主要從運(yùn)維角度而從非業(yè)務(wù)視角出發(fā),導(dǎo)致對(duì)數(shù)據(jù)的分析較為片面、落地性不強(qiáng),數(shù)據(jù)價(jià)值挖掘不充分,無(wú)法為綜合運(yùn)營(yíng)提供保障支撐。
除此,E銀行還有一些定制化的需求。E銀行部署了云平臺(tái),不同于傳統(tǒng)技術(shù)架構(gòu),云平臺(tái)對(duì)運(yùn)維側(cè)提出了更多需求,如與態(tài)勢(shì)感知可視化工具進(jìn)行深度結(jié)合,以識(shí)別并解決云上安全風(fēng)險(xiǎn);另外,E銀行對(duì)于內(nèi)部安全能力也有要求,隨著業(yè)務(wù)量的增加,內(nèi)部違規(guī)操作的幾率增加,E銀行對(duì)內(nèi)部人員違規(guī)操作的檢測(cè)排查提出了新需求,對(duì)安全數(shù)據(jù)的整合能力成為了E銀行重要的關(guān)注方向。
綜上,借助一定的手段和方式,對(duì)客戶的IT運(yùn)維數(shù)據(jù)實(shí)現(xiàn)全量的集中化管理,實(shí)現(xiàn)數(shù)據(jù)實(shí)時(shí)處理、智能分析和預(yù)測(cè),進(jìn)行多維度高效根因定位,實(shí)現(xiàn)運(yùn)維側(cè)的全面升級(jí),成為E銀行數(shù)字化轉(zhuǎn)型的重要訴求?;诖耍珽銀行選擇與擎創(chuàng)科技進(jìn)行合作,就智能運(yùn)維AIOps展開深度探索。
擎創(chuàng)科技2016年成立于上海,是國(guó)內(nèi)首家智能運(yùn)維AIOps落地解決方案的供應(yīng)商。擎創(chuàng)科技專注于以AI賦能運(yùn)維管理,激活運(yùn)維數(shù)據(jù)智慧,助力客戶數(shù)字化轉(zhuǎn)型。目前其客戶群已覆蓋銀行、保險(xiǎn)、證券、制造、能源及交通運(yùn)輸?shù)榷鄠€(gè)行業(yè)。
擎創(chuàng)科技基于自身強(qiáng)大的大數(shù)據(jù)能力、流批一體處理能力和AI算法能力,從數(shù)據(jù)治理層(包括數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)存儲(chǔ))、運(yùn)維應(yīng)用層以及運(yùn)營(yíng)決策層多個(gè)層級(jí),為E銀行提供了智能運(yùn)維夏洛克AIOps全面解決方案。
二、具體實(shí)施策略
1、構(gòu)建數(shù)字運(yùn)維中臺(tái),全面提升銀行數(shù)據(jù)治理能力
數(shù)據(jù)是場(chǎng)景建設(shè)的基礎(chǔ)。因此在數(shù)據(jù)治理方面,擎創(chuàng)為E銀行構(gòu)建了集成數(shù)據(jù)采集、數(shù)據(jù)處理和數(shù)據(jù)存儲(chǔ)多種功能的數(shù)字運(yùn)維中臺(tái)。
首先是多源數(shù)據(jù)采集。夏洛克AIOps具備數(shù)據(jù)湖、APIs、客戶數(shù)據(jù)等多種數(shù)據(jù)源的數(shù)據(jù)集中采集能力,覆蓋指標(biāo)、事件、日志等多種運(yùn)維數(shù)據(jù)。無(wú)論是來(lái)自于工單系統(tǒng)、監(jiān)控系統(tǒng)還是日志平臺(tái),均可作為可配置的數(shù)據(jù)源融入平臺(tái)。此外,數(shù)據(jù)采集會(huì)對(duì)接不同體系如容器云、K8s等。
其次,數(shù)據(jù)采集完成后,需要進(jìn)行數(shù)據(jù)處理。在兩大技術(shù)棧Flink和Spark的基礎(chǔ)上做了抽象,使二者合為一體并形成數(shù)字運(yùn)維中臺(tái),使得平臺(tái)跨越了流批處理的專門開發(fā)。與此同時(shí),利用可視化工具,實(shí)現(xiàn)數(shù)據(jù)標(biāo)簽化、體系化、規(guī)范化,使得數(shù)據(jù)可通過(guò)拖拉拽實(shí)現(xiàn)基本處理與一體化查詢分析。
第三、提升運(yùn)維數(shù)據(jù)儲(chǔ)存能力。數(shù)據(jù)處理完畢后,需對(duì)經(jīng)過(guò)處理的數(shù)據(jù)進(jìn)行數(shù)據(jù)存儲(chǔ)。擎創(chuàng)科技為E銀行的運(yùn)維數(shù)據(jù)存儲(chǔ)提供了相應(yīng)的技術(shù)棧和配套軟件,同時(shí)也運(yùn)用大數(shù)據(jù)工具,幫助E銀行提升運(yùn)維數(shù)據(jù)存儲(chǔ)能力。
綜合而言,擎創(chuàng)科技幫E銀行構(gòu)建的數(shù)字運(yùn)維中臺(tái),為智能運(yùn)維場(chǎng)景的建設(shè)提供了大數(shù)據(jù)處理、流批一體處理和AI算法平臺(tái)三方面服務(wù),奠定了E銀行智能運(yùn)維場(chǎng)景建設(shè)的基礎(chǔ),同時(shí)也持續(xù)提升了其運(yùn)維數(shù)據(jù)的質(zhì)量和治理水平,解決了E銀行數(shù)據(jù)治理難的問(wèn)題。
2、多樣化智能運(yùn)維場(chǎng)景,助力問(wèn)題發(fā)現(xiàn)與根因定位
在數(shù)字運(yùn)維中臺(tái)的基礎(chǔ)上,夏洛克的運(yùn)維應(yīng)用層結(jié)合數(shù)十種算法,幫助E銀行靈活構(gòu)建了多樣化的智能運(yùn)維場(chǎng)景,產(chǎn)出其需要的分析結(jié)果。
智能運(yùn)維場(chǎng)景包括告警自動(dòng)抑制、故障場(chǎng)景發(fā)掘、指標(biāo)異常檢測(cè)、日志異常檢測(cè)、綜合根因定位、業(yè)務(wù)多維分析、容量分析預(yù)測(cè)等,主要抽象為四大產(chǎn)品應(yīng)用——告警辨析中心、指標(biāo)解析中心、日志精析中心和日智速析專家。
告警辨析中心以機(jī)器學(xué)習(xí)算法為驅(qū)動(dòng),對(duì)海量的告警事件進(jìn)行降噪和關(guān)聯(lián)分析,輔助E銀行實(shí)現(xiàn)問(wèn)題預(yù)測(cè)發(fā)現(xiàn)以及根因定位。
?指標(biāo)解析中心基于交易異常、指標(biāo)關(guān)聯(lián)、拓?fù)浼?、根因推薦能力,幫E銀行迅速發(fā)現(xiàn)及預(yù)測(cè)指標(biāo)的異常波動(dòng),并且判定指標(biāo)間的關(guān)聯(lián)關(guān)系,輔助根因定位。
日志精析中心具備多樣化開箱即用模板及智能分析能力,協(xié)助E銀行全面分析數(shù)字化業(yè)務(wù)整體狀況,提升了其故障根因定位、日志審計(jì)、異常檢測(cè)等運(yùn)維能力。
日智速析專家則實(shí)現(xiàn)了將海量日志聚類到肉眼可讀的數(shù)量,智能識(shí)別日志發(fā)生規(guī)律,分析日志異常并智能告警,從而助力E銀行無(wú)需了解日志結(jié)構(gòu)即可發(fā)現(xiàn)問(wèn)題、定位根因。通過(guò)四大應(yīng)用的構(gòu)建,E銀行可快速發(fā)現(xiàn)異常并定位根因,從而提升運(yùn)營(yíng)效率。
未來(lái),在智能運(yùn)維的基礎(chǔ)上,擎創(chuàng)科技還將輔助E銀行實(shí)現(xiàn)了從智能運(yùn)維到智能運(yùn)營(yíng)的躍升。擎創(chuàng)科技以全局運(yùn)營(yíng)視角解讀IT運(yùn)維,在打通E銀行全域數(shù)據(jù)的基礎(chǔ)上,幫其個(gè)性化定制專屬運(yùn)營(yíng)決策中心,精準(zhǔn)、實(shí)時(shí)、動(dòng)態(tài)地展現(xiàn)系統(tǒng)運(yùn)行狀況,并通過(guò)對(duì)數(shù)據(jù)價(jià)值的提煉分析,有效支撐運(yùn)營(yíng)決策,彰顯運(yùn)維對(duì)業(yè)務(wù)的影響力。
3、夏洛克AIOps綜合解決方案,助力銀行實(shí)現(xiàn)高效運(yùn)維
通過(guò)夏洛克AIOps綜合解決方案的實(shí)施,擎創(chuàng)科技幫助E銀行解決了多種問(wèn)題,實(shí)現(xiàn)了高效智能運(yùn)維:
第一,提升了數(shù)據(jù)質(zhì)量和數(shù)據(jù)治理能力。通過(guò)采用數(shù)字運(yùn)維中臺(tái)進(jìn)行數(shù)據(jù)治理和運(yùn)維數(shù)據(jù)集中化管理,打破了數(shù)據(jù)壁壘,極大地提升了數(shù)據(jù)標(biāo)準(zhǔn)化程度,提升了數(shù)據(jù)質(zhì)量,為后續(xù)數(shù)據(jù)分析運(yùn)用提供了保障支撐。
第二,提升了問(wèn)題發(fā)現(xiàn)的能力。E銀行通過(guò)部署夏洛克AIOps智能運(yùn)維平臺(tái),基于四大智能運(yùn)維應(yīng)用,降低了誤報(bào)率,減少了一線人員的工作量,且極大提升了提前發(fā)現(xiàn)異常和容量預(yù)警的速度。
第三,實(shí)現(xiàn)高效的根因定位。E銀行利用交易類指標(biāo)異常檢測(cè)以及與多種基礎(chǔ)架構(gòu)指標(biāo)異常做相關(guān)性分析,結(jié)合拓?fù)湎嚓P(guān)性以及日志異常模式排查,實(shí)現(xiàn)了分鐘級(jí)別定位故障源的高效綜合排障。
第四,提升了運(yùn)營(yíng)分析能力。通過(guò)智能運(yùn)維建設(shè),E銀行實(shí)現(xiàn)了對(duì)告警、日志和各項(xiàng)指標(biāo)的全方位管理和智能化分析,運(yùn)營(yíng)風(fēng)險(xiǎn)降低約70%,運(yùn)營(yíng)效率提升約6倍,數(shù)據(jù)中心整體SLA(服務(wù)水平)得到了極大提升。
?擎創(chuàng)科技,Gartner連續(xù)推薦的AIOps領(lǐng)域標(biāo)桿供應(yīng)商。公司致力于協(xié)助企業(yè)客戶提升對(duì)運(yùn)維數(shù)據(jù)的洞見(jiàn)能力,優(yōu)化運(yùn)維效率,充分體現(xiàn)科技運(yùn)維對(duì)業(yè)務(wù)運(yùn)營(yíng)的影響力。
行業(yè)龍頭客戶的共同選擇
?了解更多運(yùn)維干貨與技術(shù)分享
可以右上角一鍵關(guān)注
我們是深耕智能運(yùn)維領(lǐng)域近十年的
連續(xù)多年獲Gartner推薦的AIOps標(biāo)桿供應(yīng)商文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-770699.html
下期我們不見(jiàn)不散文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-770699.html
到了這里,關(guān)于案例分享 | 金融業(yè)智能運(yùn)維AIOps怎么做?看這一篇就夠了的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!