国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

「從ES到CK 01」Elasticsearch vs Clickhouse

這篇具有很好參考價值的文章主要介紹了「從ES到CK 01」Elasticsearch vs Clickhouse。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報違法"按鈕提交疑問。

導(dǎo)航

????????在完成將公司日志數(shù)據(jù)從Elasticsearch(下稱ES)轉(zhuǎn)戰(zhàn)到Clickhouse后,個人認(rèn)為有必要將過程記錄分享。限于篇幅及便于分類組織,我會以一個系列文章的形式記錄:

  • 01 《Elasticsearch vs Clickhouse》
  • 02 《Clickhouse的基礎(chǔ)知識掃盲》
  • 03 《?Clickhouse多分片多副本集群部署?》
  • 04 《??Clickhouse表引擎選擇和表結(jié)構(gòu)設(shè)計?》
  • 05 《?clickhouse高效數(shù)據(jù)處理工具vector?》
  • 06 《?????????clickhouse的數(shù)據(jù)可視化工具clickvisual?》
  • 07?《kibana自定義插件跳轉(zhuǎn)clickvisual》
  • 08 《妙用clickvisual api實(shí)現(xiàn)用戶自動管理》(敬請期待)

一、常見的日志解決方案ELK

????????跟大部分企業(yè)一樣,在日志解決方案選型時,優(yōu)先選擇了業(yè)界成熟方案elk + kafka + beats;顧名思義,該方案是使用ES進(jìn)行數(shù)據(jù)存儲的。

二、現(xiàn)狀與挑戰(zhàn)

????????ES 是一種基于 Lucene 的分布式全文搜索引擎,我司用ES存儲日志,目前服務(wù)器規(guī)模 20+,總?cè)萘?TB SSD+15TB HDD,日均日志接入量大約 2TB;數(shù)據(jù)按日期生成ES索引,按照既定的索引生命周期策略(iLM)進(jìn)行冷熱數(shù)據(jù)存放。

「從ES到CK 01」Elasticsearch vs Clickhouse,日志解決方案,elasticsearch,clickhouse

隨著日志量的增加,ES集群的一些問題逐漸暴露:

  1. 資源成本問題:ES集群使用20+臺規(guī)格為16c32g的服務(wù)器,總?cè)萘?TB SSD+20TB HDD。作為一個非利潤部門的工具平臺,占用的資源過多;
  2. 數(shù)據(jù)安全問題:出于資源成本考慮,沒有開啟數(shù)據(jù)副本功能(一旦開啟,資源成本會成倍增加,且副本寫入不是異步的,會影響數(shù)據(jù)寫入速率),如此一來,存在數(shù)據(jù)丟失風(fēng)險;
  3. 性能問題(查詢超時或慢):因數(shù)據(jù)按日期生成ES索引且冷熱分離,當(dāng)用戶查詢冷數(shù)據(jù)或跨天查詢數(shù)據(jù)時,經(jīng)常會出現(xiàn)查詢超時;
  4. 性能問題(寫入延遲):因數(shù)據(jù)進(jìn)行冷熱分離,每天需將數(shù)據(jù)從熱節(jié)點(diǎn)(SSD)遷移到冷節(jié)點(diǎn)(HDD),遷移過程中會占用大量的資源(譬如帶寬、磁盤IO、ES隊(duì)列等),期間會導(dǎo)致寫入延遲。

站在運(yùn)維人員的角度,資源成本和運(yùn)維成本的增加,無疑壓力是越來越大,亟需尋找優(yōu)化方案

三、為什么選擇Clickhouse

????????ClickHouse 是一款高性能列式分布式數(shù)據(jù)庫管理系統(tǒng),我們對 ClickHouse 進(jìn)行了大量的資料搜集,發(fā)現(xiàn)有下列優(yōu)勢:

  • ClickHouse 寫入吞吐量大

????????單服務(wù)器日志寫入量在 50MB 到 200MB/s,每秒寫入超過 60w 記錄數(shù),是 ES 的 5 倍以上。在 ES 中比較常見的寫 Rejected 導(dǎo)致數(shù)據(jù)丟失、寫入延遲等問題,在 ClickHouse 中不容易發(fā)生。

  • 查詢速度快

????????官方宣稱數(shù)據(jù)在 pagecache 中,單服務(wù)器查詢速率大約在 2-30GB/s;沒在 pagecache 的情況下,查詢速度取決于磁盤的讀取速率和數(shù)據(jù)的壓縮率。經(jīng)測試 ClickHouse 的查詢速度比 ES 快 5-30 倍以上。

  • 查詢語法門檻低

????????ClickHouse的SQL語法與標(biāo)準(zhǔn)SQL語法基本相同,相對于ES的Lucene語法,學(xué)習(xí)門檻要更低,且在復(fù)雜的查詢條件下表現(xiàn)更好

  • ClickHouse 比 ES 服務(wù)器成本更低

????????一方面 ClickHouse 的數(shù)據(jù)壓縮比比 ES 高,相同數(shù)據(jù)占用的磁盤空間只有 ES 的 1/3 到 1/30,節(jié)省了磁盤空間的同時,也能有效的減少磁盤 IO,這也是ClickHouse查詢效率更高的原因之一。

Elasticsearch

Clickhouse

說明

版本

7.4.2

22.7.4

分布式支持

擴(kuò)展性

增加節(jié)點(diǎn)后ES會自動均衡數(shù)據(jù),CK需手工均衡數(shù)據(jù)

寫入速度

數(shù)據(jù)壓縮率

精確匹配查詢

一般

模糊匹配查詢

一般

權(quán)限管理

支持

支持

查詢難度

CK支持通用SQL語法

可視化支持

維護(hù)難度

一般

一般

????????在了解Clickhouse的特點(diǎn)后,結(jié)合我司實(shí)際情況,決定使用Clickhouse代替ES存儲日志數(shù)據(jù)。期間以Clickhouse為存儲的新日志系統(tǒng)與ELK并行,數(shù)據(jù)同時寫入ES和Clickhouse;同時在kibana添加入口以查詢Clickhouse上的日志數(shù)據(jù),以逐漸過渡到新日志系統(tǒng)。

下回預(yù)告

????????Clickhouse的基礎(chǔ)知識掃盲,歡迎關(guān)注后續(xù)更新的系列文章~文章來源地址http://www.zghlxwxcb.cn/news/detail-766933.html

到了這里,關(guān)于「從ES到CK 01」Elasticsearch vs Clickhouse的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 埋點(diǎn)日志解決方案——Golang+Gin+Sarama VS Java+SpringCloudGateway+ReactorKafka

    之前我就寫過幾篇OpenResty+lua-kafka-client將埋點(diǎn)數(shù)據(jù)寫入Kafka的文章,如下: Lua將Nginx請求數(shù)據(jù)寫入Kafka——埋點(diǎn)日志解決方案 python定時任務(wù)執(zhí)行shell腳本切割Nginx日志-慎用 nginx+lua寫入kafka報buffered messages send to kafka err: not found broker 關(guān)于OpenResty+doujiang24/lua-resty-kafka寫入kafka故障轉(zhuǎn)

    2024年02月08日
    瀏覽(16)
  • Elasticsearch系列組件:Beats高效的日志收集和傳輸解決方案

    Elasticsearch系列組件:Beats高效的日志收集和傳輸解決方案

    Elasticsearch 是一個開源的、基于 Lucene 的分布式搜索和分析引擎,設(shè)計用于云計算環(huán)境中,能夠?qū)崿F(xiàn)實(shí)時的、可擴(kuò)展的搜索、分析和探索全文和結(jié)構(gòu)化數(shù)據(jù)。它具有高度的可擴(kuò)展性,可以在短時間內(nèi)搜索和分析大量數(shù)據(jù)。 Elasticsearch 不僅僅是一個全文搜索引擎,它還提供了分布

    2024年02月08日
    瀏覽(20)
  • filebeat+kafka+logstash+elasticsearch+kibana實(shí)現(xiàn)日志收集解決方案

    filebeat+kafka+logstash+elasticsearch+kibana實(shí)現(xiàn)日志收集解決方案

    前言:我們使用nginx來模擬產(chǎn)生日志的服務(wù),通過filebeat收集,交給kafka進(jìn)行消息隊(duì)列,再用logstash消費(fèi)kafka集群中的數(shù)據(jù),交給elasticsearch+kibana監(jiān)控 服務(wù)器環(huán)境: 192.168.2.1:elasticsearch 192.168.2.2:filebeat+nginx 192.168.2.3:kafka 192.168.2.4:logstash elasticseatch+filebeat+kafka+logsstash(6.60)清

    2024年02月03日
    瀏覽(31)
  • ClickHouse/Doris vs Elasticsearch誰更勝一籌?

    ClickHouse/Doris vs Elasticsearch誰更勝一籌?

    我之前在ClickHouse vs Doris 讀寫性能比較?一文中,初步做了一下ClickHouse和Doris的讀寫性能比較,但由于數(shù)據(jù)樣本比較小,且未發(fā)揮出所有硬件資源的性能,因此進(jìn)行了第二輪壓測。 本輪壓測與上一輪的區(qū)別在于: 新加入了Elasticsearch搜索引擎 ClickHouse和Doris均采用多并發(fā)寫入,發(fā)

    2024年01月22日
    瀏覽(31)
  • python連接clickhouse (CK)

    python連接clickhouse (CK)

    2024年02月06日
    瀏覽(21)
  • 【數(shù)據(jù)庫學(xué)習(xí)】ClickHouse(ck)

    【數(shù)據(jù)庫學(xué)習(xí)】ClickHouse(ck)

    是一個用于聯(lián)機(jī)分析(OLAP)的列式數(shù)據(jù)庫管理系統(tǒng)(DBMS)。 按列存儲,列越多速度越慢; 按列存儲,數(shù)據(jù)更容易壓縮(類型相同、區(qū)分度);==》每次讀取的數(shù)據(jù)就更多,更少的io。 聚合性能高; 類sql操作;僅支持?jǐn)?shù)據(jù)的查詢、批量寫入、批量刪除。 用于磁盤查詢,同時也利用

    2024年02月02日
    瀏覽(23)
  • ELK日志系統(tǒng)實(shí)戰(zhàn)(五):安裝vector并將數(shù)據(jù)輸出到es、clickhouse案例

    目錄 安裝vector(0.22.0) 方式一:docker安裝 方式二:手動下載安裝包 編寫配置文件 1.從syslog將日志進(jìn)

    2024年02月06日
    瀏覽(20)
  • clickhouse斷電重啟故障解決方案

    clickhouse斷電重啟故障解決方案

    公司的一個日志系統(tǒng)用到了clickhouse。一線運(yùn)維反映說有個生產(chǎn)環(huán)境因?yàn)楫惓嚯娫斐煞?wù)器重啟。在執(zhí)行日志系統(tǒng)的啟動腳本時,一直報clickhouse啟動不起來,日志系統(tǒng)無法使用。 通過閱讀啟動腳本代碼,以及啟動日志系統(tǒng),我發(fā)現(xiàn)mysql、redis等項(xiàng)目依賴的以及項(xiàng)目本身都能啟

    2024年02月14日
    瀏覽(56)
  • Elasticsearch--01.ES8.1.0集群搭建

    Elasticsearch--01.ES8.1.0集群搭建

    一、搭建ES集群 1.集群環(huán)境安裝 本集群使用Centos7.5操作系統(tǒng),2G 2C 60G(如果主機(jī)好點(diǎn)的節(jié)點(diǎn)配置可以搞高點(diǎn)) 分別修改三臺集群服務(wù)器配置: ?1.1.修改系統(tǒng)配置文件/etc/security/limits.conf 1.2.修改/etc/sysctl.conf 1.3.# sysctl -p? 重新加載 集群服務(wù)器如下: 機(jī)器地址 節(jié)點(diǎn)名稱 節(jié)點(diǎn)角

    2024年02月12日
    瀏覽(20)
  • clickhouse 數(shù)據(jù)一致性保障常用解決方案

    clickhouse 數(shù)據(jù)一致性保障常用解決方案

    對于任何一個數(shù)據(jù)存儲的框架來說,確保數(shù)據(jù)的一致性都是其非常重要的組成部分,不管是過程中的強(qiáng)一致性,還是最終一致性,都是數(shù)據(jù)一致性的解決方案,本篇來聊聊clickhouse中的數(shù)據(jù)一致性問題。 通過查詢 CK 官方手冊發(fā)現(xiàn),即便對數(shù)據(jù)一致性支持最好的 Mergetree,也只是

    2024年01月16日
    瀏覽(31)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包