国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

分庫分表已成為過去式,使用分布式數(shù)據(jù)庫才是未來

這篇具有很好參考價(jià)值的文章主要介紹了分庫分表已成為過去式,使用分布式數(shù)據(jù)庫才是未來。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

轉(zhuǎn)載至我的博客 https://www.infrastack.cn ,公眾號:架構(gòu)成長指南

當(dāng)我們使用 Mysql數(shù)據(jù)庫到達(dá)一定量級以后,性能就會逐步下降,而解決此類問題,常用的手段就是引入數(shù)據(jù)庫中間件進(jìn)行分庫分表處理,比如使用 Mycat、ShadingShperetddl,但是這種都是過去式了,現(xiàn)在使用分布式數(shù)據(jù)庫可以避免分庫分表

為什么不建議分庫分表呢?

分庫分表以后,會面臨以下問題

  • 分頁問題,例如:使用傳統(tǒng)寫法,隨著頁數(shù)過大性能會急劇下降
  • 分布式事務(wù)問題
  • 數(shù)據(jù)遷移問題,例如:需要把現(xiàn)有數(shù)據(jù)通過分配算法導(dǎo)入到所有的分庫中
  • 數(shù)據(jù)擴(kuò)容問題,分庫分表的數(shù)據(jù)總有一天也會到達(dá)極限,需要增大分片
  • 開發(fā)模式變化,比如在請求數(shù)據(jù)時(shí),需要帶分片鍵,否則就會導(dǎo)致所有節(jié)點(diǎn)執(zhí)行
  • 跨庫跨表查詢問題
  • 業(yè)務(wù)需要進(jìn)行一定取舍,由于分庫分表的局限性,有些場景下需要業(yè)務(wù)進(jìn)行取舍

以上只是列舉了一部分問題,為了避免這些問題,可以使用分布式數(shù)據(jù)庫TiDB來處理

TiDB介紹

TiDB 是 PingCAP 公司研發(fā)的一款開源分布式關(guān)系型數(shù)據(jù)庫,從 2015年 9 月開源,至今已經(jīng)有9 年時(shí)間,可以說已經(jīng)非常成熟,它是一款同時(shí)支持OLTP(在線事務(wù)處理)和OLAP(在線分析處理)的融合型分布式數(shù)據(jù)庫產(chǎn)品,具備水平擴(kuò)縮容,金融級高可用、實(shí)時(shí) HTAP(Hybrid Transactional and Analytical Processing)、云原生的分布式數(shù)據(jù)庫,兼容 MySQL 5.7 協(xié)議和 MySQL 生態(tài)等重要特性,它適合高可用、強(qiáng)一致要求較高、數(shù)據(jù)規(guī)模較大等各種應(yīng)用場景。

核心特性

  • 金融級高可用
  • 在線水平擴(kuò)容或者縮容,并且存算分離
  • 云原生的分布式數(shù)據(jù)庫,支持部署在公有云,私有云,混合云中
  • 實(shí)時(shí)HTAP,提供TIKV行存儲引擎和TiFlash列存儲引擎
  • 兼容MySQL協(xié)議和MySQL生態(tài)
  • 分布式事務(wù)強(qiáng)一致性
  • 從 MySQL 無縫切換到 TiDB,幾乎無需修改代碼,遷移成本極低
  • PD在分布式理論CAP方面滿足CP,是強(qiáng)一致性的

應(yīng)用場景

  • 對數(shù)據(jù)一致性及高可靠、系統(tǒng)高可用、可擴(kuò)展性、容災(zāi)要求較高的金融行業(yè)屬性的場景
  • 對存儲容量、可擴(kuò)展性、并發(fā)要求較高的海量數(shù)據(jù)及高并發(fā)的OLTP場景
  • 數(shù)據(jù)匯聚、二次加工處理的場景

案例

TiDB 有1500 多家不同行業(yè)的企業(yè)應(yīng)用在了生產(chǎn)環(huán)境,以下是一些有代表性企業(yè),要想查看更多案例,可以訪問TiDB 官網(wǎng)查詢

系統(tǒng)架構(gòu)

TIDB Server

SQL 層,對外暴露 MySQL 協(xié)議的連接 endpoint,負(fù)責(zé)接收SQL請求,處理SQL相關(guān)的邏輯,并通過PD找到存儲計(jì)算所需數(shù)據(jù)的TiKV地址,與TiKV交互獲取數(shù)據(jù),最終返回結(jié)果。TiDB Server 是無狀態(tài)的,其本身并不存儲數(shù)據(jù),只負(fù)責(zé)計(jì)算,可以無限水平擴(kuò)展,可以通過負(fù)載均衡組件(LVS、HAProxy或F5)對外提供統(tǒng)一的接入地址,客戶端的連接可以均勻地分?jǐn)傇诙鄠€(gè) TiDB 實(shí)例上以達(dá)到負(fù)載均衡的效果。

PD Server

整個(gè)集群的管理模塊,其主要工作有三個(gè):

  1. 存儲集群的元信息(某個(gè)Key存儲在那個(gè)TiKV節(jié)點(diǎn));
  2. 對TiKV集群進(jìn)行調(diào)度和負(fù)載均衡、Leader選舉;
  3. 分配全局唯一且遞增的事務(wù)ID。

PD 是一個(gè)集群,需要部署奇數(shù)個(gè)節(jié)點(diǎn),一般線上推薦至少部署3個(gè)節(jié)點(diǎn)。PD在選舉的過程中無法對外提供服務(wù),這個(gè)時(shí)間大約是3秒。

TIKV Server

TiDB 現(xiàn)在同時(shí)支持OLTP 和 OLAP,而TiKV負(fù)責(zé)存儲OLTP數(shù)據(jù),從外部看TiKV是一個(gè)分布式的提供事務(wù)的Key-Value存儲引擎。存儲數(shù)據(jù)的基本單位是Region,每個(gè)Region負(fù)責(zé)存儲一個(gè)Key Range(從StartKey到EndKey的左閉右開區(qū)間)的數(shù)據(jù),每個(gè)TiKV節(jié)點(diǎn)會負(fù)責(zé)多個(gè)Region。

TiKV如何做到數(shù)據(jù)不丟失的?

簡單理解,就是把數(shù)據(jù)復(fù)制到多臺機(jī)器上,這樣一個(gè)節(jié)點(diǎn)down 機(jī),其他節(jié)點(diǎn)上的副本還能繼續(xù)提供服務(wù);復(fù)雜理解,需要這個(gè)數(shù)據(jù)可靠并且高效復(fù)制到其他節(jié)點(diǎn),并且能處理副本失效的情況,那怎么做呢,就是使用 Raft一致性算法

Region 與副本之間通過 Raft 協(xié)議來維持?jǐn)?shù)據(jù)一致性,任何寫請求都只能在 Leader 上寫入,并且需要寫入多數(shù)副本后(默認(rèn)配置為 3 副本,即所有請求必須至少寫入兩個(gè)副本成功)才會返回客戶端寫入成功。

分布式事務(wù)支持

TiKV 支持分布式事務(wù),我們可以一次性寫入多個(gè) key-value 而不必關(guān)心這些 key-value 是否處于同一個(gè)數(shù)據(jù)切片 (Region) 上,TiKV 的分布式事務(wù)參考了Google 在 BigTable 中使用的事務(wù)模型Percolator,具體可以訪問論文了解

與MySQL的對比

支持的特性

  • 支持分布式事務(wù),原理是基于Google Percolator,Percolator是基于Bigtable的,所以數(shù)據(jù)結(jié)構(gòu)直接使用了Bigtable的Tablet。詳情可參考https://zhuanlan.zhihu.com/p/39896539
  • 支持鎖,TIDB是樂觀鎖 +MVCC ,MySQL是悲觀鎖+MVCC,要注意TIDB執(zhí)行Update、Insert、Delete時(shí)不會檢查沖突,只有在提交時(shí)才會檢查寫寫沖突,所以在業(yè)務(wù)端執(zhí)行SQL語句后,要注意檢查返回值,即使執(zhí)行沒有出錯(cuò),提交的時(shí)候也可能出錯(cuò)。

不支持的功能特性

  • 不支持存儲過程、函數(shù)、觸發(fā)器
  • 自增id只支持在單個(gè)TIDB Server的自增,不支持多個(gè)TIDB Server的自增。
  • 外鍵約束
  • 臨時(shí)表
  • Mysql追蹤優(yōu)化器
  • XA 語法(TiDB 內(nèi)部使用兩階段提交,但并沒有通過 SQL 接口公開)

資源使用情況

以下內(nèi)容參考:https://pingcap.medium.com/an-8x-system-performance-boost-why-we-migrated-from-mysql-to-a-newsql-database-a42570ab765a

TiDB 具有很高的數(shù)據(jù)壓縮比,MySQL 中的 10.8 TB 數(shù)據(jù)在 TiDB 中變成了 3.2 TB,還是三副本的總數(shù)據(jù)量。因此,MySQL 與 TiDB 的空間使用比例為 3.4:1。

同等量級,使用2 年以后,資源使用情況

  • MySQL使用32 個(gè)節(jié)點(diǎn),而 TiDB 只有 14 個(gè)
  • MySql 用了 512 個(gè) CPU 核心,而 TiDB 將僅使用 224 個(gè),不到 MySQL 的一半。
  • MySQL 使用 48 TB 存儲空間,而 TiDB 將使用 16 TB,僅為 MySQL 的 1/3。

性能測試

測試報(bào)告 1

來源:https://www.percona.com/blog/a-quick-look-into-tidb-performance-on-a-single-server/

五個(gè) ecs 實(shí)例,使用了不同配置,以此測試

  • t2.medium:2 個(gè) CPU 核心
  • x1e.xlarge:4 個(gè) CPU 核心
  • r4.4xlarge:16 個(gè) CPU 核心
  • m4.16xlarge:64 個(gè) CPU 核心
  • m5.24xlarge:96 個(gè) CPU 核心

MySQL 中的數(shù)據(jù)庫大小為 70Gb,TiDB 中的數(shù)據(jù)庫大小為 30Gb(壓縮)。該表沒有二級索引(主鍵除外)。

測試用例

  1. 簡單計(jì)數(shù)(*):

     select count(*) from ontime;
    
  2. 簡單分組依據(jù)

     select count(*), year from ontime group by year order by year;
    
  3. 用于全表掃描的復(fù)雜過濾器

    select * from ontime where UniqueCarrier = 'DL' and TailNum = 'N317NB' and FlightNum = '2' and Origin = 'JFK' and Dest = 'FLL' limit 10;
    
  4. 復(fù)雜的分組依據(jù)和排序依據(jù)查詢

    select SQL_CALC_FOUND_ROWS 
    FlightDate, UniqueCarrier as carrier,
    FlightNum, 
    Origin, 
    Dest 
    FROM ontime 
    WHERE 
    DestState not in ('AK', 'HI', 'PR', 'VI')
    and OriginState not in ('AK', 'HI', 'PR', 'VI')
    and flightdate > '2015-01-01' 
    and ArrDelay < 15 
    and cancelled = 0 and Diverted = 0  
    and DivAirportLandings = '0'    
    ORDER by DepDelay DESC
    LIMIT 10;
    

    下圖表示結(jié)果(條形表示查詢響應(yīng)時(shí)間,越小越好):

系統(tǒng)基準(zhǔn)測試

在 m4.16xlarge 實(shí)例上使用 Sysbench 進(jìn)行點(diǎn)選擇(意味著通過主鍵選擇一行,線程范圍從 1 到 128)(內(nèi)存限制:無磁盤讀取)。結(jié)果在這里。條形代表每秒的交易數(shù)量,越多越好:

系統(tǒng)測試報(bào)告 2

來源:https://www.dcits.com/show-269-4103-1.html

硬件配置
測試場景

測試分兩階段進(jìn)行,第一階段測試數(shù)據(jù)為100萬單,第二階段測試數(shù)據(jù)為1300萬單。在此基礎(chǔ)上,使用Jmeter壓力測試10萬單結(jié)果如下:

從測試結(jié)果來看,在小數(shù)據(jù)量mysql性能是好于TiDB,因?yàn)?TiDB 是分布式架構(gòu),如果小數(shù)據(jù)量,在網(wǎng)絡(luò)通訊節(jié)點(diǎn)分發(fā)一致性等方面花的時(shí)間就很多,然后各個(gè)節(jié)點(diǎn)執(zhí)行完還要匯總返回,所以開銷是比較大的,但是數(shù)據(jù)量一上來TiDB 優(yōu)勢就體現(xiàn)出來了,所以如果數(shù)據(jù)量比較小,沒必要使用 TiDB

總結(jié)

以上介紹了 TiDB架構(gòu),以及它的一些特性,同時(shí)也與 mysql 進(jìn)行了對比,如果貴司的數(shù)據(jù)量比較大,正在考慮要分庫分表,那么完全可以使用它,來避免分庫分表,分庫分表是一個(gè)過渡方案,使用分布式數(shù)據(jù)庫才是終極方案。同時(shí)如果貴司的數(shù)據(jù)量比較小,那么就沒必要引入了

掃描下面的二維碼關(guān)注我們的微信公眾帳號,在微信公眾帳號中回復(fù)?加群?即可加入到我們的技術(shù)討論群里面共同學(xué)習(xí)。文章來源地址http://www.zghlxwxcb.cn/news/detail-825056.html

到了這里,關(guān)于分庫分表已成為過去式,使用分布式數(shù)據(jù)庫才是未來的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 解釋什么是分布式數(shù)據(jù)庫,列舉幾種常見的分布式數(shù)據(jù)庫系統(tǒng)

    敏感信息和隱私保護(hù)是指在收集、存儲和使用個(gè)人數(shù)據(jù)時(shí),需要采取一系列措施來保護(hù)這些數(shù)據(jù)的安全和機(jī)密性,防止數(shù)據(jù)被未經(jīng)授權(quán)的第三方訪問、使用或泄露。這些措施包括加密、訪問控制、數(shù)據(jù)脫敏、數(shù)據(jù)加密、隱私政策等。 在隱私保護(hù)的技術(shù)手段方面,常用的技術(shù)包

    2024年02月08日
    瀏覽(32)
  • 數(shù)據(jù)庫-分庫分表初探

    數(shù)據(jù)庫-分庫分表初探

    數(shù)據(jù)量在百萬以里,可以通過Tina集從庫、優(yōu)化索引等提升性能 數(shù)據(jù)量超過千萬,為了減少數(shù)據(jù)庫的負(fù)擔(dān),提升數(shù)據(jù)庫響應(yīng)速度,縮短查詢時(shí)間,需要進(jìn)行分庫分表 推薦:采用垂直分庫水平分表 總結(jié):分庫要解決的是硬件資源的問題,不管是拆分字段,還是拆分?jǐn)?shù)據(jù),都是要

    2024年01月25日
    瀏覽(27)
  • 數(shù)據(jù)庫的分庫分表

    數(shù)據(jù)庫的分庫分表

    ?

    2024年02月14日
    瀏覽(19)
  • 數(shù)據(jù)庫分庫分表思路

    一. 數(shù)據(jù)切分 關(guān)系型數(shù)據(jù)庫本身比較容易成為系統(tǒng)瓶頸,單機(jī)存儲容量、連接數(shù)、處理能力都有限。當(dāng)單表的數(shù)據(jù)量達(dá)到1000W或100G以后,由于查詢維度較多,即使添加從庫、優(yōu)化索引,做很多操作時(shí)性能仍下降嚴(yán)重。此時(shí)就要考慮對其進(jìn)行切分了,切分的目的就在于減少數(shù)據(jù)

    2024年02月09日
    瀏覽(21)
  • 淺談數(shù)據(jù)庫分庫分表

    本文主要介紹數(shù)據(jù)庫分庫分表相關(guān)的基礎(chǔ)知識,包括分庫分表是什么,為什么要分庫分表,以及有哪些解決方案。 數(shù)據(jù)庫分庫分表,用英文表示是 \\\"database sharding\\\" or \\\"database partitioning\\\" 。 分庫分表是指將一個(gè)大型數(shù)據(jù)庫按照一定的規(guī)則拆分成多個(gè)小型數(shù)據(jù)庫,每個(gè)小型數(shù)據(jù)庫

    2024年02月15日
    瀏覽(19)
  • 解決使用MyBatis Plus自動映射功能中數(shù)據(jù)庫表與實(shí)體類不匹配導(dǎo)致映射失敗的深度探索與分布式實(shí)踐

    摘要:在開發(fā)Java應(yīng)用程序過程中,使用MyBatis Plus自動映射功能可以大大簡化數(shù)據(jù)訪問層的開發(fā)。然而,當(dāng)數(shù)據(jù)庫表與實(shí)體類的字段與屬性沒有對應(yīng)關(guān)系時(shí),可能會導(dǎo)致映射失敗。本篇文章將深入探索這一問題,并結(jié)合Java深度和分布式實(shí)踐,提供解決方案。 在開發(fā)基于Java的應(yīng)

    2024年02月04日
    瀏覽(227)
  • 分布式數(shù)據(jù)庫架構(gòu)

    分布式數(shù)據(jù)庫架構(gòu)

    對于mysql架構(gòu),一定會使用到讀寫分離,在此基礎(chǔ)上有五種常見架構(gòu)設(shè)計(jì):一主一從或多從、主主復(fù)制、級聯(lián)復(fù)制、主主與級聯(lián)復(fù)制結(jié)合。 1.1、主從復(fù)制 這種架構(gòu)設(shè)計(jì)是使用的最多的。在讀寫分離的基礎(chǔ)上,會存在一臺master作為寫機(jī),一個(gè)或多個(gè)slave作為讀機(jī)。因?yàn)樵趯?shí)際的

    2024年02月10日
    瀏覽(32)
  • MySQL數(shù)據(jù)庫分庫分表備份

    分庫備份 創(chuàng)建腳本并編寫 [root@localhost scripts]# vim bak_db_v1.sh #!/bin/bash 備份的路徑 bak_path=/backup/db 賬號密碼 mysql_cmd=\\\'-uroot -pRedHat@123\\\' 需要排除的數(shù)據(jù)庫 exclude_db=\\\'information_schema|mysql|performance_schema|sys\\\' 檢驗(yàn)備份路徑是否存在,不存在則創(chuàng)建 [ -d ${bak_path} ] || mkdir -p ${bak_path} 提取需要

    2024年02月14日
    瀏覽(36)
  • 分布式數(shù)據(jù)庫HBase

    分布式數(shù)據(jù)庫HBase

    HBase是一個(gè)高可靠、高性能、 面向列 、可伸縮的分布式數(shù)據(jù)庫,是谷歌BigTable的開源實(shí)現(xiàn),主要用來存儲非結(jié)構(gòu)化和把結(jié)構(gòu)化的松散數(shù)據(jù)。 HBase的目標(biāo)是處理非常龐大的表,可以通過水平擴(kuò)展的方式,利用 廉價(jià)計(jì)算機(jī)集群 處理由超過10億行數(shù)據(jù)和數(shù)百萬列元素組成的數(shù)據(jù)表。

    2024年02月09日
    瀏覽(25)
  • shell腳本:數(shù)據(jù)庫的分庫分表

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包