国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

分庫分表已成為過去式，使用分布式數(shù)據(jù)庫才是未來

2年前作者：架構(gòu)成長指南分類：Toy博客閱讀(29)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了分庫分表已成為過去式，使用分布式數(shù)據(jù)庫才是未來。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

轉(zhuǎn)載至我的博客 https://www.infrastack.cn ，公眾號：架構(gòu)成長指南

當(dāng)我們使用 Mysql數(shù)據(jù)庫到達(dá)一定量級以后，性能就會逐步下降，而解決此類問題，常用的手段就是引入數(shù)據(jù)庫中間件進(jìn)行分庫分表處理，比如使用 Mycat、ShadingShpere、tddl，但是這種都是過去式了，現(xiàn)在使用分布式數(shù)據(jù)庫可以避免分庫分表

為什么不建議分庫分表呢？

分庫分表以后，會面臨以下問題

分頁問題，例如：使用傳統(tǒng)寫法，隨著頁數(shù)過大性能會急劇下降
分布式事務(wù)問題
數(shù)據(jù)遷移問題，例如：需要把現(xiàn)有數(shù)據(jù)通過分配算法導(dǎo)入到所有的分庫中
數(shù)據(jù)擴(kuò)容問題，分庫分表的數(shù)據(jù)總有一天也會到達(dá)極限，需要增大分片
開發(fā)模式變化，比如在請求數(shù)據(jù)時(shí)，需要帶分片鍵，否則就會導(dǎo)致所有節(jié)點(diǎn)執(zhí)行
跨庫跨表查詢問題
業(yè)務(wù)需要進(jìn)行一定取舍，由于分庫分表的局限性，有些場景下需要業(yè)務(wù)進(jìn)行取舍

以上只是列舉了一部分問題，為了避免這些問題，可以使用分布式數(shù)據(jù)庫TiDB來處理

TiDB介紹

TiDB 是 PingCAP 公司研發(fā)的一款開源分布式關(guān)系型數(shù)據(jù)庫，從 2015年 9 月開源，至今已經(jīng)有9 年時(shí)間，可以說已經(jīng)非常成熟，它是一款同時(shí)支持OLTP（在線事務(wù)處理）和OLAP（在線分析處理）的融合型分布式數(shù)據(jù)庫產(chǎn)品，具備水平擴(kuò)縮容，金融級高可用、實(shí)時(shí) HTAP（Hybrid Transactional and Analytical Processing）、云原生的分布式數(shù)據(jù)庫，兼容 MySQL 5.7 協(xié)議和 MySQL 生態(tài)等重要特性，它適合高可用、強(qiáng)一致要求較高、數(shù)據(jù)規(guī)模較大等各種應(yīng)用場景。

核心特性

金融級高可用
在線水平擴(kuò)容或者縮容，并且存算分離
云原生的分布式數(shù)據(jù)庫，支持部署在公有云，私有云，混合云中
實(shí)時(shí)HTAP，提供TIKV行存儲引擎和TiFlash列存儲引擎
兼容MySQL協(xié)議和MySQL生態(tài)
分布式事務(wù)強(qiáng)一致性
從 MySQL 無縫切換到 TiDB，幾乎無需修改代碼，遷移成本極低
PD在分布式理論CAP方面滿足CP，是強(qiáng)一致性的

應(yīng)用場景

對數(shù)據(jù)一致性及高可靠、系統(tǒng)高可用、可擴(kuò)展性、容災(zāi)要求較高的金融行業(yè)屬性的場景
對存儲容量、可擴(kuò)展性、并發(fā)要求較高的海量數(shù)據(jù)及高并發(fā)的OLTP場景
數(shù)據(jù)匯聚、二次加工處理的場景

案例

TiDB 有1500 多家不同行業(yè)的企業(yè)應(yīng)用在了生產(chǎn)環(huán)境，以下是一些有代表性企業(yè)，要想查看更多案例，可以訪問TiDB 官網(wǎng)查詢

系統(tǒng)架構(gòu)

TIDB Server

SQL 層，對外暴露 MySQL 協(xié)議的連接 endpoint，負(fù)責(zé)接收SQL請求，處理SQL相關(guān)的邏輯，并通過PD找到存儲計(jì)算所需數(shù)據(jù)的TiKV地址，與TiKV交互獲取數(shù)據(jù)，最終返回結(jié)果。TiDB Server 是無狀態(tài)的，其本身并不存儲數(shù)據(jù)，只負(fù)責(zé)計(jì)算，可以無限水平擴(kuò)展，可以通過負(fù)載均衡組件（LVS、HAProxy或F5）對外提供統(tǒng)一的接入地址，客戶端的連接可以均勻地分?jǐn)傇诙鄠€(gè) TiDB 實(shí)例上以達(dá)到負(fù)載均衡的效果。

PD Server

整個(gè)集群的管理模塊，其主要工作有三個(gè)：

存儲集群的元信息（某個(gè)Key存儲在那個(gè)TiKV節(jié)點(diǎn)）；
對TiKV集群進(jìn)行調(diào)度和負(fù)載均衡、Leader選舉；
分配全局唯一且遞增的事務(wù)ID。

PD 是一個(gè)集群，需要部署奇數(shù)個(gè)節(jié)點(diǎn)，一般線上推薦至少部署3個(gè)節(jié)點(diǎn)。PD在選舉的過程中無法對外提供服務(wù)，這個(gè)時(shí)間大約是3秒。

TIKV Server

TiDB 現(xiàn)在同時(shí)支持OLTP 和 OLAP，而TiKV負(fù)責(zé)存儲OLTP數(shù)據(jù)，從外部看TiKV是一個(gè)分布式的提供事務(wù)的Key-Value存儲引擎。存儲數(shù)據(jù)的基本單位是Region，每個(gè)Region負(fù)責(zé)存儲一個(gè)Key Range（從StartKey到EndKey的左閉右開區(qū)間）的數(shù)據(jù)，每個(gè)TiKV節(jié)點(diǎn)會負(fù)責(zé)多個(gè)Region。

TiKV如何做到數(shù)據(jù)不丟失的？

簡單理解，就是把數(shù)據(jù)復(fù)制到多臺機(jī)器上，這樣一個(gè)節(jié)點(diǎn)down 機(jī)，其他節(jié)點(diǎn)上的副本還能繼續(xù)提供服務(wù)；復(fù)雜理解，需要這個(gè)數(shù)據(jù)可靠并且高效復(fù)制到其他節(jié)點(diǎn)，并且能處理副本失效的情況，那怎么做呢，就是使用 Raft一致性算法

Region 與副本之間通過 Raft 協(xié)議來維持?jǐn)?shù)據(jù)一致性，任何寫請求都只能在 Leader 上寫入，并且需要寫入多數(shù)副本后（默認(rèn)配置為 3 副本，即所有請求必須至少寫入兩個(gè)副本成功）才會返回客戶端寫入成功。

分布式事務(wù)支持

TiKV 支持分布式事務(wù)，我們可以一次性寫入多個(gè) key-value 而不必關(guān)心這些 key-value 是否處于同一個(gè)數(shù)據(jù)切片 (Region) 上，TiKV 的分布式事務(wù)參考了Google 在 BigTable 中使用的事務(wù)模型Percolator，具體可以訪問論文了解

與MySQL的對比

支持的特性

支持分布式事務(wù)，原理是基于Google Percolator，Percolator是基于Bigtable的，所以數(shù)據(jù)結(jié)構(gòu)直接使用了Bigtable的Tablet。詳情可參考https://zhuanlan.zhihu.com/p/39896539
支持鎖，TIDB是樂觀鎖 +MVCC ，MySQL是悲觀鎖+MVCC，要注意TIDB執(zhí)行Update、Insert、Delete時(shí)不會檢查沖突，只有在提交時(shí)才會檢查寫寫沖突，所以在業(yè)務(wù)端執(zhí)行SQL語句后，要注意檢查返回值，即使執(zhí)行沒有出錯(cuò)，提交的時(shí)候也可能出錯(cuò)。

不支持的功能特性

不支持存儲過程、函數(shù)、觸發(fā)器
自增id只支持在單個(gè)TIDB Server的自增，不支持多個(gè)TIDB Server的自增。
外鍵約束
臨時(shí)表
Mysql追蹤優(yōu)化器
XA 語法（TiDB 內(nèi)部使用兩階段提交，但并沒有通過 SQL 接口公開）

資源使用情況

以下內(nèi)容參考：https://pingcap.medium.com/an-8x-system-performance-boost-why-we-migrated-from-mysql-to-a-newsql-database-a42570ab765a

TiDB 具有很高的數(shù)據(jù)壓縮比，MySQL 中的 10.8 TB 數(shù)據(jù)在 TiDB 中變成了 3.2 TB，還是三副本的總數(shù)據(jù)量。因此，MySQL 與 TiDB 的空間使用比例為 3.4:1。

同等量級，使用2 年以后，資源使用情況

MySQL使用32 個(gè)節(jié)點(diǎn)，而 TiDB 只有 14 個(gè)
MySql 用了 512 個(gè) CPU 核心，而 TiDB 將僅使用 224 個(gè)，不到 MySQL 的一半。
MySQL 使用 48 TB 存儲空間，而 TiDB 將使用 16 TB，僅為 MySQL 的 1/3。

性能測試

測試報(bào)告 1

來源：https://www.percona.com/blog/a-quick-look-into-tidb-performance-on-a-single-server/

五個(gè) ecs 實(shí)例，使用了不同配置，以此測試

t2.medium：2 個(gè) CPU 核心
x1e.xlarge：4 個(gè) CPU 核心
r4.4xlarge：16 個(gè) CPU 核心
m4.16xlarge：64 個(gè) CPU 核心
m5.24xlarge：96 個(gè) CPU 核心

MySQL 中的數(shù)據(jù)庫大小為 70Gb，TiDB 中的數(shù)據(jù)庫大小為 30Gb（壓縮）。該表沒有二級索引（主鍵除外）。

測試用例

簡單計(jì)數(shù)(*):
```
 select count(*) from ontime;
```

簡單分組依據(jù)

 select count(*), year from ontime group by year order by year;

用于全表掃描的復(fù)雜過濾器

select * from ontime where UniqueCarrier = 'DL' and TailNum = 'N317NB' and FlightNum = '2' and Origin = 'JFK' and Dest = 'FLL' limit 10;

復(fù)雜的分組依據(jù)和排序依據(jù)查詢

select SQL_CALC_FOUND_ROWS 
FlightDate, UniqueCarrier as carrier,
FlightNum, 
Origin, 
Dest 
FROM ontime 
WHERE 
DestState not in ('AK', 'HI', 'PR', 'VI')
and OriginState not in ('AK', 'HI', 'PR', 'VI')
and flightdate > '2015-01-01' 
and ArrDelay < 15 
and cancelled = 0 and Diverted = 0  
and DivAirportLandings = '0'    
ORDER by DepDelay DESC
LIMIT 10;

下圖表示結(jié)果（條形表示查詢響應(yīng)時(shí)間，越小越好）：

系統(tǒng)基準(zhǔn)測試

在 m4.16xlarge 實(shí)例上使用 Sysbench 進(jìn)行點(diǎn)選擇（意味著通過主鍵選擇一行，線程范圍從 1 到 128）（內(nèi)存限制：無磁盤讀取）。結(jié)果在這里。條形代表每秒的交易數(shù)量，越多越好：

系統(tǒng)測試報(bào)告 2

來源：https://www.dcits.com/show-269-4103-1.html

硬件配置

測試場景

測試分兩階段進(jìn)行，第一階段測試數(shù)據(jù)為100萬單，第二階段測試數(shù)據(jù)為1300萬單。在此基礎(chǔ)上，使用Jmeter壓力測試10萬單結(jié)果如下：

從測試結(jié)果來看，在小數(shù)據(jù)量mysql性能是好于TiDB，因?yàn)?TiDB 是分布式架構(gòu)，如果小數(shù)據(jù)量，在網(wǎng)絡(luò)通訊節(jié)點(diǎn)分發(fā)一致性等方面花的時(shí)間就很多，然后各個(gè)節(jié)點(diǎn)執(zhí)行完還要匯總返回，所以開銷是比較大的，但是數(shù)據(jù)量一上來TiDB 優(yōu)勢就體現(xiàn)出來了，所以如果數(shù)據(jù)量比較小，沒必要使用 TiDB

總結(jié)

以上介紹了 TiDB架構(gòu)，以及它的一些特性，同時(shí)也與 mysql 進(jìn)行了對比，如果貴司的數(shù)據(jù)量比較大，正在考慮要分庫分表，那么完全可以使用它，來避免分庫分表，分庫分表是一個(gè)過渡方案，使用分布式數(shù)據(jù)庫才是終極方案。同時(shí)如果貴司的數(shù)據(jù)量比較小，那么就沒必要引入了

掃描下面的二維碼關(guān)注我們的微信公眾帳號，在微信公眾帳號中回復(fù)?加群?即可加入到我們的技術(shù)討論群里面共同學(xué)習(xí)。文章來源地址http://www.zghlxwxcb.cn/news/detail-825056.html

到了這里，關(guān)于分庫分表已成為過去式，使用分布式數(shù)據(jù)庫才是未來的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

解釋什么是分布式數(shù)據(jù)庫，列舉幾種常見的分布式數(shù)據(jù)庫系統(tǒng)
敏感信息和隱私保護(hù)是指在收集、存儲和使用個(gè)人數(shù)據(jù)時(shí)，需要采取一系列措施來保護(hù)這些數(shù)據(jù)的安全和機(jī)密性，防止數(shù)據(jù)被未經(jīng)授權(quán)的第三方訪問、使用或泄露。這些措施包括加密、訪問控制、數(shù)據(jù)脫敏、數(shù)據(jù)加密、隱私政策等。在隱私保護(hù)的技術(shù)手段方面，常用的技術(shù)包
2024年02月08日
瀏覽(32)
數(shù)據(jù)庫-分庫分表初探
數(shù)據(jù)量在百萬以里，可以通過Tina集從庫、優(yōu)化索引等提升性能數(shù)據(jù)量超過千萬，為了減少數(shù)據(jù)庫的負(fù)擔(dān)，提升數(shù)據(jù)庫響應(yīng)速度，縮短查詢時(shí)間，需要進(jìn)行分庫分表推薦：采用垂直分庫水平分表總結(jié)：分庫要解決的是硬件資源的問題，不管是拆分字段，還是拆分?jǐn)?shù)據(jù)，都是要
2024年01月25日
瀏覽(27)
數(shù)據(jù)庫的分庫分表
?
2024年02月14日
瀏覽(19)
數(shù)據(jù)庫分庫分表思路
一. 數(shù)據(jù)切分關(guān)系型數(shù)據(jù)庫本身比較容易成為系統(tǒng)瓶頸，單機(jī)存儲容量、連接數(shù)、處理能力都有限。當(dāng)單表的數(shù)據(jù)量達(dá)到1000W或100G以后，由于查詢維度較多，即使添加從庫、優(yōu)化索引，做很多操作時(shí)性能仍下降嚴(yán)重。此時(shí)就要考慮對其進(jìn)行切分了，切分的目的就在于減少數(shù)據(jù)
2024年02月09日
瀏覽(21)
淺談數(shù)據(jù)庫分庫分表
本文主要介紹數(shù)據(jù)庫分庫分表相關(guān)的基礎(chǔ)知識，包括分庫分表是什么，為什么要分庫分表，以及有哪些解決方案。數(shù)據(jù)庫分庫分表，用英文表示是 \\\"database sharding\\\" or \\\"database partitioning\\\" 。分庫分表是指將一個(gè)大型數(shù)據(jù)庫按照一定的規(guī)則拆分成多個(gè)小型數(shù)據(jù)庫，每個(gè)小型數(shù)據(jù)庫
2024年02月15日
瀏覽(19)
解決使用MyBatis Plus自動映射功能中數(shù)據(jù)庫表與實(shí)體類不匹配導(dǎo)致映射失敗的深度探索與分布式實(shí)踐
摘要：在開發(fā)Java應(yīng)用程序過程中，使用MyBatis Plus自動映射功能可以大大簡化數(shù)據(jù)訪問層的開發(fā)。然而，當(dāng)數(shù)據(jù)庫表與實(shí)體類的字段與屬性沒有對應(yīng)關(guān)系時(shí)，可能會導(dǎo)致映射失敗。本篇文章將深入探索這一問題，并結(jié)合Java深度和分布式實(shí)踐，提供解決方案。在開發(fā)基于Java的應(yīng)
2024年02月04日
瀏覽(227)
分布式數(shù)據(jù)庫架構(gòu)
對于mysql架構(gòu)，一定會使用到讀寫分離，在此基礎(chǔ)上有五種常見架構(gòu)設(shè)計(jì)：一主一從或多從、主主復(fù)制、級聯(lián)復(fù)制、主主與級聯(lián)復(fù)制結(jié)合。 1.1、主從復(fù)制這種架構(gòu)設(shè)計(jì)是使用的最多的。在讀寫分離的基礎(chǔ)上，會存在一臺master作為寫機(jī)，一個(gè)或多個(gè)slave作為讀機(jī)。因?yàn)樵趯?shí)際的
2024年02月10日
瀏覽(32)
MySQL數(shù)據(jù)庫分庫分表備份
分庫備份創(chuàng)建腳本并編寫 [root@localhost scripts]# vim bak_db_v1.sh #!/bin/bash 備份的路徑 bak_path=/backup/db 賬號密碼 mysql_cmd=\\\'-uroot -pRedHat@123\\\' 需要排除的數(shù)據(jù)庫 exclude_db=\\\'information_schema|mysql|performance_schema|sys\\\' 檢驗(yàn)備份路徑是否存在，不存在則創(chuàng)建 [ -d ${bak_path} ] || mkdir -p ${bak_path} 提取需要
2024年02月14日
瀏覽(36)
分布式數(shù)據(jù)庫HBase
HBase是一個(gè)高可靠、高性能、面向列、可伸縮的分布式數(shù)據(jù)庫，是谷歌BigTable的開源實(shí)現(xiàn)，主要用來存儲非結(jié)構(gòu)化和把結(jié)構(gòu)化的松散數(shù)據(jù)。 HBase的目標(biāo)是處理非常龐大的表，可以通過水平擴(kuò)展的方式，利用廉價(jià)計(jì)算機(jī)集群處理由超過10億行數(shù)據(jù)和數(shù)百萬列元素組成的數(shù)據(jù)表。
2024年02月09日
瀏覽(25)
shell腳本：數(shù)據(jù)庫的分庫分表
?
2024年02月15日
瀏覽(24)