国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<kbd id="qsnbc"><rt id="qsnbc"><td id="qsnbc"></td></rt></kbd>

LinkedIn 開源分布式存儲(chǔ)系統(tǒng)Ambry

2年前作者：菠蘿-琪琪分類：Toy博客閱讀(19)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了LinkedIn 開源分布式存儲(chǔ)系統(tǒng)Ambry。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

分布式存儲(chǔ)入門認(rèn)知

分布式存儲(chǔ)是一種用于處理大規(guī)模數(shù)據(jù)的存儲(chǔ)系統(tǒng)。隨著互聯(lián)網(wǎng)的發(fā)展和數(shù)據(jù)量的爆發(fā)式增長(zhǎng)，傳統(tǒng)的集中式存儲(chǔ)已經(jīng)無法滿足需求。分布式存儲(chǔ)通過將數(shù)據(jù)分散存儲(chǔ)在多個(gè)節(jié)點(diǎn)上，實(shí)現(xiàn)高可靠性、高擴(kuò)展性和高性能的存儲(chǔ)解決方案

分布式存儲(chǔ)的基本原理

分布式存儲(chǔ)系統(tǒng)由多個(gè)存儲(chǔ)節(jié)點(diǎn)組成，每個(gè)節(jié)點(diǎn)負(fù)責(zé)存儲(chǔ)一部分?jǐn)?shù)據(jù)。數(shù)據(jù)通常被分成多個(gè)塊，并通過數(shù)據(jù)切分和冗余備份來提高容錯(cuò)性和數(shù)據(jù)可用性。節(jié)點(diǎn)之間通過網(wǎng)絡(luò)連接進(jìn)行通信和數(shù)據(jù)同步，實(shí)現(xiàn)數(shù)據(jù)的高效分布式存儲(chǔ)和訪問

分布式存儲(chǔ)的優(yōu)勢(shì)

高可靠性：分布式存儲(chǔ)通過數(shù)據(jù)冗余備份和故障轉(zhuǎn)移來提供高可靠性，即使某個(gè)節(jié)點(diǎn)出現(xiàn)故障，數(shù)據(jù)依然可用。
高擴(kuò)展性：由于數(shù)據(jù)被分散存儲(chǔ)在多個(gè)節(jié)點(diǎn)上，分布式存儲(chǔ)可以方便地?cái)U(kuò)展存儲(chǔ)容量和性能，以滿足不斷增長(zhǎng)的數(shù)據(jù)需求。
高性能：通過將數(shù)據(jù)并行存儲(chǔ)和訪問，分布式存儲(chǔ)可以實(shí)現(xiàn)高并發(fā)和低延遲的數(shù)據(jù)訪問，提供快速的存儲(chǔ)和檢索能力。

分布式存儲(chǔ)的應(yīng)用場(chǎng)景

分布式存儲(chǔ)廣泛應(yīng)用于以下場(chǎng)景：

大數(shù)據(jù)分析：分布式存儲(chǔ)可以存儲(chǔ)和處理大規(guī)模的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)，支持大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)等應(yīng)用。
云存儲(chǔ)：云服務(wù)提供商使用分布式存儲(chǔ)來存儲(chǔ)用戶的數(shù)據(jù)，并提供可靠的數(shù)據(jù)存儲(chǔ)和備份服務(wù)。
分布式文件系統(tǒng)：分布式存儲(chǔ)可以用于構(gòu)建分布式文件系統(tǒng)，實(shí)現(xiàn)高性能和可擴(kuò)展的文件存儲(chǔ)和訪問。

分布式存儲(chǔ)的設(shè)計(jì)考慮因素

在設(shè)計(jì)分布式存儲(chǔ)系統(tǒng)時(shí)，需要考慮以下因素：

數(shù)據(jù)切分和負(fù)載均衡：將數(shù)據(jù)切分成適當(dāng)大小的塊，并將塊分散存儲(chǔ)在不同的節(jié)點(diǎn)上，以實(shí)現(xiàn)負(fù)載均衡和提高性能。
數(shù)據(jù)一致性和容錯(cuò)性：保證多個(gè)節(jié)點(diǎn)上的數(shù)據(jù)一致性，并通過冗余備份來提高容錯(cuò)性和數(shù)據(jù)可用性。
數(shù)據(jù)訪問和路由：設(shè)計(jì)有效的數(shù)據(jù)訪問和路由機(jī)制，以實(shí)現(xiàn)快速的數(shù)據(jù)讀寫操作。
安全性：保護(hù)數(shù)據(jù)的安全性和隱私，采用合適的安全機(jī)制和加密技術(shù)。

Ambry 設(shè)計(jì)

設(shè)計(jì)特點(diǎn)

高可用性和水平可擴(kuò)展性

Ambry 是一個(gè)高可用并且最終一致的系統(tǒng)。在大多數(shù)情況下，寫入會(huì)寫入本地?cái)?shù)據(jù)中心，然后異步復(fù)制到其他數(shù)據(jù)中心。這確保在網(wǎng)絡(luò)分區(qū)下，寫入本地?cái)?shù)據(jù)中心仍然可用。此外，當(dāng)一臺(tái)機(jī)器在本地不可用時(shí)，Ambry會(huì)選擇同一數(shù)據(jù)中心內(nèi)另一臺(tái)機(jī)器上的另一個(gè)副本來讀取或?qū)懭霐?shù)據(jù)。對(duì)于讀取，當(dāng)數(shù)據(jù)不存在于本地?cái)?shù)據(jù)中心時(shí)，它會(huì)將請(qǐng)求代理到具有blob的數(shù)據(jù)中心。

低運(yùn)營(yíng)開銷

Ambry 的一個(gè)關(guān)鍵設(shè)計(jì)目標(biāo)是使集群的操作變得非常容易。該系統(tǒng)是完全去中心化的，并配備了管理集群所需的所有工具。此外，大部分操作將在軟件內(nèi)自動(dòng)進(jìn)行，以確保維護(hù)集群所需的手動(dòng)工作量非常少

低MTTR（平均修復(fù)時(shí)間）

這對(duì)于分布式系統(tǒng)來說非常重要。機(jī)器停機(jī)、磁盤故障、服務(wù)器崩潰和 GC 停止進(jìn)程。所有這些故障在分布式系統(tǒng)中都是完全可以接受的故障。然而，關(guān)鍵是要在很短的時(shí)間內(nèi)解決問題。在所有情況下，系統(tǒng)在維修期間都可以使用。但是，保持較低的MTTR仍然很重要

雙交叉DC

默認(rèn)情況下，Ambry 支持主動(dòng)主動(dòng)設(shè)置。這意味著對(duì)象可以寫入任何數(shù)據(jù)中心的同一分區(qū)，也可以從任何其他數(shù)據(jù)中心讀取。這通常不是許多系統(tǒng)提供的通用功能。Ambry 通過復(fù)制以及在需要時(shí)將請(qǐng)求代理到遠(yuǎn)程數(shù)據(jù)中心來實(shí)現(xiàn)這一點(diǎn)。

適用于大型和小型媒體對(duì)象

大多數(shù)媒體流量由數(shù)萬億個(gè)小對(duì)象和數(shù)十億個(gè)大對(duì)象組成。系統(tǒng)需要為這種混合工作負(fù)載正常運(yùn)行。在Ambry中實(shí)現(xiàn)這一點(diǎn)的方式是將所有對(duì)象的寫入合并到一個(gè)順序日志中。這確保所有寫入都是批處理并異步刷新，并且磁盤上的碎片非常少。

成本效益

最后，任何對(duì)象存儲(chǔ)都需要長(zhǎng)期存儲(chǔ)媒體和數(shù)據(jù)類型。隨著時(shí)間的推移，較舊的數(shù)據(jù)會(huì)變冷并且讀取QPS非常低。此外，對(duì)象通常很大并且占用大量空間。設(shè)計(jì)應(yīng)該能夠啟用JBOD，支持硬盤并將空間放大保持在最低限度。

技術(shù)架構(gòu)

分區(qū)

Ambry 的核心抽象是blob塊，一種用于存儲(chǔ)數(shù)據(jù)的不可變結(jié)構(gòu)。每個(gè)blob都分配給磁盤上的一個(gè)分區(qū)并通過blob ID進(jìn)行引用。系統(tǒng)的用戶通過執(zhí)行put, get 和delete操作

LinkedIn 開源分布式存儲(chǔ)系統(tǒng)Ambry,開源,分布式,HDFS,分布式存儲(chǔ)系統(tǒng)

數(shù)據(jù)分區(qū)設(shè)計(jì)可以自由擴(kuò)展——當(dāng)用戶向系統(tǒng)添加更多數(shù)據(jù)時(shí)，它可以添加更多分區(qū)。默認(rèn)情況下，新分區(qū)是可讀寫的（意味著它同時(shí)接受 put, get，和 delete流量）。當(dāng)分區(qū)接近容量時(shí)，它會(huì)轉(zhuǎn)換為只讀，這意味著它不再支持通過以下方式存儲(chǔ)新的blob put操作。系統(tǒng)的流量往往以更新的內(nèi)容為目標(biāo)，從而給讀寫分區(qū)帶來更高的負(fù)載

為了提供對(duì)blob 的可擴(kuò)展讀寫訪問，Ambry使用了三個(gè)高級(jí)組件：集群管理器（Cluster Managers）、前端層（Frontend Layer）和數(shù)據(jù)節(jié)點(diǎn)（Datanodes）。

LinkedIn 開源分布式存儲(chǔ)系統(tǒng)Ambry,開源,分布式,HDFS,分布式存儲(chǔ)系統(tǒng)

集群管理器

集群管理器決定如何跨地理分布式數(shù)據(jù)中心將數(shù)據(jù)存儲(chǔ)在系統(tǒng)中，以及存儲(chǔ)集群的狀態(tài),狀態(tài)主要存儲(chǔ)在Zookeeper中。例如，它們存儲(chǔ)Ambry部署的邏輯布局，包括分區(qū)可讀寫還是只讀，以及分區(qū)在數(shù)據(jù)中心磁盤上的位置

Clustermap 由兩部分組成：

硬件布局：包含了機(jī)器的列表、每臺(tái)機(jī)器上的磁盤以及每個(gè)磁盤的容量。布局還維護(hù)資源的狀態(tài)（機(jī)器和磁盤）并指定主機(jī)名和端口，通過主機(jī)名和端口就能連接到數(shù)據(jù)節(jié)點(diǎn)；
分區(qū)布局：包含了分區(qū)的列表、它們的位置信息以及狀態(tài)。在 Ambry 中，分區(qū)有一個(gè)數(shù)字表示的 ID，副本的列表可以跨數(shù)據(jù)中心。分區(qū)是固定大小的資源，集群間的數(shù)據(jù)重平衡都是在分區(qū)級(jí)別進(jìn)行的。

硬件管理

Node	Disks	Size	State
DC1：NODE1	Disk_0 Disk_1 Disk_2 ...	1TB 1TB 1TB ...	Up Down Up ...
DC1：NODE2	Disk_0 Disk_1 Disk_2 ...	1TB 1TB 1TB ...	Up Down Up ...
...	...	...	...
...	...	...	...

分區(qū)管理

PartitionId	State	Replica
Partition_0	Read write	DC1:NODE1:DISK_0 DC1:NODE3:DISK_1
Partition_1	Read write	...
Partition_2	Read	...
...	...	...

數(shù)據(jù)節(jié)點(diǎn)和前端服務(wù)器都能夠訪問 clustermap，并且會(huì)始終使用它們當(dāng)前的視圖來做出決策，這些決策涉及到選擇可用的機(jī)器、過濾副本以及識(shí)別對(duì)象的位置等。

處理流程

在put操作中，分區(qū)是隨機(jī)選擇的（出于數(shù)據(jù)平衡的目的），在get/delete 操作中，分區(qū)是從blob id 中提取的

LinkedIn 開源分布式存儲(chǔ)系統(tǒng)Ambry,開源,分布式,HDFS,分布式存儲(chǔ)系統(tǒng)

為了put操作，Ambry可以配置為同步復(fù)制（確保 blob 在返回之前出現(xiàn)在多個(gè)數(shù)據(jù)節(jié)點(diǎn)上），或異步復(fù)制-同步復(fù)制可防止數(shù)據(jù)丟失，但會(huì)在寫入路徑上引入更高的延遲。

如果在異步配置中設(shè)置，分區(qū)交換日志的副本存儲(chǔ)blob及其在存儲(chǔ)中的偏移量。核對(duì)這些日志之后，彼此之間再同步傳遞blob。

LinkedIn 開源分布式存儲(chǔ)系統(tǒng)Ambry,開源,分布式,HDFS,分布式存儲(chǔ)系統(tǒng)

性能評(píng)測(cè)

根據(jù)評(píng)測(cè)報(bào)告本文評(píng)估了兩個(gè)主要領(lǐng)域：吞吐量和延遲，以及地理分布式操作。

為了測(cè)試系統(tǒng)的吞吐量和延遲（對(duì)于大規(guī)模面向用戶的低成本服務(wù)至關(guān)重要），不同大小對(duì)象的讀寫流量發(fā)送到Ambry。該系統(tǒng)能夠?yàn)檩^大對(duì)象的讀/寫提供接近等效的性能，但在許多小的讀/寫操作中達(dá)到較低的性能限制

LinkedIn 開源分布式存儲(chǔ)系統(tǒng)Ambry,開源,分布式,HDFS,分布式存儲(chǔ)系統(tǒng) 文章來源地址http://www.zghlxwxcb.cn/news/detail-765879.html

到了這里，關(guān)于LinkedIn 開源分布式存儲(chǔ)系統(tǒng)Ambry的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

對(duì)象存儲(chǔ)分布式代理-go初學(xué)者的開源練手項(xiàng)目
最近寫了一個(gè)go語言練手項(xiàng)目osproxy和osproxy-grpc，代碼已完全開源到github。相信不少接觸go語言的讀者，都是被它\\\"極簡(jiǎn)協(xié)程\\\"，“高并發(fā)”，\\\"高性能\\\"的特性所吸引，我也不例外，想著學(xué)完之后，能快速上手享受一把。但當(dāng)我看完基本語法，想找個(gè)練手項(xiàng)目時(shí)，才發(fā)現(xiàn)github上大
2024年02月08日
瀏覽(29)
Ceph分布式存儲(chǔ)系統(tǒng)
Ceph ：ceph被稱為面向未來的存儲(chǔ)還是一個(gè)分布式的存儲(chǔ)系統(tǒng)，非常靈活，如果需要擴(kuò)容，只要向ceph集中增加服務(wù)器即可。ceph存儲(chǔ)數(shù)據(jù)時(shí)采用多副本的方式進(jìn)行存儲(chǔ)，生產(chǎn)環(huán)境下，一個(gè)文件至少要存三份，ceph默認(rèn)也是三副本存儲(chǔ)。可以實(shí)現(xiàn)的存儲(chǔ)方式：塊存儲(chǔ)：提供像普通
2024年04月15日
瀏覽(34)
分布式文件存儲(chǔ)系統(tǒng)-FastDFS
? ? ? ? 前言：FastDFS 是一個(gè)分布式文件存儲(chǔ)系統(tǒng)，主要用于存儲(chǔ)和管理大規(guī)模的文件數(shù)據(jù)，如圖片、視頻、文檔等，是淘寶前架構(gòu)師為了存儲(chǔ)圖片用C語言開發(fā)出來的系統(tǒng)。 ????????服務(wù)端有兩個(gè)組件? Tracker Server 與 Storage Server ，對(duì)應(yīng)兩個(gè)角色: Tracker: 管理和調(diào)度集群
2024年02月13日
瀏覽(26)
分布式運(yùn)用——存儲(chǔ)系統(tǒng)Ceph
Ceph是一個(gè)開源的分布式存儲(chǔ)解決方案，旨在提供可擴(kuò)展性、高性能和強(qiáng)大的數(shù)據(jù)可靠性。它采用了一種分布式對(duì)象存儲(chǔ)架構(gòu)，能夠同時(shí)提供塊存儲(chǔ)和文件存儲(chǔ)的功能。本篇博客將深入探索Ceph的原理、特性和應(yīng)用場(chǎng)景，幫助讀者更好地理解和使用這一強(qiáng)大的存儲(chǔ)解決方案。
2024年02月17日
瀏覽(25)
分布式系統(tǒng)架構(gòu)設(shè)計(jì)之分布式數(shù)據(jù)存儲(chǔ)的擴(kuò)展方式、主從復(fù)制以及分布式一致性
在分布式系統(tǒng)中，數(shù)據(jù)存儲(chǔ)的擴(kuò)展是為了適應(yīng)業(yè)務(wù)的增長(zhǎng)和提高系統(tǒng)的性能。分為水平擴(kuò)展和垂直擴(kuò)展兩種方式，這兩種方式在架構(gòu)設(shè)計(jì)和應(yīng)用場(chǎng)景上有著不同的優(yōu)勢(shì)和局限性。水平擴(kuò)展是通過增加節(jié)點(diǎn)或服務(wù)器的數(shù)量來擴(kuò)大整個(gè)系統(tǒng)的容量和性能。在數(shù)據(jù)存儲(chǔ)領(lǐng)域，水平擴(kuò)
2024年02月03日
瀏覽(101)
分布式系統(tǒng)架構(gòu)設(shè)計(jì)之分布式數(shù)據(jù)存儲(chǔ)的安全隱私和性能優(yōu)化
在前面分布式系統(tǒng)部分，有對(duì)安全性做過介紹，如前面所述，在分布式系統(tǒng)中，確保系統(tǒng)的安全性和隱私是至關(guān)重要的。安全性關(guān)注系統(tǒng)的防護(hù)措施，而隱私是關(guān)注用戶的個(gè)人信息保護(hù)。身份認(rèn)證：確保用戶和系統(tǒng)組件的身份是合法的，通過通過密碼、令牌或證書實(shí)現(xiàn) 授權(quán)
2024年02月02日
瀏覽(98)
【Linux】分布式存儲(chǔ)系統(tǒng) Ceph
提示：文章寫完后，目錄可以自動(dòng)生成，如何生成可參考右邊的幫助文檔 Ceph使用C++語言開發(fā)，是一個(gè)開放、自我修復(fù)和自我管理的開源分布式存儲(chǔ)系統(tǒng)。具有高擴(kuò)展性、高性能、高可靠性的優(yōu)點(diǎn)。 Ceph目前已得到眾多云計(jì)算廠商的支持并被廣泛應(yīng)用。RedHat及OpenStack，Kubernet
2024年02月17日
瀏覽(23)
Ceph分布式存儲(chǔ)系統(tǒng)優(yōu)化分析
????????Ceph支持多種存儲(chǔ)訪問接口，現(xiàn)有的多種性能測(cè)試工具都可用于Ceph的性能測(cè)試，如測(cè)試塊接口性能的fio，iometer等；測(cè)試CephFS接口的filebench，fio等;測(cè)試對(duì)象接口的cosbench等。Ceph有專用的基準(zhǔn)測(cè)試集CBT，其包含radosbench，librbdfio，kvmrbdfio和rbdfio。radosbench基準(zhǔn)測(cè)試使用
2024年02月12日
瀏覽(22)
【Distributed】分布式Ceph存儲(chǔ)系統(tǒng)
??單機(jī)存儲(chǔ)設(shè)備大致分為三類，分別是DAS、NAS、SAN。 1.1 DAS ??DAS （直接附加存儲(chǔ)，是直接接到計(jì)算機(jī)的主板總線上去的存儲(chǔ)） ??例如 IDE、SATA、SCSI、SAS、USB 接口的磁盤。所謂接口就是一種存儲(chǔ)設(shè)備驅(qū)動(dòng)下的磁盤設(shè)備，提供塊級(jí)別的存儲(chǔ)。 1.2 NAS ??NAS （網(wǎng)絡(luò)附在存儲(chǔ)
2024年02月16日
瀏覽(26)
Hadoop：HDFS--分布式文件存儲(chǔ)系統(tǒng)
目錄 ? HDFS的基礎(chǔ)架構(gòu) VMware虛擬機(jī)部署HDFS集群 HDFS集群?jiǎn)⑼Ｃ?HDFS Shell操作 hadoop 命令體系：創(chuàng)建文件夾 -mkdir ?查看目錄內(nèi)容 -ls ?上傳文件到hdfs -put 查看HDFS文件內(nèi)容 -cat 下載HDFS文件 -get 復(fù)制HDFS文件 -cp 追加數(shù)據(jù)到HDFS文件中 -appendToFile HDFS文件移動(dòng) -mv ?刪除HDFS文件 -rm ?
2024年02月09日
瀏覽(92)

<address id="yacg3"><input id="yacg3"></input></address>

<thead id="yacg3"><div id="yacg3"><small id="yacg3"></small></div></thead>

<tfoot id="yacg3"></tfoot>