国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

論文閱讀筆記(Clover: 計算與存儲被動分離的分布式鍵值存儲系統(tǒng))

這篇具有很好參考價值的文章主要介紹了論文閱讀筆記(Clover: 計算與存儲被動分離的分布式鍵值存儲系統(tǒng))。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

關(guān)于Disaggregating Persistent Memory and Controlling Them Remotely: An Exploration of Passive Disaggregated Key-Value Stores這篇論文的筆記

原文鏈接

提出背景

傳統(tǒng)的分布式存儲系統(tǒng)中,每個節(jié)點都會包含計算和存儲兩個部分,一個節(jié)點既可以訪問本地的存儲部分也可以訪問遠(yuǎn)端的存儲部分。傳統(tǒng)的存儲部分是由SSD或者HDD組成,但隨著非易失性內(nèi)存(PM:persistent memory)的提出,越來越多的存儲系統(tǒng)采用了這種存儲介質(zhì)。形成的組織架構(gòu)如下圖所示:

論文閱讀筆記(Clover: 計算與存儲被動分離的分布式鍵值存儲系統(tǒng)),# 存儲行業(yè)趨勢研究,數(shù)據(jù)存儲

存在的問題

  • 在單個節(jié)點中,計算和存儲之間存在著處理速度方面的差異,無法發(fā)揮最佳的性能

  • 可擴展性差

  • 存在數(shù)據(jù)一致性與可靠性方面的問題

分離模式

針對傳統(tǒng)分布式存儲系統(tǒng)存在的問題,人們提出了將計算和存儲分離的模式,這種模式相比于傳統(tǒng)的模式在資源管理、可擴展性等方面表現(xiàn)得更好,現(xiàn)在的許多數(shù)據(jù)中心和云服務(wù)平臺都正在采用這種模式。

此外,有一種稱為RDMA(Remote Direct Memory Acces)的網(wǎng)絡(luò)技術(shù)正在應(yīng)用于分布式系統(tǒng)中,這種技術(shù)能夠允許跨過CPU直接訪問遠(yuǎn)端節(jié)點的內(nèi)存,因此具有低延遲和低CPU利用率的特點,采用這種技術(shù)能夠大大提高分布式系統(tǒng)的性能。

既然分離出了計算和存儲節(jié)點,那么就需要在其中一種節(jié)點上安裝管理程序以維護這個系統(tǒng),根據(jù)管理程序所在的節(jié)點,結(jié)合PM存儲介質(zhì)和RDMA傳輸技術(shù),提出了兩類模型:aDPM(active disaggregated PM)和pDPM(passive disaggregated PM)。其中,主動(active)和被動(passive)是指對數(shù)據(jù)的管理模式。

aDPM

aDPM的架構(gòu)如下圖所示

論文閱讀筆記(Clover: 計算與存儲被動分離的分布式鍵值存儲系統(tǒng)),# 存儲行業(yè)趨勢研究,數(shù)據(jù)存儲

可以看到,在aDPM中,將管理程序安裝在存儲節(jié)點,采用這種方式可以降低延遲,但是為了維持較大的網(wǎng)絡(luò)帶寬,在存儲節(jié)點需要有較高的處理能力,由此會產(chǎn)生較大能耗。此外,如果該系統(tǒng)采用了RDMA技術(shù),那么在這種情況下,需要事先通過管理層才能到達(dá)內(nèi)存,并沒有發(fā)揮RDMA直達(dá)內(nèi)存的優(yōu)點。

pDPM

由于aDPM還存在著一些不足,于是考慮將管理程序放在計算節(jié)點,從而組成了pDPM模型。pDPM的架構(gòu)如下圖所示:

論文閱讀筆記(Clover: 計算與存儲被動分離的分布式鍵值存儲系統(tǒng)),# 存儲行業(yè)趨勢研究,數(shù)據(jù)存儲

采用這種模式有效地解決了aDPM中RDMA無法發(fā)揮作用的不足,在這種模式下,只需要在存儲節(jié)點安裝支持RDMA的智能網(wǎng)卡,就能實現(xiàn)對存儲節(jié)點內(nèi)存的直接訪問。但在這種模式下,存儲節(jié)點失去了處理能力,接下來的問題就是在哪里處理與管理數(shù)據(jù)。從這點出發(fā),提出了三種模式:pDPM-Direct,pDPM-Central和Clover

pDPM-Direct

直觀的想法是在計算節(jié)點進行數(shù)據(jù)的管理,計算節(jié)點通過單向的RDMA對存儲節(jié)點進行讀寫操作,它的架構(gòu)如下所示:

論文閱讀筆記(Clover: 計算與存儲被動分離的分布式鍵值存儲系統(tǒng)),# 存儲行業(yè)趨勢研究,數(shù)據(jù)存儲

以下簡要介紹這種架構(gòu)在讀寫方面的實現(xiàn):

對于一條數(shù)據(jù),它在存儲節(jié)點中的形式是一個KV條目,每個KV條目包含已提交和未提交數(shù)據(jù),同時這些數(shù)據(jù)需要有校驗碼保證可靠性。

  • 當(dāng)進行讀操作時,讀取對于KV條目中的已提交數(shù)據(jù),并進行校驗,如果校驗失敗,需要重新讀取。

  • 當(dāng)進行寫操作時,首先對要寫的KV條目加鎖,再先后將數(shù)據(jù)寫入未提交和已提交數(shù)據(jù)中,最后釋放鎖。

可以看到,采取這種方式存在的問題有:

  • 寫操作時較慢

  • 一條數(shù)據(jù)需要復(fù)制為兩份保存,會造成空間的浪費。

pDPM-Central

pDPM-Direct采用的方式相當(dāng)于將數(shù)據(jù)的處理分散到每一個計算節(jié)點上,那么相對應(yīng)的另一種思路是將數(shù)據(jù)的處理集中在一個調(diào)度器,這個調(diào)度器位于計算節(jié)點和存儲節(jié)點之間,這就是pDPM-Central采用的方法。它的架構(gòu)如下所示:

論文閱讀筆記(Clover: 計算與存儲被動分離的分布式鍵值存儲系統(tǒng)),# 存儲行業(yè)趨勢研究,數(shù)據(jù)存儲

以下簡要介紹這種架構(gòu)在讀寫方面的實現(xiàn):

在調(diào)度器中的PM保存著一張映射表,每個條目保存的是一條數(shù)據(jù)所在的地址。

  • 當(dāng)進行讀操作時,計算節(jié)點會向調(diào)度器發(fā)送一個RPC請求,調(diào)度器會給對應(yīng)得映射表條目加鎖,然后調(diào)度器從存儲節(jié)點讀取數(shù)據(jù)并返回給計算節(jié)點,最后釋放條目上的鎖

  • 當(dāng)進行寫操作時,計算節(jié)點會向調(diào)度器發(fā)送一個RPC請求,此時調(diào)度器需要為這條數(shù)據(jù)在存儲節(jié)點中分配空間,然后調(diào)度器將數(shù)據(jù)寫入分配的空間中,最后更新內(nèi)部的映射表(需要加鎖)

可以看到,采取這種方式存在的問題有:

  • 由于中間經(jīng)過調(diào)度器,讀操作的速度下降

  • 調(diào)度器本身的CPU使用率非常高,需要處理計算節(jié)點的RPC請求、分配存儲節(jié)點的空間等

  • 調(diào)度器成為了該系統(tǒng)的一個瓶頸

Clover

Clover采取的模式是對以上兩種方式的混合,它將數(shù)據(jù)和元數(shù)據(jù)分離,分別采用不同的形式進行管理,其中對于數(shù)據(jù)的管理(稱為數(shù)據(jù)層),采用的是pDPM-Direct中的方式,即將數(shù)據(jù)的讀寫操作分散在每個計算節(jié)點中;對于元數(shù)據(jù)的管理(稱為元數(shù)據(jù)層),采用的是pDPM-Central中的方式,即將數(shù)據(jù)空間分配和垃圾回收等操作集中在一個元數(shù)據(jù)服務(wù)器(MS)中。它的架構(gòu)如下圖所示:

論文閱讀筆記(Clover: 計算與存儲被動分離的分布式鍵值存儲系統(tǒng)),# 存儲行業(yè)趨勢研究,數(shù)據(jù)存儲

數(shù)據(jù)層

對于數(shù)據(jù)層,需要完成的基本操作是數(shù)據(jù)的讀寫操作,這里采用的是一種不需要加鎖的數(shù)據(jù)結(jié)構(gòu),對于一條數(shù)據(jù)以鏈表的形式存儲,鏈表的每個結(jié)點代表的是該數(shù)據(jù)的歷史版本,不難看出,該鏈表的最后一個結(jié)點就是該數(shù)據(jù)的最新版本。同時在計算節(jié)點中保存著一個游標(biāo)(類似指針),代表的是上一次訪問該條數(shù)據(jù)時的版本(不一定是最新的)。

  • 當(dāng)進行讀操作時,根據(jù)計算節(jié)點中的游標(biāo)找到該條數(shù)據(jù)對應(yīng)鏈表中的位置,從該位置開始遍歷直至找到鏈表末尾,得到該條數(shù)據(jù)的最新版本。

  • 當(dāng)進行寫操作時,需要在存儲節(jié)點對應(yīng)數(shù)據(jù)條目中添加一個新的結(jié)點,如果該鏈表只有一個結(jié)點,說明是新創(chuàng)建的數(shù)據(jù),只需要在計算節(jié)點中添加新的指向該結(jié)點的游標(biāo);如果鏈表有多個結(jié)點,說明是對數(shù)據(jù)的更新,將代表上一版本的結(jié)點指向新創(chuàng)建的結(jié)點,最后更新執(zhí)行寫操作的計算節(jié)點中的游標(biāo)。

可以看到,在讀操作中當(dāng)遇到鏈表很長而游標(biāo)指向的歷史版本過早時,存在遍歷時間過長的情況。因此可以采取一種優(yōu)化措施,在存儲節(jié)點內(nèi)部保存一類稱為捷徑(shortcut)的指針,它們會指向?qū)?yīng)數(shù)據(jù)條目中盡量新的版本結(jié)點。在實際應(yīng)用時,會并行采取遍歷鏈表和使用捷徑指針的方式,直到其中一種方式獲得最新的數(shù)據(jù)。

數(shù)據(jù)層的組織形式如下圖所示:

論文閱讀筆記(Clover: 計算與存儲被動分離的分布式鍵值存儲系統(tǒng)),# 存儲行業(yè)趨勢研究,數(shù)據(jù)存儲

元數(shù)據(jù)層

對于元數(shù)據(jù)層,它只與計算節(jié)點進行通信,進行空間管理、垃圾回收、負(fù)載均衡等操作。

對于空間分配的操作,在MS中將空閑空間打包為一個塊(chunk),每個塊的大小和數(shù)據(jù)緩沖區(qū)的大小一致,不同的塊會有不同的大小,這些塊會組成一個空閑隊列。當(dāng)計算節(jié)點需要進行寫操作時,會在后臺向MS請求分配一個對應(yīng)的塊,MS會在空閑隊列中將這個塊發(fā)送給計算節(jié)點。

對于垃圾回收操作,在寫完成之后,計算節(jié)點可能需要淘汰一些歷史版本結(jié)點,因此后臺會給MS發(fā)送回收請求,收到回收請求的MS會將原來分配出去的塊重新放回空閑隊列中。

以上操作的組織形式如下圖所示:

論文閱讀筆記(Clover: 計算與存儲被動分離的分布式鍵值存儲系統(tǒng)),# 存儲行業(yè)趨勢研究,數(shù)據(jù)存儲

對于數(shù)據(jù)可靠性與負(fù)載均衡,一個數(shù)據(jù)條目的歷史版本的副本可能存在于不同的存儲節(jié)點上,一個版本結(jié)點可以指向多個下一版本結(jié)點,盡管它們存在不同的存儲節(jié)點。大致思路如下圖所示:

論文閱讀筆記(Clover: 計算與存儲被動分離的分布式鍵值存儲系統(tǒng)),# 存儲行業(yè)趨勢研究,數(shù)據(jù)存儲

小結(jié)

在以上三種pDPM模型中,Clover嘗試結(jié)合另外兩種模型的優(yōu)點,經(jīng)過實驗證明Clover的確具有讀寫延遲低、能耗低、成本低等優(yōu)點,但也存在大量寫沖突情況下性能變差的問題??傊?,在設(shè)計分布式存儲系統(tǒng)時可以考慮采用pDPM中的Clover模型。文章來源地址http://www.zghlxwxcb.cn/news/detail-727613.html

到了這里,關(guān)于論文閱讀筆記(Clover: 計算與存儲被動分離的分布式鍵值存儲系統(tǒng))的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 基于區(qū)塊鏈的分布式存儲系統(tǒng)開發(fā)論文研究

    基于區(qū)塊鏈的分布式存儲系統(tǒng)開發(fā)論文研究

    論文引用:[1]蔡維德,郁蓮,王榮,劉娜,鄧恩艷.基于區(qū)塊鏈的應(yīng)用系統(tǒng)開發(fā)方法研究[J].軟件學(xué)報,2017,28(06):1474-1487. 1. 區(qū)塊鏈介紹 ??區(qū)塊鏈?zhǔn)怯啥嗒毩⒐?jié)點參與的分布式數(shù)據(jù)系統(tǒng),也可以理解為分布式賬簿(distributed ledger technologt,簡稱DLT),由這些節(jié)點共同維護,它的特點是

    2024年02月12日
    瀏覽(98)
  • 云存儲、云計算與分布式存儲、分布式計算是一回事嗎?

    云存儲、云計算與分布式存儲、分布式計算是一回事嗎?

    隨著互聯(lián)網(wǎng)的蓬勃興起,大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)、云計算與云存儲等這些專業(yè)詞匯在大眾視野內(nèi)出現(xiàn)的頻率越來越高,再加上近幾年分布式技術(shù)異軍突起,更使得分布式存儲、分布式計算等成為熱詞。然而,很多人對這些名詞都一知半解,所以本文將主要和大家聊一聊,

    2024年01月25日
    瀏覽(30)
  • 【ElasticSearch】 ElasticSearch serverless架構(gòu)介紹(查詢寫入分離,計算存儲分離)

    【ElasticSearch】 ElasticSearch serverless架構(gòu)介紹(查詢寫入分離,計算存儲分離)

    ElasticSearch 推出了全新的serverless架構(gòu),將查詢(search)和寫入(indexing)分離,將計算(computing)和存儲(storage)分離,極大提高了 ES 的可運維性,降低了學(xué)習(xí)成本。本文將先介紹下serverless含義,再介紹ElasticSearch serverless架構(gòu)。 在serverless架構(gòu)下,用戶只需關(guān)注業(yè)務(wù)邏輯,無需管理服務(wù)

    2024年01月24日
    瀏覽(23)
  • 論文閱讀:Vary論文閱讀筆記

    論文閱讀:Vary論文閱讀筆記

    論文:Vary: Scaling up the Vision Vocabulary for Large Vision-Language Models Paper | Github | Demo 許久不精讀論文了,內(nèi)心一直想找個專門的時間來細(xì)細(xì)品讀自己感興趣的論文。現(xiàn)在想來,無異于是自己騙自己了,因為根本就不存在那個專門的時間。所以改變最好的時候就是現(xiàn)在。 因為自己一

    2024年01月19日
    瀏覽(21)
  • 存儲、計算、分布式存儲篇(收集整理適合小白)

    存儲、計算、分布式存儲篇(收集整理適合小白)

    存儲分類 塊存儲 需要格式化,將文件直接保存到磁盤上 文件存儲 應(yīng)用程序通過調(diào)用操作系統(tǒng)將文件保存到塊存儲進行持久化 Object對象存儲 基于對象的存儲,也可以被稱為云存儲,在對象存儲系統(tǒng)中,文件沒有多層級的文件結(jié)構(gòu),而是以存儲空間的概念,文件被拆分為多個

    2024年02月05日
    瀏覽(24)
  • 論文閱讀:Vary-toy論文閱讀筆記

    論文閱讀:Vary-toy論文閱讀筆記

    論文:Small Language Model Meets with Reinforced Vision Vocabulary Paper | Github | Demo 說來也巧,之前在寫論文閱讀:Vary論文閱讀筆記文章時,正好看到了Vary-toy剛剛發(fā)布。 這次,咱也是站在了時代的前沿,這不趕緊先睹為快。讓我看看相比于Vary,Vary-toy做了哪些改進? 從整體結(jié)構(gòu)來看,仍

    2024年01月25日
    瀏覽(24)
  • 云計算基礎(chǔ)-存儲虛擬化(深信服aSAN分布式存儲)

    云計算基礎(chǔ)-存儲虛擬化(深信服aSAN分布式存儲)

    分布式存儲是利用虛擬化技術(shù) “池化”集群存儲卷內(nèi)通用X86服務(wù)器中的本地硬盤,實現(xiàn)服務(wù)器存儲資源的統(tǒng)一整合、管理及調(diào)度,最終向上層提供NFS、ISCSI存儲接口,供虛擬機根據(jù)自身的存儲需求自由分配使用資源池中的存儲空間。 每秒鐘的IOPS數(shù),該指標(biāo)主要用于評價小塊

    2024年02月19日
    瀏覽(17)
  • 字節(jié)跳動 ByteHouse 云原生之路 – 計算存儲分離與性能優(yōu)化

    字節(jié)跳動 ByteHouse 云原生之路 – 計算存儲分離與性能優(yōu)化

    01 起源 ByteHouse 的故事從字節(jié)跳動對于先進數(shù)據(jù)處理和分析的需求開始,這一需求隨著公司業(yè)務(wù)規(guī)模的迅速擴張而日益增長,起源是對開源數(shù)據(jù)庫管理系統(tǒng) ClickHouse 的改造和增強。面對數(shù)據(jù)處理的高延遲、大規(guī)模數(shù)據(jù)操作的復(fù)雜性以及數(shù)據(jù)存儲和處理成本的上升,字節(jié)跳動的

    2024年01月21日
    瀏覽(20)
  • Ceph分布式存儲筆記

    Ceph分布式存儲筆記

    1、Ceph概念 分布式存儲 是指一種獨特的系統(tǒng)架構(gòu),它由一組網(wǎng)絡(luò)進行通信、為了完成共同的任務(wù)而協(xié)調(diào)工作的計算機節(jié)點組成;分布式系統(tǒng)是為了用廉價的、普通的機器完成單個計算無法完成的計算、存儲任務(wù);其目的是利用更多的機器,處理更多的數(shù)據(jù)。 Ceph是一個統(tǒng)一【

    2023年04月08日
    瀏覽(40)
  • [論文閱讀筆記18] DiffusionDet論文筆記與代碼解讀

    [論文閱讀筆記18] DiffusionDet論文筆記與代碼解讀

    擴散模型近期在圖像生成領(lǐng)域很火, 沒想到很快就被用在了檢測上. 打算對這篇論文做一個筆記. 論文地址: 論文 代碼: 代碼 首先介紹什么是擴散模型. 我們考慮生成任務(wù), 即encoder-decoder形式的模型, encoder提取輸入的抽象信息, 并嘗試在decoder中恢復(fù)出來. 擴散模型就是這一類中的

    2023年04月08日
    瀏覽(26)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包