国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【論文閱讀】The Design of a Practical System for Fault-Tolerant Virtual Machines

這篇具有很好參考價值的文章主要介紹了【論文閱讀】The Design of a Practical System for Fault-Tolerant Virtual Machines。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

為了更有效的做論文閱讀筆記,之后都打算將每篇論文筆記的內(nèi)容控制在較少的字?jǐn)?shù)范圍內(nèi),畢竟原論文擺在那里,將其翻譯照抄過來也沒什么意思,將論文讀薄才是最重要的。( ?? ω ?? )?

"The Design of a Practical System for Fault-Tolerant Virtual Machines"是MIT6.824推薦閱讀的論文之一,它介紹了一種通過主備機制來進行單核虛擬機級別的容錯方法。

相關(guān)背景

本文考慮的主要是fail-stop故障,例如電源線拔掉了,爆炸了,網(wǎng)絡(luò)離線了等情況,而這也才能用復(fù)制的方法容錯,普通的程序錯誤導(dǎo)致的故障也無法通過復(fù)制來解決。

容錯一般有兩種方法:

  1. **狀態(tài)轉(zhuǎn)移:**拷貝主虛擬機的所有狀態(tài)到另一個虛擬機上
  2. **復(fù)制狀態(tài)機:**將虛擬機認為是一個狀態(tài)機,只拷貝具體的操作

明顯復(fù)雜狀態(tài)機對寬帶要求更低,但是其設(shè)計更為復(fù)雜,本文采用的是復(fù)制狀態(tài)機的方法。但是后面VMWare團隊有推出多核虛擬機級別的容錯,該方法采用的是類似狀態(tài)轉(zhuǎn)移的方法。

容錯一般還可以分為應(yīng)用層容錯和主機層容錯,本文是主機層,在這有容錯的虛擬機上可以運行任何應(yīng)用。

設(shè)計概述

【論文閱讀】The Design of a Practical System for Fault-Tolerant Virtual Machines,論文閱讀,分布式

設(shè)計主要解決的問題是如何保證兩個VM的狀態(tài)一直保持一致。兩個主副VM之間會通過Logging channel進行連接,主VM會將其任何會導(dǎo)致兩者狀態(tài)不一致的命令或者非確定性事件命令都通過Logging channel發(fā)送給副VM,副VM會讀取該channel來執(zhí)行相同的操作,但是該執(zhí)行的輸出會被忽略掉。

傳遞指令需要特別注意的是一些非確定性事件,該事件主要有兩類分別是隨時到達的客戶端輸入和在不同時刻不同的VM上會產(chǎn)生不同的結(jié)果的怪異指令,例如生成隨機數(shù)、獲取當(dāng)前時間、獲取主機id等。

非確定性事件還包括CPU并發(fā),因為指令交織的順序難以保證,例如兩個并發(fā)的線程同時向一塊數(shù)據(jù)加鎖,那么主副VM上哪個線程能拿到鎖其實是不確定的,但是本文是針對單CPU的,沒有提及這個問題

可以猜測傳遞的日志中主要有三樣?xùn)|西:

  1. 事件發(fā)生時的指令序號,即自機器啟動以來指令的相對序號
  2. 日志類型
  3. 數(shù)據(jù),如果是網(wǎng)絡(luò)數(shù)據(jù)包日志,那么就包含對應(yīng)的數(shù)據(jù),如果是怪異指令,那么就是其在主虛擬機上執(zhí)行的結(jié)果

需要注意的是為了保證副VM的執(zhí)行不會超過主VM,副VM只有的channel里面有指令的時候才會繼續(xù)運行,即副VM永遠會落后主VM一個指令,不然就會一直停止等待,或者檢測到主VM掛了,自己上臺當(dāng)主VM

輸出控制

系統(tǒng)通過網(wǎng)絡(luò)數(shù)據(jù)包來與用戶進行交互,文章的目標(biāo)是讓用戶接收到返回信息時該指令一定是在兩個VM上都能執(zhí)行了的,它避免的是如下的場景:

  • 主虛擬機給了用戶返回,但是由于其馬上crash了,沒有將指令及時傳給副VM,那么后面通過副VM上臺時,該命令其實是沒執(zhí)行的,但是用戶會以為其已經(jīng)執(zhí)行了

【論文閱讀】The Design of a Practical System for Fault-Tolerant Virtual Machines,論文閱讀,分布式

解決方法是:主VM輸出返回必須要在發(fā)送了日志且副VM返回了確認接收之后

當(dāng)然這也有可能會導(dǎo)致重復(fù)輸出,因為主VM輸出后馬上奔潰,而副VM上臺后還沒有執(zhí)行這個命令,那么后面再執(zhí)行時就會導(dǎo)致重復(fù)輸出,而文中提到由于有TCP的規(guī)則在,由于輸出的是完全一致的數(shù)據(jù)包,該重復(fù)輸出會被TCP的協(xié)議解決掉。

容錯

主副VM之間需要知道對方有沒有存活,文中使用了UDP心跳來檢測服務(wù)器是否奔潰,此外也通過監(jiān)控日志流量(因為定時器中斷的存在,日志流量應(yīng)該是有規(guī)律的)來探查,如果超過特點時間,就可能發(fā)生故障了,但是這依然會存在腦裂的問題,如果只是兩個VM之間的網(wǎng)絡(luò)出問題了,那么副VM如果這時上臺就會出現(xiàn)兩個主VM。文中采用的解決方案是通過Test-and-Set方案,它會在共享存儲中執(zhí)行一個原子性的測試設(shè)置操作。如果操作成功,VM就會被允許上線,如果不成功就說明另外一個還在運行。如果采用的不是共享存儲,那么也會引入一個第三方的決策者來進行判斷。

如果是副VM奔潰了,則會重新起一個副VM,該VM來自對主VM的完全拷貝。

同時為了保證容錯的副VM上臺后,不會需要太長時間才能把剩余的命令消費掉,已經(jīng)為了防止channel的緩沖區(qū)被填滿,副VM會和主VM保持一定的指令數(shù)間隔,文中提到執(zhí)行延遲應(yīng)不小于100ms,如果副VM跟不上主VM的處理速度,系統(tǒng)會分配給主VM更少的Cpu周期數(shù)來平衡兩者的速度。文章來源地址http://www.zghlxwxcb.cn/news/detail-779724.html

參考資料

  • https://pdos.csail.mit.edu/6.824/papers/vm-ft.pdf
  • https://zhuanlan.zhihu.com/p/523109983
  • https://pdos.csail.mit.edu/6.824/notes/l-vm-ft.txt
  • https://mit-public-courses-cn-translatio.gitbook.io/mit6-824/lecture-04-vmware-ft

到了這里,關(guān)于【論文閱讀】The Design of a Practical System for Fault-Tolerant Virtual Machines的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • [論文閱讀]Coordinate Attention for Efficient Mobile Network Design

    [論文閱讀]Coordinate Attention for Efficient Mobile Network Design

    ??最近關(guān)于移動網(wǎng)絡(luò)設(shè)計的研究已經(jīng)證明了通道注意力(例如, the Squeeze-and-Excitation attention)對于提高模型的性能有顯著的效果,但它們通常忽略了位置信息,而位置信息對于生成空間選擇性注意圖非常重要。在本文中,我們提出了一種新的移動網(wǎng)絡(luò)注意力機制,將位置信息

    2024年02月07日
    瀏覽(27)
  • On the Spectral Bias of Neural Networks論文閱讀

    On the Spectral Bias of Neural Networks論文閱讀

    眾所周知,過度參數(shù)化的深度神經(jīng)網(wǎng)絡(luò)(DNNs)是一種表達能力極強的函數(shù),它甚至可以以100%的訓(xùn)練精度記憶隨機數(shù)據(jù)。這就提出了一個問題,為什么他們不能輕易地對真實數(shù)據(jù)進行擬合呢。為了回答這個問題,研究人員使用傅里葉分析來研究深層網(wǎng)絡(luò)。他們證明了具有有限權(quán)值

    2024年02月22日
    瀏覽(26)
  • [論文閱讀]A ConvNet for the 2020s

    [論文閱讀]A ConvNet for the 2020s

    視覺識別的咆哮的20年代開始于ViTs的引入,它很快取代了卷積神經(jīng)網(wǎng)絡(luò),成為最先進的圖像分類模型。另一方面,一個原始的ViT在用于一般的比如目標(biāo)識別和語義分割的計算機視覺任務(wù)的時候面臨困難。層次Transformer(例如,Swin-Transformer),它重新引入了幾個卷積神經(jīng)網(wǎng)絡(luò)先驗

    2024年02月07日
    瀏覽(21)
  • 【論文閱讀筆記】Endoscopic navigation in the absence of CT imaging

    ??上一篇的導(dǎo)航導(dǎo)論,是需要先驗,也就是需要事先拍攝堆疊的圖片(比如CT圖等),在體外構(gòu)建相應(yīng)的3D模型,再與內(nèi)窺鏡圖像進行實時匹配。對于很多情況來說,是無法擁有如此充足的先驗的。所以,本文探索的是沒有額外CT圖像的一個內(nèi)窺鏡導(dǎo)航算法,應(yīng)用場景是鼻腔

    2024年02月11日
    瀏覽(25)
  • Mantle: A Programmable Metadata Load Balancer for the Ceph File System——論文泛讀

    Mantle: A Programmable Metadata Load Balancer for the Ceph File System——論文泛讀

    SC 2015 Paper?元數(shù)據(jù)論文閱讀匯總 優(yōu)化Ceph的元數(shù)據(jù)局部性和負載平衡。 提高元數(shù)據(jù)服務(wù)性能的最常見技術(shù)是在專用的元數(shù)據(jù)服務(wù)器(MDS)節(jié)點之間平衡負載 [16, 25, 26, 21, 28]。常見的方法是鼓勵獨立增長并減少通信,使用諸如懶惰客戶端和MDS同步 [16, 18, 29, 9, 30]、inode路徑/權(quán)限

    2024年01月16日
    瀏覽(23)
  • 【操作系統(tǒng)】在閱讀論文:OrcFS: Orchestrated file system for flash storage時需要補充的基礎(chǔ)知

    【操作系統(tǒng)】在閱讀論文:OrcFS: Orchestrated file system for flash storage時需要補充的基礎(chǔ)知

    在閱讀論文:OrcFS: Orchestrated file system for flash storage是需要補充的基礎(chǔ)知識 這篇論文是為了解決軟件層次之間的信息冗余問題 To minimize the disk traffic, the file system buffers the updates and then flushes them to the disk as a single unit, a segment (e.g.,2Mbyte), either when the buffer is full or when fsync() is ca

    2024年02月01日
    瀏覽(22)
  • [論文閱讀]4DRadarSLAM: A 4D Imaging Radar SLAM System for Large-scale Environments

    [論文閱讀]4DRadarSLAM: A 4D Imaging Radar SLAM System for Large-scale Environments

    ? 目錄 ? 1.摘要和引言: 2. 系統(tǒng)框架: 2.1 前端: 2.2 回環(huán)檢測: 2.3 后端: 3.實驗和分析: 4.結(jié)論 1.摘要和引言: 這篇論文介紹了一種名為“4DRadarSLAM”的新型4D成像雷達SLAM系統(tǒng),旨在提高大規(guī)模環(huán)境下的定位與地圖構(gòu)建性能。與傳統(tǒng)的基于激光雷達的SLAM系統(tǒng)相比,該系統(tǒng)

    2024年01月23日
    瀏覽(21)
  • [論文閱讀&代碼]DehazeNet: An End-to-End System for Single Image Haze Removal

    [論文閱讀&代碼]DehazeNet: An End-to-End System for Single Image Haze Removal

    現(xiàn)有的單圖像去霧方法使用很多約束和先驗來獲得去霧結(jié)果,去霧的關(guān)鍵是根據(jù)輸入的霧圖獲得得到介質(zhì)傳輸圖(medium transmission map) 這篇文章提出了一種端到端的可訓(xùn)練的去霧系統(tǒng)—Dehaze Net,用于估計介質(zhì)傳輸圖 Dehaze Net中,輸入為霧圖,輸出為介質(zhì)傳輸圖,隨后通過大氣散

    2024年02月08日
    瀏覽(18)
  • 論文閱讀筆記A Systematic Review of the State of Cyber-Security in Water Systems

    論文閱讀筆記A Systematic Review of the State of Cyber-Security in Water Systems

    該論文主要回顧了水系統(tǒng)的網(wǎng)絡(luò)安全研究,研究重點是提高供水、廢水收集和處理系統(tǒng)的安全性 一、 Introduction 過去的供水系統(tǒng)安全:通過隔離、限制對控制組件的訪問來實現(xiàn)的。 基于IoT的供水系統(tǒng):依靠連接多層網(wǎng)絡(luò)物理系統(tǒng)來促進自主去中心化決策,并改善實時數(shù)據(jù)和預(yù)

    2024年02月04日
    瀏覽(23)
  • 論文閱讀:TinySAM: Pushing the Envelope for Efficient Segment Anything Model-文章內(nèi)容閱讀

    論文閱讀:TinySAM: Pushing the Envelope for Efficient Segment Anything Model-文章內(nèi)容閱讀

    論文標(biāo)題: TinySAM: 極致高效的分割一切模型 論文地址:https://arxiv.org/pdf/2312.13789.pdf 代碼地址(pytorch):https://github.com/xinghaochen/TinySAM 詳細論文解讀:TinySAM:極致高效壓縮,手機就能實時跑的分割一切模型 - 知乎 (zhihu.com)? 目錄 文章內(nèi)容解析 ?概括 文章的觀點 技術(shù)創(chuàng)新解

    2024年01月17日
    瀏覽(24)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包