第三章 云存儲習題
3.1 選擇題
1、SAN是一種(B)。
A. 存儲設備?? ???????????????????????? B. 專為數據存儲而設計和構建的存儲網絡系統(tǒng)
C. 光纖交換機??? ??????????????????? D. HBA
2、在GFS中,客戶端可以并行訪問多個(C),提高了系統(tǒng)的整體性能。
A. 客戶端 ??????????????B. 主服務器? ???????????C. 數據塊服務器?? ????D. 控制節(jié)點
3、分布式文件系統(tǒng)的性能要求主要包括(D)。
A. 高效率、高可靠性?? B. 高可擴展性、透明性 ???C. 自治性?? D. 以上都是
4、根據不同的存儲方法,(B)方式不屬于副本部署策略。
A. 路徑部署 ????????????B. 重建部署??? ?????????C. 源請求部署??? ????????D. 隨機部署
5、副本數量的確定與(D)因素有關。
A. 副本屬性? ???????????B. 系統(tǒng)環(huán)境?? ??????????C. 訪問情況?? ??????????????D. 以上都是
6、目前決定副本數量的主要方法不包括(A)。
A. 隨機復制 ?????????????B. 比例復制? ???????????C. 方根復制?? ??????????????D. 均勻復制
7、副本刪除發(fā)生的原因主要包括(D)。
A. 副本的生命周期結束?????????????????? ?????????????????????????????????? B. 副本被訪問頻率低
C. 副本所在節(jié)點存儲空間不夠或處理能力達到極限 ?????????? D. 以上都是
8、以下不屬于靜態(tài)副本管理策略的優(yōu)點的是(B)。
A. 復制方案固定?? ???????????????????????? ?B. 可對文件訪問模式和訪問節(jié)點的范圍進行預測??
C. 簡化后期副本管理的復雜性?? ??? ?D. 結構簡單
9、以下不屬于集中式副本管理策略的優(yōu)點的是(A)。
A. 文件副本的數量快速增加?? ????????????? B. 全盤了解整個云存儲系統(tǒng)
C. 快速知道任意節(jié)點及副本的狀態(tài)情況?? ??? D. 結構簡單
10、以下關于分布式副本管理策略描述錯誤的是(C)。
A. 將整個云存儲系統(tǒng)的副本管理分布在各個存儲節(jié)點上?? ????????????????????
B. 各個存儲節(jié)點之間可采用類似心跳機制進行通信
C. 隨著文件副本的數量不斷增加,其負載會急劇增加?? ???
D. 維護存儲節(jié)點間通信所花費的代價較大
11、Paxos云存儲系統(tǒng)中的主要角色不包括(C)。
A. 提議者?? ?????????????????B. 決策者 ????????????????C. 執(zhí)行者 ?????????????D. 學習者
12、以下關于S3的數據存儲結構描述錯誤的是(B)。
A. 包含存儲桶和存儲對象???????????????
B. 存儲桶是S3中對數據進行排序的唯一方法
C. 每個存儲對象都必須存儲在一個存儲桶中?? ???
D. 存儲桶的名稱唯一
13、S3的性能優(yōu)勢包括(D)。
A. 持久性和可用性?? ??????????????????????????? B. 彈性和可擴展性
C. 高數據訪問速度和用戶接口簡單?? ?? D. 以上都是
14、云存儲系統(tǒng)的網絡架構中,主要由(A)承擔存儲數據文件的任務。
A. 存儲節(jié)點? ????????B. 控制節(jié)點? ????????C. 任務節(jié)點?? ??????D. 數據節(jié)點
15、Paxos算法用于解決分布式系統(tǒng)中的(C)問題。
A. 副本部署? ???????B. 副本數量控制?? ?C. 數據一致性? ???D. 副本刪除
3.2 填空題
1、云存儲將網絡中大量存儲設備通過(集群系統(tǒng))、(虛擬化技術)或(分布式文件系統(tǒng))等組織起來。
2、云存儲在本質上不僅是一種存儲(技術),還是一種(服務)。
3、云存儲模型自底向上可劃分為(存儲層)、(管理調度層)、(應用接口層)和(訪問層)。
4、目前的網絡存儲主要包含(網絡連接存儲 / NAS)和(存儲區(qū)域網絡/ SAN)這兩種類型。
5、目前存在兩種數據復制模式分別是(同步復制模式)和(異步復制模式)。
6、在云存儲系統(tǒng)中,副本管理機制的主要內容包括(副本部署)、(副本數量控制)、(數據一致性保障)、(副本刪除)等機制。
7、隨機部署方法中選擇整個網絡的節(jié)點的隨機選擇法可運用(多哈希函數)和(關聯哈希)等方法來實現。
3.3 簡答題
1、請描述云存儲系統(tǒng)的主要優(yōu)勢。
答:
- 低成本。用戶采用云存儲服務,無須自行購置存儲軟硬件系統(tǒng),也無須自行運營、維護、災備恢復等,從而顯著降低數據存儲的成本。
- 高安全性。專業(yè)的云服務提供商提供的數據存儲服務,廣泛采用數據副本和備份機制,使業(yè)務相關數據的存儲變得更加安全、可靠;數據在傳輸過程中也可以得到有效保護,傳輸更穩(wěn)定。
- 易擴展。從用戶的角度來看,用戶無須預測將來對存儲空間的需求,可按需動態(tài)申請存儲空間,云服務提供商一般采用按需計費的存儲空間租賃服務政策;從系統(tǒng)的角度來看,云存儲系統(tǒng)本身也可動態(tài)擴展存儲資源池,當新的存儲節(jié)點添加到系統(tǒng)時,會自動實現資源擴展。
- 豐富接口。目前的商用云存儲系統(tǒng)一般都提供了豐富的應用程序接口(API),為用戶及應用提供了便捷的開發(fā)與運行平臺。
- 支持同步?;谠拼鎯ζ脚_,用戶可以在多臺設備(如筆記本電腦、平板電腦、智能手機、智能手表等)之間實現數據、程序、狀態(tài)的同步,從而為多設備協同提供支持。
- 災備恢復。網絡備份一般是通過專業(yè)的數據存儲管理軟件結合相應的硬件和存儲設備來實現的,云存儲基于多數據中心平臺,云計算數據中心通過互聯網將數據副本存儲在異地的云計算數據中心中,即搬遷數據異地備份,一旦發(fā)生地震、洪水等巨大災害,也能實現災備恢復。
2、請簡述GFS系統(tǒng)中三類節(jié)點。
答:
- 客戶端??蛻舳耸荊FS提供給應用程序的訪問接口,是一組專用接口,以庫文件的形式提供,應用程序可直接調用這些庫函數。
- 主服務器。主服務器是GFS的管理節(jié)點,在邏輯上只有一個,用于保存系統(tǒng)的元數據,負責整個文件系統(tǒng)的管理。
- 數據塊服務器。數據塊服務器負責具體的存儲工作,數據以文件的形式存儲在數據塊服務器上,數據塊服務器的數目直接決定了GFS系統(tǒng)的規(guī)模。GFS將文件按照預設的大小進行分塊,每一塊稱為一個數據塊(Chunk),每個數據塊都有一個對應的索引號(Index)。
3、與傳統(tǒng)的分布式文件系統(tǒng)相比,GFS文件系統(tǒng)根據搜索等應用的特點進行了哪些方面的優(yōu)化?
答:
- 中心化管理模式。GFS采用中心化管理模式對整個文件系統(tǒng)進行管理,簡化了設計,降低了實現難度。主服務器管理分布式文件系統(tǒng)中所有的元數據,維護一個命名空間,在系統(tǒng)添加一個新的數據塊服務器非常容易,數據塊服務器只需要在主服務器上注冊即可。當然,中心化管理模式也有一些固有的缺點,如主服務器可能成為整個系統(tǒng)的性能瓶頸等。
- 不緩存數據。緩存機制是提高文件系統(tǒng)性能的重要手段。為了提高文件系統(tǒng)的性能,有必要實現緩存機制。然而,GFS文件系統(tǒng)沒有進行緩存,主要是因為Google認為大多數應用程序的讀寫都是按流的順序進行的,重復讀寫的頻率不高,不緩存數據對系統(tǒng)的整體性能影響并不大;對于頻繁讀取的數據,數據塊服務器則可利用本地操作系統(tǒng)的文件系統(tǒng)緩存機制來優(yōu)化性能。
- 基于用戶模式。根據應用程序對系統(tǒng)資源和機器指令的使用權限,可以將處理器設置為不同的模式,如內核模式與用戶模式,處于不同模式的CPU允許執(zhí)行的指令集合不一樣,這和操作權限密切相關。在內核模式下,CPU既可以執(zhí)行特權指令,也可以執(zhí)行非特權指令;在用戶模式下,CPU只允許執(zhí)行非特權指令。GFS的管理與工作進程都運行在用戶模式下,單個進程不會影響整個操作系統(tǒng),從而提升了整個系統(tǒng)的穩(wěn)定性。GFS和操作系統(tǒng)在不同的空間運行,盡量采用松耦合,提升了彼此的通用性,便于GFS和內核的單獨升級。
- 提供專用API。GFS提供了專用API,API以庫文件的形式提供,應用程序通過調用這些API來完成對GFS文件系統(tǒng)的訪問。專用API可以根據應用程序的屬性為應用程序提供個性化的支持。應用程序通過專用API直接與客戶端、主服務器、數據塊服務器交互,更為簡單、便捷。
- 提供容錯機制。GFS中主服務器存儲三種類型的GFS元數據,包括命名空間(整個文件系統(tǒng)的目錄結構)、數據庫和文件名的映射表、數據庫副本位置信息。為了防止主服務器完全崩潰導致命名空間等數據的丟失,GFS提供了主服務器的遠程實時備份;GFS主要使用副本來實現數據塊服務器的容錯,多個相同的數據副本分布在不同的數據塊服務器上,在寫入或修改數據時所有副本都必須成功寫入才能視為操作成功。
- 提供系統(tǒng)管理機制。作為分布式文件系統(tǒng),GFS由相應的系統(tǒng)管理機制支持整個GFS的應用。GFS是一種構建大規(guī)模集群之上的文件系統(tǒng),節(jié)點數量眾多。這些節(jié)點常出現故障,需要集群監(jiān)控技術來在盡可能短的時間內找到并確定發(fā)生故障的節(jié)點和原因。當增加一個新的數據塊服務器時,GFS支持節(jié)點的動態(tài)加入和系統(tǒng)擴展。
4、分布式文件系統(tǒng)的透明性主要指哪些方面?
答:
- 位置透明性。在具有位置透明性的分布式文件系統(tǒng)中,用戶看到的是全局名字空間,用戶訪問文件不需要知道文件的物理存儲位置,在創(chuàng)建文件時,分布式文件系統(tǒng)自動選擇合適的存儲位置。
- 故障透明性。當部分服務器出現故障、離線或網絡不可用時,分布式文件系統(tǒng)必須為用戶提供持續(xù)的存儲服務,讓用戶不會感知到內部的服務器故障。
- 遷移透明性。在文件和目錄的物理存儲位置改變時不需要改變名字,甚至在數據遷移過程中,數據仍然是可訪問的。
- 副本透明性。分布式文件系統(tǒng)通常在不同節(jié)點上保存同一文件的多個副本,用戶不必知道文件副本細節(jié),副本的產生、分布和訪問都是自動的[17]。
- 并發(fā)透明性。具有并發(fā)透明性的分布式文件系統(tǒng)能夠保證并發(fā)的用戶文件訪問之間不會發(fā)生沖突,解決了共享文件的讀寫一致性問題。
5、請對比分析云存儲系統(tǒng)中的集中式副本管理策略和分布式副本管理策略。
答:
- 集中式副本管理策略。集中式副本管理策略是一種典型的索引節(jié)點策略,在云存儲系統(tǒng)中會把所有的文件的元數據信息集中起來,方便管理。其中針對元數據節(jié)點的操作包括系統(tǒng)對副本的創(chuàng)建、布局以及副本的放置位置。集中式管理策略的優(yōu)點是對整個云存儲系統(tǒng)有全盤的了解,可以快速知道任意節(jié)點及副本的狀態(tài)情況,但其缺點也非常明顯,隨著文件副本的數量不斷增加,作為獨立出來的中心節(jié)點,其負載會急劇增加,容易成為云存儲系統(tǒng)的性能瓶頸。
- 分布式副本管理策略。分布式副本管理策略將整個云存儲系統(tǒng)的副本管理分布在各個存儲節(jié)點上。各個存儲節(jié)點之間可采用類似心跳機制進行通信,從而指導相互連接的存儲節(jié)點之間的信息來協同完成的副本管理。分布式副本管理策略對各個存儲節(jié)點的性能有一定的要求,雖然沒有集中式副本管理策略的性能瓶頸,但是維護存儲節(jié)點間通信所花費的代價較大,增加了網絡的通信成本。
6、數據備份應用于容災系統(tǒng)時需要考慮的主要問題有哪些?
答:
- 備份窗口。備份窗口是指應用程序允許完成數據備份作業(yè)的時間。由于數據備份作業(yè)會導致主機的性能下降,甚至使服務水平不可接受,因此數據備份作業(yè)必須在停機或業(yè)務量較小時進行。典型的解決途徑包括加快備份速度和實現在線備份等。
- 恢復時間。備份數據的恢復時間直接關系到容忍業(yè)務停止服務的最長時間,當備份數據量較大或者備份策略比較復雜時,備份數據往往需要較長的恢復時間。
- 備份間隔。鑒于數據備份作業(yè)對主機系統(tǒng)的性能影響,數據備份作業(yè)之間的間隔不能太短;然而數據備份作業(yè)之間的間隔不能也不能太長,在兩次備份之間發(fā)生意外,數據的丟失量太大對于一些重要的信息系統(tǒng)是不可接受的。
- 數據的可恢復性。數據備份的目的是數據恢復,但往往由于存儲介質失效、人為錯誤、備份出錯等原因,造成備份數據的不可恢復。
- 數據備份的成本。數據備份的本質是用數據冗余來提升系統(tǒng)的穩(wěn)定性;高頻率、高穩(wěn)定性的數據備份的成本一般也較高。
3.4 解答題
1、假設有一個3軍問題,提供以下信息:
- 1支紅軍在山谷里扎營,在周圍的山坡上駐扎著3支藍軍;
- 紅軍比任意1支藍軍都要強大;如果1支藍軍單獨作戰(zhàn),紅軍勝;如果2支或以上藍軍同時進攻,藍軍勝;
- 三支藍軍需要同步他們的進攻時間;但他們惟一的通信媒介是派通信兵步行進入山谷,在那里他們可能被俘虜,從而將信息丟失;或者為了避免被俘虜,可能在山谷停留很長時間;
- 每支軍隊有1個參謀負責提議進攻時間;每支軍隊也有1個將軍批準參謀提出的進攻時間;很明顯,1個參謀提出的進攻時間需要獲得至少2個將軍的批準才有意義;
請回答以下問題:
- 是否存在一個協議,能夠使得藍軍同步他們的進攻時間?
- 根據下圖并利用該協議描述兩個參謀先后提議的場景。
答:
第一問:可采用Paxos協議。
補充:
參謀和將軍需要遵循一些基本的規(guī)則:文章來源:http://www.zghlxwxcb.cn/news/detail-779755.html
- 參謀以兩階段提交(prepare/commit)的方式來發(fā)起提議,在prepare階段需要給出一個編號;
- 在prepare階段產生沖突,將軍以編號大小來裁決,編號大的參謀勝出;
- 參謀在prepare階段如果收到了將軍返回的已接受進攻時間,在commit階段必須使用這個返回的進攻時間;
第二問:文章來源地址http://www.zghlxwxcb.cn/news/detail-779755.html
- 參謀1發(fā)起提議,派通信兵帶信給3個將軍,內容為(編號1);
- 3個將軍收到參謀1的提議,由于之前還沒有保存任何編號,因此把(編號1)保存下來,避免遺忘;同時讓通信兵帶信回去,內容為(ok);
- 參謀1收到至少2個將軍的回復,再次派通信兵帶信給3個將軍,內容為(編號1,進攻時間1);
- 3個將軍收到參謀1的時間,把(編號1,進攻時間1)保存下來,避免遺忘;同時讓通信兵帶信回去,內容為(Accepted);
- 參謀1收到至少2個將軍的(Accepted)內容,確認進攻時間已經被大家接收;
- 參謀2發(fā)起提議,派通信兵帶信給3個將軍,內容為(編號2);
- 3個將軍收到參謀2的提議,由于(編號2)比(編號1)大,因此把(編號2)保存下來,避免遺忘;又由于之前已經接受參謀1的提議,因此讓通信兵帶信回去,內容為(編號1,進攻時間1);
- 參謀2收到至少2個將軍的回復,由于回復中帶來了已接受的參謀1的提議內容,參謀2因此不再提出新的進攻時間,接受參謀1提出的時間;
到了這里,關于云計算與大數據第三章 云存儲練習題及答案的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網!