国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

大數(shù)據(jù)面試題集錦-Hadoop面試題(四)-YARN

2年前作者：張飛的豬分類：Toy博客閱讀(25)違法舉報

這篇具有很好參考價值的文章主要介紹了大數(shù)據(jù)面試題集錦-Hadoop面試題(四)-YARN。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

你準(zhǔn)備好面試了嗎?這里有一些面試中可能會問到的問題以及相對應(yīng)的答案。如果你需要更多的面試經(jīng)驗和面試題，關(guān)注一下"張飛的豬大數(shù)據(jù)分享"吧，公眾號會不定時的分享相關(guān)的知識和資料。

目錄

1、為什么會產(chǎn)生 yarn,它解決了什么問題，有什么優(yōu)勢？
2、簡述hadoop1與hadoop2 的架構(gòu)異同
3、Hadoop的調(diào)度器總結(jié)
4、MapReduce 2.0 容錯性
5、HDFS的數(shù)據(jù)壓縮算法?
6、mapreduce推測執(zhí)行算法及原理
7、更多大數(shù)據(jù)面試集錦

1、為什么會產(chǎn)生 yarn,它解決了什么問題，有什么優(yōu)勢？

1）Yarn最主要的功能就是解決運行的用戶程序與yarn框架完全解耦。
? 2）Yarn上可以運行各種類型的分布式運算程序（mapreduce只是其中的一種），比如mapreduce、storm程序，spark程序……

2、簡述hadoop1與hadoop2 的架構(gòu)異同

1）加入了yarn解決了資源調(diào)度的問題。
? 2）加入了對zookeeper的支持實現(xiàn)比較可靠的高可用。

3、Hadoop的調(diào)度器總結(jié)

（1）默認(rèn)的調(diào)度器FIFO
? Hadoop中默認(rèn)的調(diào)度器，它先按照作業(yè)的優(yōu)先級高低，再按照到達(dá)時間的先后選擇被執(zhí)行的作業(yè)。
（2）計算能力調(diào)度器Capacity Scheduler
? 支持多個隊列，每個隊列可配置一定的資源量，每個隊列采用FIFO調(diào)度策略，為了防止同一個用戶的作業(yè)獨占隊列中的資源，該調(diào)度器會對同一用戶提交的作業(yè)所占資源量進(jìn)行限定。調(diào)度時，首先按以下策略選擇一個合適隊列：計算每個隊列中正在運行的任務(wù)數(shù)與其應(yīng)該分得的計算資源之間的比值，選擇一個該比值最小的隊列；然后按以下策略選擇該隊列中一個作業(yè)：按照作業(yè)優(yōu)先級和提交時間順序選擇，同時考慮用戶資源量限制和內(nèi)存限制。
（3）公平調(diào)度器Fair Scheduler
? 同計算能力調(diào)度器類似，支持多隊列多用戶，每個隊列中的資源量可以配置，同一隊列中的作業(yè)公平共享隊列中所有資源。實際上，Hadoop的調(diào)度器遠(yuǎn)不止以上三種，最近，出現(xiàn)了很多針對新型應(yīng)用的Hadoop調(diào)度器。

4、MapReduce 2.0 容錯性

1）MRAppMaster容錯性
? 一旦運行失敗，由YARN的ResourceManager負(fù)責(zé)重新啟動，最多重啟次數(shù)可由用戶設(shè)置，默認(rèn)是2次。一旦超過最高重啟次數(shù)，則作業(yè)運行失敗。
2）Map Task/Reduce
? Task Task周期性向MRAppMaster匯報心跳；一旦Task掛掉，則MRAppMaster將為之重新申請資源，并運行之。最多重新運行次數(shù)可由用戶設(shè)置，默認(rèn)4次。

5、HDFS的數(shù)據(jù)壓縮算法?

Hadoop中常用的壓縮算法有bzip2、gzip、lzo、snappy，其中l(wèi)zo、snappy需要操作系統(tǒng)安裝native庫才可以支持。
? 數(shù)據(jù)可以壓縮的位置如下所示。
大數(shù)據(jù)面試題集錦-Hadoop面試題(四)-YARN

企業(yè)開發(fā)用的比較多的是snappy。

6、mapreduce推測執(zhí)行算法及原理

1）作業(yè)完成時間取決于最慢的任務(wù)完成時間
? 一個作業(yè)由若干個Map 任務(wù)和Reduce 任務(wù)構(gòu)成。因硬件老化、軟件Bug 等，某些任務(wù)可能運行非常慢。
? 典型案例：系統(tǒng)中有99%的Map任務(wù)都完成了，只有少數(shù)幾個Map老是進(jìn)度很慢，完不成，怎么辦？
2）推測執(zhí)行機(jī)制
? 發(fā)現(xiàn)拖后腿的任務(wù)，比如某個任務(wù)運行速度遠(yuǎn)慢于任務(wù)平均速度。為拖后腿任務(wù)啟動一個備份任務(wù)，同時運行。誰先運行完，則采用誰的結(jié)果。
3）不能啟用推測執(zhí)行機(jī)制情況
? （1）任務(wù)間存在嚴(yán)重的負(fù)載傾斜；
? （2）特殊任務(wù)，比如任務(wù)向數(shù)據(jù)庫中寫數(shù)據(jù)。
4）算法原理
? 假設(shè)某一時刻，任務(wù)T的執(zhí)行進(jìn)度為progress，則可通過一定的算法推測出該任務(wù)的最終完成時刻estimateEndTime。另一方面，如果此刻為該任務(wù)啟動一個備份任務(wù)，則可推斷出它可能的完成時刻estimateEndTime,于是可得出以下幾個公式：
?
estimateEndTime=estimatedRunTime+taskStartTime
estimatedRunTime=(currentTimestamp-taskStartTime)/progress
estimateEndTime= currentTimestamp+averageRunTime

其中，currentTimestamp為當(dāng)前時刻；taskStartTime為該任務(wù)的啟動時刻；averageRunTime為已經(jīng)成功運行完成的任務(wù)的平均運行時間。這樣，MRv2總是選擇（estimateEndTime- estimateEndTime·）差值最大的任務(wù)，并為之啟動備份任務(wù)。為了防止大量任務(wù)同時啟動備份任務(wù)造成的資源浪費，MRv2為每個作業(yè)設(shè)置了同時啟動的備份任務(wù)數(shù)目上限。
? 推測執(zhí)行機(jī)制實際上采用了經(jīng)典的算法優(yōu)化方法：以空間換時間，它同時啟動多個相同任務(wù)處理相同的數(shù)據(jù)，并讓這些任務(wù)競爭以縮短數(shù)據(jù)處理時間。顯然，這種方法需要占用更多的計算資源。在集群資源緊缺的情況下，應(yīng)合理使用該機(jī)制，爭取在多用少量資源的情況下，減少作業(yè)的計算時間。文章來源地址http://www.zghlxwxcb.cn/news/detail-542388.html

7、更多大數(shù)據(jù)面試集錦

大數(shù)據(jù)書籍資料分享
大數(shù)據(jù)面試題集錦

到了這里，關(guān)于大數(shù)據(jù)面試題集錦-Hadoop面試題(四)-YARN的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進(jìn)行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

vue面試題集錦
1. 談一談對 MVVM 的理解？ MVVM 是 Model-View-ViewModel 的縮寫。MVVM 是一種設(shè)計思想。 Model 層代表數(shù)據(jù)模型，也可以在 Model 中定義數(shù)據(jù)修改和操作的業(yè)務(wù)邏輯; View 代表 UI 組件，它負(fù)責(zé)將數(shù)據(jù)模型轉(zhuǎn)化成 UI 展現(xiàn)出來，View 是一個同步 View 和 Model 的對象在 MVVM 架構(gòu)下，View 和 Model 之
2024年01月21日
瀏覽(20)
Spark面試題集錦
1、什么是Apache Spark？Spark是什么？是基于內(nèi)存的分布式的大數(shù)據(jù)并行計算框架，可用于構(gòu)建大型的、低延遲的數(shù)據(jù)分析應(yīng)用程序。包含Spark core、Spark sql、Spark streaming 、Spark MLlib 、spark GraphX五個核心組件。 2、Spark的核心組件是什么？ Spark Core：是其它組件的基礎(chǔ)，spark的內(nèi)核
2024年02月04日
瀏覽(24)
音視頻開發(fā)面試題集錦
下面是 2022.06 月音視頻面試題集錦內(nèi)容的節(jié)選：媒體封裝層是表示媒體數(shù)據(jù)是什么封裝格式的，比如 MP4、FLV。在這層信息里，通常會攜帶碼流編碼格式的信息。拿 MP4 來說，我們可以根據(jù) Sample Description Box(moov/trak/mdia/minf/stbl/stsd) 中的信息來確定其封裝的碼流的編碼格式。
2023年04月13日
瀏覽(26)
500道網(wǎng)絡(luò)安全面試題集錦（附答案）
本篇文章內(nèi)容為網(wǎng)絡(luò)安全各個方向涉及的面試題，但是無論如何都無法覆蓋所有的面試問題，更多的還是希望由點達(dá)面，查漏補缺，然后祝各位前程似錦，都能找到自己滿意的工作！ ? 攻擊者通過在web界面中嵌入惡意腳本（通常為js代碼），造成用戶在瀏覽網(wǎng)頁時，控制用戶
2024年02月15日
瀏覽(26)
Java大廠常見1000道面試題集錦（一）
本系列為Java常見面試題集錦，持續(xù)更新中，包括筆試題和面試題，建議收藏慢慢看 while(true){} 是一個無限循環(huán)的語句，它的作用是讓程序在執(zhí)行到該語句時不停地循環(huán)下去，直到程序被終止或者遇到 break、return 等跳出循環(huán)的語句。無限循環(huán)的使用場景比較多，例如：實現(xiàn)
2024年02月06日
瀏覽(56)
找工作嗎？50道Python面試題集錦【附答案】
嗨害大家好鴨！我是愛摸魚的芝士~ 希望能夠幫助你在今年的求職面試中脫穎而出，找到一份高薪工作~ 這些面試題涉及Python基礎(chǔ)知識、Python編程、數(shù)據(jù)分析以及Python函數(shù)庫等多個方面。提前預(yù)祝給這篇文章點贊收藏的友友們~ 拿到心中最滿意的那一份OFFER~ Q1、Python中的列表
2023年04月18日
瀏覽(26)
大數(shù)據(jù)開發(fā)之Hadoop（Yarn）
思考： 1、如何管理集群資源？ 2、如何給任務(wù)合理分配資源？ Yarn是一個資源調(diào)度平臺，負(fù)責(zé)為運算程序提供服務(wù)器運算資源，相當(dāng)于一個分布式的操作系統(tǒng)平臺，而MapReduce等運算程序則相當(dāng)于運行于操作系統(tǒng)之上的應(yīng)用程序。 YARN主要由ResourceManager、NodeManager、ApplicationMas
2024年01月19日
瀏覽(19)
大數(shù)據(jù)課程D4——hadoop的YARN
文章作者郵箱：yugongshiye@sina.cn? ? ? ? ? ? ? 地址：廣東惠州 ??了解YARN的概念和結(jié)構(gòu)； ??掌握YARN的資源調(diào)度流程； ? 了解Hadoop支持的資源調(diào)度器：FIFO、Capacity、Fair； ??掌握YARN的完全分布式結(jié)構(gòu)和常見問題； ??掌握YARN的服役新節(jié)點操作； 1. Another Resource Negotiator
2024年02月14日
瀏覽(13)
大數(shù)據(jù)技術(shù)之Hadoop：Yarn集群部署（七）
目錄一、部署說明二、集群規(guī)劃三、開始配置 3.1 MapReduce配置文件 3.2?YARN配置文件 3.3?分發(fā)配置文件四、集群啟停 4.1 命令介紹? 4.2 演示 4.3?查看YARN的WEB UI頁面 Hadoop HDFS分布式文件系統(tǒng)，我們會啟動： NameNode進(jìn)程作為管理節(jié)點 DataNode進(jìn)程作為工作節(jié)點 SecondaryNamenode作為輔
2024年02月09日
瀏覽(16)
【大數(shù)據(jù)】HADOOP-YARN容量調(diào)度器配置詳解
Capacity調(diào)度器具有以下的幾個特性：層次化的隊列設(shè)計，這種層次化的隊列設(shè)計保證了子隊列可以使用父隊列設(shè)置的全部資源。這樣通過層次化的管理，更容易合理分配和限制資源的使用。容量保證，隊列上都會設(shè)置一個資源的占比，這樣可以保證每個隊列都不會占用整個集
2024年02月01日
瀏覽(23)

<kbd id="4a3nq"></kbd>

<center id="4a3nq"></center>