国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

大數(shù)據(jù)面試題集錦-Hadoop面試題(四)-YARN

這篇具有很好參考價值的文章主要介紹了大數(shù)據(jù)面試題集錦-Hadoop面試題(四)-YARN。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

你準(zhǔn)備好面試了嗎?這里有一些面試中可能會問到的問題以及相對應(yīng)的答案。如果你需要更多的面試經(jīng)驗和面試題,關(guān)注一下"張飛的豬大數(shù)據(jù)分享"吧,公眾號會不定時的分享相關(guān)的知識和資料。

目錄
  • 1、為什么會產(chǎn)生 yarn,它解決了什么問題,有什么優(yōu)勢?
  • 2、簡述hadoop1與hadoop2 的架構(gòu)異同
  • 3、Hadoop的調(diào)度器總結(jié)
  • 4、MapReduce 2.0 容錯性
  • 5、HDFS的數(shù)據(jù)壓縮算法?
  • 6、mapreduce推測執(zhí)行算法及原理
  • 7、更多大數(shù)據(jù)面試集錦

1、為什么會產(chǎn)生 yarn,它解決了什么問題,有什么優(yōu)勢?

1)Yarn最主要的功能就是解決運行的用戶程序與yarn框架完全解耦。
? 2)Yarn上可以運行各種類型的分布式運算程序(mapreduce只是其中的一種),比如mapreduce、storm程序,spark程序……

2、簡述hadoop1與hadoop2 的架構(gòu)異同

1)加入了yarn解決了資源調(diào)度的問題。
? 2)加入了對zookeeper的支持實現(xiàn)比較可靠的高可用。

3、Hadoop的調(diào)度器總結(jié)

(1)默認(rèn)的調(diào)度器FIFO
? Hadoop中默認(rèn)的調(diào)度器,它先按照作業(yè)的優(yōu)先級高低,再按照到達(dá)時間的先后選擇被執(zhí)行的作業(yè)。
(2)計算能力調(diào)度器Capacity Scheduler
? 支持多個隊列,每個隊列可配置一定的資源量,每個隊列采用FIFO調(diào)度策略,為了防止同一個用戶的作業(yè)獨占隊列中的資源,該調(diào)度器會對同一用戶提交的作業(yè)所占資源量進(jìn)行限定。調(diào)度時,首先按以下策略選擇一個合適隊列:計算每個隊列中正在運行的任務(wù)數(shù)與其應(yīng)該分得的計算資源之間的比值,選擇一個該比值最小的隊列;然后按以下策略選擇該隊列中一個作業(yè):按照作業(yè)優(yōu)先級和提交時間順序選擇,同時考慮用戶資源量限制和內(nèi)存限制。
(3)公平調(diào)度器Fair Scheduler
? 同計算能力調(diào)度器類似,支持多隊列多用戶,每個隊列中的資源量可以配置,同一隊列中的作業(yè)公平共享隊列中所有資源。實際上,Hadoop的調(diào)度器遠(yuǎn)不止以上三種,最近,出現(xiàn)了很多針對新型應(yīng)用的Hadoop調(diào)度器。

4、MapReduce 2.0 容錯性

1)MRAppMaster容錯性
? 一旦運行失敗,由YARN的ResourceManager負(fù)責(zé)重新啟動,最多重啟次數(shù)可由用戶設(shè)置,默認(rèn)是2次。一旦超過最高重啟次數(shù),則作業(yè)運行失敗。
2)Map Task/Reduce
? Task Task周期性向MRAppMaster匯報心跳;一旦Task掛掉,則MRAppMaster將為之重新申請資源,并運行之。最多重新運行次數(shù)可由用戶設(shè)置,默認(rèn)4次。

5、HDFS的數(shù)據(jù)壓縮算法?

Hadoop中常用的壓縮算法有bzip2、gzip、lzo、snappy,其中l(wèi)zo、snappy需要操作系統(tǒng)安裝native庫才可以支持。
? 數(shù)據(jù)可以壓縮的位置如下所示。
大數(shù)據(jù)面試題集錦-Hadoop面試題(四)-YARN

企業(yè)開發(fā)用的比較多的是snappy。

6、mapreduce推測執(zhí)行算法及原理

1)作業(yè)完成時間取決于最慢的任務(wù)完成時間
? 一個作業(yè)由若干個Map 任務(wù)和Reduce 任務(wù)構(gòu)成。因硬件老化、軟件Bug 等,某些任務(wù)可能運行非常慢。
? 典型案例:系統(tǒng)中有99%的Map任務(wù)都完成了,只有少數(shù)幾個Map老是進(jìn)度很慢,完不成,怎么辦?
2)推測執(zhí)行機(jī)制
? 發(fā)現(xiàn)拖后腿的任務(wù),比如某個任務(wù)運行速度遠(yuǎn)慢于任務(wù)平均速度。為拖后腿任務(wù)啟動一個備份任務(wù),同時運行。誰先運行完,則采用誰的結(jié)果。
3)不能啟用推測執(zhí)行機(jī)制情況
? (1)任務(wù)間存在嚴(yán)重的負(fù)載傾斜;
? (2)特殊任務(wù),比如任務(wù)向數(shù)據(jù)庫中寫數(shù)據(jù)。
4)算法原理
? 假設(shè)某一時刻,任務(wù)T的執(zhí)行進(jìn)度為progress,則可通過一定的算法推測出該任務(wù)的最終完成時刻estimateEndTime。另一方面,如果此刻為該任務(wù)啟動一個備份任務(wù),則可推斷出它可能的完成時刻estimateEndTime,于是可得出以下幾個公式:
?
estimateEndTime=estimatedRunTime+taskStartTime
estimatedRunTime=(currentTimestamp-taskStartTime)/progress
estimateEndTime= currentTimestamp+averageRunTime

其中,currentTimestamp為當(dāng)前時刻;taskStartTime為該任務(wù)的啟動時刻;averageRunTime為已經(jīng)成功運行完成的任務(wù)的平均運行時間。這樣,MRv2總是選擇(estimateEndTime- estimateEndTime·)差值最大的任務(wù),并為之啟動備份任務(wù)。為了防止大量任務(wù)同時啟動備份任務(wù)造成的資源浪費,MRv2為每個作業(yè)設(shè)置了同時啟動的備份任務(wù)數(shù)目上限。
? 推測執(zhí)行機(jī)制實際上采用了經(jīng)典的算法優(yōu)化方法:以空間換時間,它同時啟動多個相同任務(wù)處理相同的數(shù)據(jù),并讓這些任務(wù)競爭以縮短數(shù)據(jù)處理時間。顯然,這種方法需要占用更多的計算資源。在集群資源緊缺的情況下,應(yīng)合理使用該機(jī)制,爭取在多用少量資源的情況下,減少作業(yè)的計算時間。文章來源地址http://www.zghlxwxcb.cn/news/detail-542388.html

7、更多大數(shù)據(jù)面試集錦

  1. 大數(shù)據(jù)書籍資料分享
  2. 大數(shù)據(jù)面試題集錦

到了這里,關(guān)于大數(shù)據(jù)面試題集錦-Hadoop面試題(四)-YARN的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • vue面試題集錦

    1. 談一談對 MVVM 的理解? MVVM 是 Model-View-ViewModel 的縮寫。MVVM 是一種設(shè)計思想。 Model 層代表數(shù)據(jù)模型,也可以在 Model 中定義數(shù)據(jù)修改和操作的業(yè)務(wù)邏輯; View 代表 UI 組件,它負(fù)責(zé)將數(shù)據(jù)模型轉(zhuǎn)化成 UI 展現(xiàn)出來,View 是一個同步 View 和 Model 的對象 在 MVVM 架構(gòu)下,View 和 Model 之

    2024年01月21日
    瀏覽(20)
  • Spark面試題集錦

    1、什么是Apache Spark?Spark是什么? 是基于內(nèi)存的分布式的大數(shù)據(jù)并行計算框架,可用于構(gòu)建大型的、低延遲的數(shù)據(jù)分析應(yīng)用程序。包含Spark core、Spark sql、Spark streaming 、Spark MLlib 、spark GraphX五個核心組件。 2、Spark的核心組件是什么? Spark Core:是其它組件的基礎(chǔ),spark的內(nèi)核

    2024年02月04日
    瀏覽(24)
  • 音視頻開發(fā)面試題集錦

    音視頻開發(fā)面試題集錦

    下面是 2022.06 月音視頻面試題集錦內(nèi)容的節(jié)選: 媒體封裝層是表示媒體數(shù)據(jù)是什么封裝格式的,比如 MP4、FLV。在這層信息里,通常會攜帶碼流編碼格式的信息。 拿 MP4 來說,我們可以根據(jù) Sample Description Box(moov/trak/mdia/minf/stbl/stsd) 中的信息來確定其封裝的碼流的編碼格式。

    2023年04月13日
    瀏覽(26)
  • 500道網(wǎng)絡(luò)安全面試題集錦(附答案)

    500道網(wǎng)絡(luò)安全面試題集錦(附答案)

    本篇文章內(nèi)容為網(wǎng)絡(luò)安全各個方向涉及的面試題,但是無論如何都無法覆蓋所有的面試問題,更多的還是希望由點達(dá)面,查漏補缺,然后祝各位前程似錦,都能找到自己滿意的工作! ? 攻擊者通過在web界面中嵌入惡意腳本(通常為js代碼),造成用戶在瀏覽網(wǎng)頁時,控制用戶

    2024年02月15日
    瀏覽(26)
  • Java大廠常見1000道面試題集錦(一)

    Java大廠常見1000道面試題集錦(一)

    本系列為Java常見面試題集錦,持續(xù)更新中,包括筆試題和面試題, 建議收藏慢慢看 while(true){} 是一個無限循環(huán)的語句,它的作用是讓程序在執(zhí)行到該語句時不停地循環(huán)下去,直到程序被終止或者遇到 break、return 等跳出循環(huán)的語句。 無限循環(huán)的使用場景比較多,例如: 實現(xiàn)

    2024年02月06日
    瀏覽(56)
  • 找工作嗎?50道Python面試題集錦【附答案】

    找工作嗎?50道Python面試題集錦【附答案】

    嗨害大家好鴨!我是愛摸魚的芝士~ 希望能夠幫助你在今年的求職面試中脫穎而出, 找到一份高薪工作~ 這些面試題涉及Python基礎(chǔ)知識、Python編程、數(shù)據(jù)分析以及Python函數(shù)庫等多個方面。 提前預(yù)祝給這篇文章點贊收藏的友友們~ 拿到心中最滿意的那一份OFFER~ Q1、Python中的列表

    2023年04月18日
    瀏覽(26)
  • 大數(shù)據(jù)開發(fā)之Hadoop(Yarn)

    大數(shù)據(jù)開發(fā)之Hadoop(Yarn)

    思考: 1、如何管理集群資源? 2、如何給任務(wù)合理分配資源? Yarn是一個資源調(diào)度平臺,負(fù)責(zé)為運算程序提供服務(wù)器運算資源,相當(dāng)于一個分布式的操作系統(tǒng)平臺,而MapReduce等運算程序則相當(dāng)于運行于操作系統(tǒng)之上的應(yīng)用程序。 YARN主要由ResourceManager、NodeManager、ApplicationMas

    2024年01月19日
    瀏覽(19)
  • 大數(shù)據(jù)課程D4——hadoop的YARN

    文章作者郵箱:yugongshiye@sina.cn? ? ? ? ? ? ? 地址:廣東惠州 ??了解YARN的概念和結(jié)構(gòu); ??掌握YARN的資源調(diào)度流程; ? 了解Hadoop支持的資源調(diào)度器:FIFO、Capacity、Fair; ??掌握YARN的完全分布式結(jié)構(gòu)和常見問題; ??掌握YARN的服役新節(jié)點操作; 1. Another Resource Negotiator

    2024年02月14日
    瀏覽(13)
  • 大數(shù)據(jù)技術(shù)之Hadoop:Yarn集群部署(七)

    大數(shù)據(jù)技術(shù)之Hadoop:Yarn集群部署(七)

    目錄 一、部署說明 二、集群規(guī)劃 三、開始配置 3.1 MapReduce配置文件 3.2?YARN配置文件 3.3?分發(fā)配置文件 四、集群啟停 4.1 命令介紹? 4.2 演示 4.3?查看YARN的WEB UI頁面 Hadoop HDFS分布式文件系統(tǒng),我們會啟動: NameNode進(jìn)程作為管理節(jié)點 DataNode進(jìn)程作為工作節(jié)點 SecondaryNamenode作為輔

    2024年02月09日
    瀏覽(16)
  • 【大數(shù)據(jù)】HADOOP-YARN容量調(diào)度器配置詳解

    Capacity調(diào)度器具有以下的幾個特性: 層次化的隊列設(shè)計,這種層次化的隊列設(shè)計保證了子隊列可以使用父隊列設(shè)置的全部資源。這樣通過層次化的管理,更容易合理分配和限制資源的使用。 容量保證,隊列上都會設(shè)置一個資源的占比,這樣可以保證每個隊列都不會占用整個集

    2024年02月01日
    瀏覽(23)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包