国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<del id="smry2"></del>

hadoop分布式計(jì)算組件

1年前作者：小蜜蜂愛編程分類：Toy博客閱讀(22)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了hadoop分布式計(jì)算組件。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

什么是計(jì)算、分布式計(jì)算？

·計(jì)算：對(duì)數(shù)據(jù)進(jìn)行處理，使用統(tǒng)計(jì)分析等手段得到需要的結(jié)果
·分布式計(jì)算：多臺(tái)服務(wù)器協(xié)同工作，共同完成一個(gè)計(jì)算任務(wù)

分布式計(jì)算常見的2種工作模式

分散->匯總(MapReduce就是這種模式)
中心調(diào)度->步驟執(zhí)行（大數(shù)據(jù)體系的Spark、Flink等是這種模式）

hadoop分布式計(jì)算框架-MapReduce

MapReduce是“分散->匯總”模式的分布式計(jì)算框架，可供開發(fā)人員開發(fā)相關(guān)程序進(jìn)行分布式數(shù)據(jù)計(jì)算。
MapReduce提供了2個(gè)編程接口：
·Map
·Reduce
其中
·Map功能接口提供了“分散”的功能，由服務(wù)器分布式對(duì)數(shù)據(jù)進(jìn)行處理
·Reduce.功能接口提供了“匯總（聚合）”的功能，將分布式的處理結(jié)果匯總統(tǒng)計(jì)
用戶如需使用MapReduce框架完成自定義需求的程序開發(fā)
只需要使用Java、Python等編程語言，實(shí)現(xiàn)Map Reduce.功能接口即可。
目前map reduce框架代碼開發(fā)已經(jīng)逐漸淘汰，但由于hive分布式sql框架底層是map reduce實(shí)現(xiàn)的，所以map reduce仍活躍在一線。
MapReduce是基于YARN運(yùn)行的，99%場(chǎng)景下map reduce都是集成在yarn集群中運(yùn)行的

YARN的資源調(diào)度

YARN管控整個(gè)集群的資源進(jìn)行調(diào)度，那么應(yīng)用程序在運(yùn)行時(shí)，就是在YARN的監(jiān)管（管理）下去運(yùn)行的。
這就像：全部資源都是公司(YARN)的，由公司分配給個(gè)人（具體的程序）去使用。
比如，一個(gè)具體的MapReduce程序。
我們知道，MapReduce程序會(huì)將任務(wù)分解為若干個(gè)Map任務(wù)和Reduce任務(wù)。
假設(shè)，有一個(gè)MapReduce程序，分解了3個(gè)Map任務(wù)，和1個(gè)Reduce任務(wù)，每個(gè)map任務(wù)需要2GB運(yùn)行內(nèi)存，每個(gè)reduce任務(wù)需要4GB運(yùn)行內(nèi)存，那么如何在YARN的監(jiān)管（管理）下運(yùn)行呢？
hadoop分布式計(jì)算組件,hadoop,大數(shù)據(jù),分布式

map程序和reduce程序會(huì)告訴yarn所需的資源情況，向yarn申請(qǐng)資源，yarn則會(huì)根據(jù)資源情況，分配具體的任務(wù)運(yùn)行

hadoop分布式計(jì)算組件,hadoop,大數(shù)據(jù),分布式

YARN的核心架構(gòu)

YARN,主從架構(gòu)，有2個(gè)角色
·主(Master)角色：ResourceManager
整個(gè)集群的資源調(diào)度者，負(fù)責(zé)協(xié)調(diào)調(diào)度各個(gè)程序所需的資源。
·從(Slave)角色：NodeManager
單個(gè)服務(wù)器的資源調(diào)度者，負(fù)責(zé)調(diào)度單個(gè)服務(wù)器上的資源提供給應(yīng)用程序使用

hadoop分布式計(jì)算組件,hadoop,大數(shù)據(jù),分布式

如上圖，某個(gè)程序告知yarn我需要的資源情況，yarn的resource manager查看資源情況，并通知到node manager，node manager會(huì)通過容器技術(shù)，創(chuàng)建容器來占用對(duì)應(yīng)的資源，然后再分配具體的程序來運(yùn)行。yarn能搶占資源及精準(zhǔn)分配資源是通過容器技術(shù)實(shí)現(xiàn)的。

YARN輔助角色

YARN的架構(gòu)中除了核心角色，即：
·ResourceManager:集群資源總管家
·NodeManager:單機(jī)資源管家
還可以搭配2個(gè)輔助角色使得YARN集群運(yùn)行更加穩(wěn)定
。代理服務(wù)器(ProxyServer):Web Application Proxy Web應(yīng)用程序代理
。歷史服務(wù)器(obHistoryServer):應(yīng)用程序歷史信息記錄服務(wù)

Web應(yīng)用代理(Web Application Proxy)

代理服務(wù)器，即W2b應(yīng)用代理是YARN的一部分。默認(rèn)情況下，它將作為資源管理器(RM)的一部分運(yùn)行，但是可以配置為在獨(dú)立模式下運(yùn)行。使用代理的原
因是為了減少通過YARN進(jìn)行基于網(wǎng)絡(luò)的攻擊的可能性。
這是因?yàn)?，YARN在運(yùn)行時(shí)會(huì)提供一個(gè)WEB UI站點(diǎn)（同HDFS的WEB UIS站點(diǎn)一樣）可供用戶在瀏覽器內(nèi)查看YARN的運(yùn)行信息
對(duì)外提供WEB站點(diǎn)會(huì)有安全性問題，而代理服務(wù)器的功能就是最大限度保障對(duì)WEB UIE的訪問是安全的。比如：

警告用戶正在訪問一個(gè)不受信任的站點(diǎn)
剝離用戶訪問的Cookie等

代理服務(wù)器默認(rèn)集成在了ResourceManager中
也可以將其分離出來單獨(dú)啟動(dòng)，如果要分離代理服務(wù)器

在yarn-site.xml中配置yarn.web-proxy.address參數(shù)即可（部署環(huán)節(jié)會(huì)使用到）

2.并通過命令啟動(dòng)它即可$HADOOP_YARN_HOME/sbin/yarn-daemon.sh start proxyserver

JobHistoryServer歷史服務(wù)器

歷史服務(wù)器的功能很簡(jiǎn)單：記錄歷史運(yùn)行的程序的信息以及產(chǎn)生的日志并提供WEBU站點(diǎn)供用戶使用瀏覽器查看。它可以收集各個(gè)服務(wù)器的日志數(shù)據(jù)并統(tǒng)一匯總到hdfs上，方便用戶查看

開啟歷史服務(wù)器需要配置：

開啟日志聚合，允許從容器中抓取日志到hdfs中集中存儲(chǔ)
配置歷史服務(wù)器端口和主機(jī)
文章來源地址http://www.zghlxwxcb.cn/news/detail-847726.html

到了這里，關(guān)于hadoop分布式計(jì)算組件的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

分布式計(jì)算平臺(tái) Hadoop 簡(jiǎn)介
Hadoop是一種分析和處理大數(shù)據(jù)的軟件平臺(tái)，是一個(gè)用Java語言實(shí)現(xiàn)的Apache的開源軟件框架，在大量計(jì)算機(jī)組成的集群中實(shí)現(xiàn)了對(duì)海量數(shù)據(jù)的分布式計(jì)算。其主要采用MapReduce分布式計(jì)算框架，包括根據(jù)GFS原理開發(fā)的分布式文件系統(tǒng)HDFS、根據(jù)BigTable原理開發(fā)的數(shù)據(jù)存儲(chǔ)系統(tǒng)HBase以及
2024年02月01日
瀏覽(98)
Hadoop的分布式文件存儲(chǔ)系統(tǒng)HDFS組件的使用
存儲(chǔ)整個(gè)HDFS集群的元數(shù)據(jù)（metaData） —— 整個(gè)集群中存儲(chǔ)的目錄和文件的索引管理整個(gè)HDFS集群接收客戶端的請(qǐng)求負(fù)責(zé)節(jié)點(diǎn)的故障轉(zhuǎn)移存儲(chǔ)數(shù)據(jù)，是以block塊的形式進(jìn)行數(shù)據(jù)的存放。默認(rèn)情況下block塊的大小是128M。 blocksize大小的計(jì)算公式：尋址時(shí)間：下載文件時(shí)找到文件
2024年02月09日
瀏覽(97)
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
此前搭建了hadoop的單機(jī)模式與偽分布式模式：單機(jī)模式部署偽分布式模式部署中間拖得有點(diǎn)久了，今天索性做個(gè)了結(jié)，把hadoop的全分布式模式部署的操作也簡(jiǎn)單地記錄一下，算是一個(gè)系統(tǒng)性的學(xué)習(xí)吧。偽分布式模式是學(xué)習(xí)階段最常用的模式，它可以將進(jìn)程都運(yùn)行在同一臺(tái)機(jī)
2023年04月08日
瀏覽(90)
【云計(jì)算】Hadoop2.x完全分布式集群（入門）
【虛擬機(jī)】VMware Workstation 16 Pro 【鏡像】CentOS-7-x86_64-DVD-1804.iso 【java】jdk-8u281-linux-x64.rpm 【Hadoop】hadoop-2.7.1.tar.gz 【SSH遠(yuǎn)程】SecureCRTPortable.exe 【上傳下載】SecureFXPortable.exe 配網(wǎng)卡ens33 重啟網(wǎng)絡(luò) 私鑰、公鑰克隆、改名、改IP 三臺(tái)機(jī)都要做：?? 生成密鑰密鑰發(fā)送登錄測(cè)試 had
2024年04月12日
瀏覽(26)
??????Mapreduce分布式計(jì)算組件和YARN分布式資源調(diào)度
上文我們已經(jīng)介紹Hadoop中HDFS分布式存儲(chǔ)組件今天我們來學(xué)習(xí)Hadoop生態(tài)中另兩大組件Mapreduce和YARN Map階段 : 將數(shù)據(jù)拆分到不同的服務(wù)器后執(zhí)行Maptask任務(wù),得到一個(gè)中間結(jié)果 Reduce階段 : 將Maptask執(zhí)行的結(jié)果進(jìn)行匯總,按照Reducetask的計(jì)算規(guī)則獲得一個(gè)唯一的結(jié)果我們?cè)贛apReduce計(jì)算框
2024年04月13日
瀏覽(24)
Hadoop分布式計(jì)算與資源調(diào)度：打開專業(yè)江湖的魔幻之門
本博客的內(nèi)容基于我個(gè)人學(xué)習(xí)黑馬程序員課程的學(xué)習(xí)筆記整理而成。我特此聲明，所有版權(quán)屬于黑馬程序員或相關(guān)權(quán)利人所有。本博客的目的僅為個(gè)人學(xué)習(xí)和交流之用，并非商業(yè)用途。我在整理學(xué)習(xí)筆記的過程中盡力確保準(zhǔn)確性，但無法保證內(nèi)容的完整性和時(shí)效性。本博客的
2024年02月11日
瀏覽(29)
大數(shù)據(jù)--分布式存儲(chǔ) Hadoop
Hadoop指Apache這款開源框架，它的核心組件有： HDFS（分布式文件系統(tǒng)）：解決海量數(shù)據(jù)存儲(chǔ) MAPREDUCE（分布式運(yùn)算編程框架）：解決海量數(shù)據(jù)計(jì)算 YARN（作業(yè)調(diào)度和集群資源管理的框架）：解決資源任務(wù)調(diào)度目前主流的hadoop框架已經(jīng)迭代更新到hadoop3.x的版本了，本篇的介紹也是
2024年01月17日
瀏覽(50)
39學(xué)習(xí)分布式計(jì)算框架 Hadoop 的高可用方案，如 NameNode 集群、ZooKeeper
Hadoop 是一個(gè)分布式計(jì)算框架，用于存儲(chǔ)和處理大數(shù)據(jù)。在 Hadoop 集群中，NameNode 是一個(gè)關(guān)鍵組件，它負(fù)責(zé)管理 Hadoop 分布式文件系統(tǒng)（HDFS）中的文件和目錄。為了確保高可用性，需要使用多個(gè) NameNode 節(jié)點(diǎn)進(jìn)行冗余備份，并使用 ZooKeeper 進(jìn)行故障檢測(cè)和自動(dòng)故障切換。以下是學(xué)
2023年04月26日
瀏覽(28)
大數(shù)據(jù)之Hadoop分布式數(shù)據(jù)倉庫HBase
HBase 是一個(gè)構(gòu)建在 Hadoop 文件系統(tǒng)之上的面向列的數(shù)據(jù)庫管理系統(tǒng)。要想明白為什么產(chǎn)生 HBase，就需要先了解一下 Hadoop 存在的限制？Hadoop 可以通過 HDFS 來存儲(chǔ)結(jié)構(gòu)化、半結(jié)構(gòu)甚至非結(jié)構(gòu)化的數(shù)據(jù)，它是傳統(tǒng)數(shù)據(jù)庫的補(bǔ)充，是海量數(shù)據(jù)存儲(chǔ)的最佳方法，它針對(duì)大文件的存儲(chǔ)，
2024年02月02日
瀏覽(27)
（大數(shù)據(jù)開發(fā)隨筆9）Hadoop 3.3.x分布式環(huán)境部署——全分布式模式
分布式文件系統(tǒng)中，HDFS相關(guān)的守護(hù)進(jìn)程也分布在不同的機(jī)器上，如： NameNode守護(hù)進(jìn)程，盡可能單獨(dú)部署在一臺(tái)硬件性能較好的機(jī)器中其他的每臺(tái)機(jī)器上都會(huì)部署一個(gè)DataNode進(jìn)程，一般的硬件環(huán)境即可 SecondaryNameNode守護(hù)進(jìn)程最好不要和NameNode在同一臺(tái)機(jī)器上守護(hù)進(jìn)程布局 Name
2023年04月16日
瀏覽(23)