国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

hadoop分布式計(jì)算組件

這篇具有很好參考價(jià)值的文章主要介紹了hadoop分布式計(jì)算組件。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

什么是計(jì)算、分布式計(jì)算?

·計(jì)算:對(duì)數(shù)據(jù)進(jìn)行處理,使用統(tǒng)計(jì)分析等手段得到需要的結(jié)果
·分布式計(jì)算:多臺(tái)服務(wù)器協(xié)同工作,共同完成一個(gè)計(jì)算任務(wù)

分布式計(jì)算常見的2種工作模式
  1. 分散->匯總(MapReduce就是這種模式)
  2. 中心調(diào)度->步驟執(zhí)行(大數(shù)據(jù)體系的Spark、Flink等是這種模式)

hadoop分布式計(jì)算框架-MapReduce

MapReduce是“分散->匯總”模式的分布式計(jì)算框架,可供開發(fā)人員開發(fā)相關(guān)程序進(jìn)行分布式數(shù)據(jù)計(jì)算。
MapReduce提供了2個(gè)編程接口:
·Map
·Reduce
其中
·Map功能接口提供了“分散”的功能,由服務(wù)器分布式對(duì)數(shù)據(jù)進(jìn)行處理
·Reduce.功能接口提供了“匯總(聚合)”的功能,將分布式的處理結(jié)果匯總統(tǒng)計(jì)
用戶如需使用MapReduce框架完成自定義需求的程序開發(fā)
只需要使用Java、Python等編程語言,實(shí)現(xiàn)Map Reduce.功能接口即可。
目前map reduce框架代碼開發(fā)已經(jīng)逐漸淘汰,但由于hive分布式sql框架底層是map reduce實(shí)現(xiàn)的,所以map reduce仍活躍在一線。
MapReduce是基于YARN運(yùn)行的,99%場(chǎng)景下map reduce都是集成在yarn集群中運(yùn)行的

YARN的資源調(diào)度

YARN管控整個(gè)集群的資源進(jìn)行調(diào)度,那么應(yīng)用程序在運(yùn)行時(shí),就是在YARN的監(jiān)管(管理)下去運(yùn)行的。
這就像:全部資源都是公司(YARN)的,由公司分配給個(gè)人(具體的程序)去使用。
比如,一個(gè)具體的MapReduce程序。
我們知道,MapReduce程序會(huì)將任務(wù)分解為若干個(gè)Map任務(wù)和Reduce任務(wù)。
假設(shè),有一個(gè)MapReduce程序,分解了3個(gè)Map任務(wù),和1個(gè)Reduce任務(wù),每個(gè)map任務(wù)需要2GB運(yùn)行內(nèi)存,每個(gè)reduce任務(wù)需要4GB運(yùn)行內(nèi)存,那么如何在YARN的監(jiān)管(管理)下運(yùn)行呢?
hadoop分布式計(jì)算組件,hadoop,大數(shù)據(jù),分布式

map程序和reduce程序會(huì)告訴yarn所需的資源情況,向yarn申請(qǐng)資源,yarn則會(huì)根據(jù)資源情況,分配具體的任務(wù)運(yùn)行

hadoop分布式計(jì)算組件,hadoop,大數(shù)據(jù),分布式

YARN的核心架構(gòu)

YARN,主從架構(gòu),有2個(gè)角色
·主(Master)角色:ResourceManager
整個(gè)集群的資源調(diào)度者,負(fù)責(zé)協(xié)調(diào)調(diào)度各個(gè)程序所需的資源。
·從(Slave)角色:NodeManager
單個(gè)服務(wù)器的資源調(diào)度者,負(fù)責(zé)調(diào)度單個(gè)服務(wù)器上的資源提供給應(yīng)用程序使用

hadoop分布式計(jì)算組件,hadoop,大數(shù)據(jù),分布式

如上圖,某個(gè)程序告知yarn我需要的資源情況,yarn的resource manager查看資源情況,并通知到node manager,node manager會(huì)通過容器技術(shù),創(chuàng)建容器來占用對(duì)應(yīng)的資源,然后再分配具體的程序來運(yùn)行。yarn能搶占資源及精準(zhǔn)分配資源是通過容器技術(shù)實(shí)現(xiàn)的。

YARN輔助角色

YARN的架構(gòu)中除了核心角色,即:
·ResourceManager:集群資源總管家
·NodeManager:單機(jī)資源管家
還可以搭配2個(gè)輔助角色使得YARN集群運(yùn)行更加穩(wěn)定
。代理服務(wù)器(ProxyServer):Web Application Proxy Web應(yīng)用程序代理
。歷史服務(wù)器(obHistoryServer):應(yīng)用程序歷史信息記錄服務(wù)

Web應(yīng)用代理(Web Application Proxy)

代理服務(wù)器,即W2b應(yīng)用代理是YARN的一部分。默認(rèn)情況下,它將作為資源管理器(RM)的一部分運(yùn)行,但是可以配置為在獨(dú)立模式下運(yùn)行。使用代理的原
因是為了減少通過YARN進(jìn)行基于網(wǎng)絡(luò)的攻擊的可能性。
這是因?yàn)?,YARN在運(yùn)行時(shí)會(huì)提供一個(gè)WEB UI站點(diǎn)(同HDFS的WEB UIS站點(diǎn)一樣)可供用戶在瀏覽器內(nèi)查看YARN的運(yùn)行信息
對(duì)外提供WEB站點(diǎn)會(huì)有安全性問題,而代理服務(wù)器的功能就是最大限度保障對(duì)WEB UIE的訪問是安全的。比如:

  • 警告用戶正在訪問一個(gè)不受信任的站點(diǎn)
  • 剝離用戶訪問的Cookie等

代理服務(wù)器默認(rèn)集成在了ResourceManager中
也可以將其分離出來單獨(dú)啟動(dòng),如果要分離代理服務(wù)器

  1. 在yarn-site.xml中配置yarn.web-proxy.address參數(shù)即可(部署環(huán)節(jié)會(huì)使用到)
    hadoop分布式計(jì)算組件,hadoop,大數(shù)據(jù),分布式

2.并通過命令啟動(dòng)它即可$HADOOP_YARN_HOME/sbin/yarn-daemon.sh start proxyserver

JobHistoryServer歷史服務(wù)器

歷史服務(wù)器的功能很簡(jiǎn)單:記錄歷史運(yùn)行的程序的信息以及產(chǎn)生的日志并提供WEBU站點(diǎn)供用戶使用瀏覽器查看。它可以收集各個(gè)服務(wù)器的日志數(shù)據(jù)并統(tǒng)一匯總到hdfs上,方便用戶查看

開啟歷史服務(wù)器需要配置:

  1. 開啟日志聚合,允許從容器中抓取日志到hdfs中集中存儲(chǔ)
    hadoop分布式計(jì)算組件,hadoop,大數(shù)據(jù),分布式

  2. 配置歷史服務(wù)器端口和主機(jī)
    hadoop分布式計(jì)算組件,hadoop,大數(shù)據(jù),分布式文章來源地址http://www.zghlxwxcb.cn/news/detail-847726.html

到了這里,關(guān)于hadoop分布式計(jì)算組件的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 分布式計(jì)算平臺(tái) Hadoop 簡(jiǎn)介

    分布式計(jì)算平臺(tái) Hadoop 簡(jiǎn)介

    Hadoop是一種分析和處理大數(shù)據(jù)的軟件平臺(tái),是一個(gè)用Java語言實(shí)現(xiàn)的Apache的開源軟件框架,在大量計(jì)算機(jī)組成的集群中實(shí)現(xiàn)了對(duì)海量數(shù)據(jù)的分布式計(jì)算。其主要采用MapReduce分布式計(jì)算框架,包括根據(jù)GFS原理開發(fā)的分布式文件系統(tǒng)HDFS、根據(jù)BigTable原理開發(fā)的數(shù)據(jù)存儲(chǔ)系統(tǒng)HBase以及

    2024年02月01日
    瀏覽(98)
  • Hadoop的分布式文件存儲(chǔ)系統(tǒng)HDFS組件的使用

    Hadoop的分布式文件存儲(chǔ)系統(tǒng)HDFS組件的使用

    存儲(chǔ)整個(gè)HDFS集群的元數(shù)據(jù)(metaData) —— 整個(gè)集群中存儲(chǔ)的目錄和文件的索引 管理整個(gè)HDFS集群 接收客戶端的請(qǐng)求 負(fù)責(zé)節(jié)點(diǎn)的故障轉(zhuǎn)移 存儲(chǔ)數(shù)據(jù),是以block塊的形式進(jìn)行數(shù)據(jù)的存放。 默認(rèn)情況下block塊的大小是128M。 blocksize大小的計(jì)算公式: 尋址時(shí)間:下載文件時(shí)找到文件

    2024年02月09日
    瀏覽(97)
  • 【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建

    【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建

    此前搭建了hadoop的單機(jī)模式與偽分布式模式: 單機(jī)模式部署 偽分布式模式部署 中間拖得有點(diǎn)久了,今天索性做個(gè)了結(jié),把hadoop的全分布式模式部署的操作也簡(jiǎn)單地記錄一下,算是一個(gè)系統(tǒng)性的學(xué)習(xí)吧。 偽分布式模式是學(xué)習(xí)階段最常用的模式,它可以將進(jìn)程都運(yùn)行在同一臺(tái)機(jī)

    2023年04月08日
    瀏覽(90)
  • 【云計(jì)算】Hadoop2.x完全分布式集群(入門)

    【云計(jì)算】Hadoop2.x完全分布式集群(入門)

    【虛擬機(jī)】VMware Workstation 16 Pro 【鏡像】CentOS-7-x86_64-DVD-1804.iso 【java】jdk-8u281-linux-x64.rpm 【Hadoop】hadoop-2.7.1.tar.gz 【SSH遠(yuǎn)程】SecureCRTPortable.exe 【上傳下載】SecureFXPortable.exe 配網(wǎng)卡ens33 重啟網(wǎng)絡(luò) 私鑰、公鑰 克隆、改名、改IP 三臺(tái)機(jī)都要做:?? 生成密鑰 密鑰發(fā)送 登錄測(cè)試 had

    2024年04月12日
    瀏覽(26)
  • ??????Mapreduce分布式計(jì)算組件和YARN分布式資源調(diào)度

    上文我們已經(jīng)介紹Hadoop中HDFS分布式存儲(chǔ)組件 今天我們來學(xué)習(xí)Hadoop生態(tài)中另兩大組件Mapreduce和YARN Map階段 : 將數(shù)據(jù)拆分到不同的服務(wù)器后執(zhí)行Maptask任務(wù),得到一個(gè)中間結(jié)果 Reduce階段 : 將Maptask執(zhí)行的結(jié)果進(jìn)行匯總,按照Reducetask的計(jì)算 規(guī)則獲得一個(gè)唯一的結(jié)果 我們?cè)贛apReduce計(jì)算框

    2024年04月13日
    瀏覽(24)
  • Hadoop分布式計(jì)算與資源調(diào)度:打開專業(yè)江湖的魔幻之門

    Hadoop分布式計(jì)算與資源調(diào)度:打開專業(yè)江湖的魔幻之門

    本博客的內(nèi)容基于我個(gè)人學(xué)習(xí)黑馬程序員課程的學(xué)習(xí)筆記整理而成。我特此聲明,所有版權(quán)屬于黑馬程序員或相關(guān)權(quán)利人所有。本博客的目的僅為個(gè)人學(xué)習(xí)和交流之用,并非商業(yè)用途。 我在整理學(xué)習(xí)筆記的過程中盡力確保準(zhǔn)確性,但無法保證內(nèi)容的完整性和時(shí)效性。本博客的

    2024年02月11日
    瀏覽(29)
  • 大數(shù)據(jù)--分布式存儲(chǔ) Hadoop

    大數(shù)據(jù)--分布式存儲(chǔ) Hadoop

    Hadoop指Apache這款開源框架,它的核心組件有: HDFS(分布式文件系統(tǒng)):解決海量數(shù)據(jù)存儲(chǔ) MAPREDUCE(分布式運(yùn)算編程框架):解決海量數(shù)據(jù)計(jì)算 YARN(作業(yè)調(diào)度和集群資源管理的框架):解決資源任務(wù)調(diào)度 目前主流的hadoop框架已經(jīng)迭代更新到hadoop3.x的版本了,本篇的介紹也是

    2024年01月17日
    瀏覽(50)
  • 39學(xué)習(xí)分布式計(jì)算框架 Hadoop 的高可用方案,如 NameNode 集群、ZooKeeper

    39學(xué)習(xí)分布式計(jì)算框架 Hadoop 的高可用方案,如 NameNode 集群、ZooKeeper

    Hadoop 是一個(gè)分布式計(jì)算框架,用于存儲(chǔ)和處理大數(shù)據(jù)。在 Hadoop 集群中,NameNode 是一個(gè)關(guān)鍵組件,它負(fù)責(zé)管理 Hadoop 分布式文件系統(tǒng)(HDFS)中的文件和目錄。為了確保高可用性,需要使用多個(gè) NameNode 節(jié)點(diǎn)進(jìn)行冗余備份,并使用 ZooKeeper 進(jìn)行故障檢測(cè)和自動(dòng)故障切換。 以下是學(xué)

    2023年04月26日
    瀏覽(28)
  • 大數(shù)據(jù)之Hadoop分布式數(shù)據(jù)倉庫HBase

    大數(shù)據(jù)之Hadoop分布式數(shù)據(jù)倉庫HBase

    HBase 是一個(gè)構(gòu)建在 Hadoop 文件系統(tǒng)之上的面向列的數(shù)據(jù)庫管理系統(tǒng)。 要想明白為什么產(chǎn)生 HBase,就需要先了解一下 Hadoop 存在的限制?Hadoop 可以通過 HDFS 來存儲(chǔ)結(jié)構(gòu)化、半結(jié)構(gòu)甚至非結(jié)構(gòu)化的數(shù)據(jù),它是傳統(tǒng)數(shù)據(jù)庫的補(bǔ)充,是海量數(shù)據(jù)存儲(chǔ)的最佳方法,它針對(duì)大文件的存儲(chǔ),

    2024年02月02日
    瀏覽(27)
  • (大數(shù)據(jù)開發(fā)隨筆9)Hadoop 3.3.x分布式環(huán)境部署——全分布式模式

    (大數(shù)據(jù)開發(fā)隨筆9)Hadoop 3.3.x分布式環(huán)境部署——全分布式模式

    分布式文件系統(tǒng)中,HDFS相關(guān)的守護(hù)進(jìn)程也分布在不同的機(jī)器上,如: NameNode守護(hù)進(jìn)程,盡可能單獨(dú)部署在一臺(tái)硬件性能較好的機(jī)器中 其他的每臺(tái)機(jī)器上都會(huì)部署一個(gè)DataNode進(jìn)程,一般的硬件環(huán)境即可 SecondaryNameNode守護(hù)進(jìn)程最好不要和NameNode在同一臺(tái)機(jī)器上 守護(hù)進(jìn)程布局 Name

    2023年04月16日
    瀏覽(23)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包