国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建

這篇具有很好參考價(jià)值的文章主要介紹了【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

Centos7環(huán)境 – Hadoop全分布式模式部署

正文開(kāi)始@Assassin

此前搭建了hadoop的單機(jī)模式與偽分布式模式:

  • 單機(jī)模式部署
  • 偽分布式模式部署

中間拖得有點(diǎn)久了,今天索性做個(gè)了結(jié),把hadoop的全分布式模式部署的操作也簡(jiǎn)單地記錄一下,算是一個(gè)系統(tǒng)性的學(xué)習(xí)吧。


偽分布式模式是學(xué)習(xí)階段最常用的模式,它可以將進(jìn)程都運(yùn)行在同一臺(tái)機(jī)器上。在此模式下,可以模擬全分布式模式下的運(yùn)行狀態(tài),基本上可以完成全分布模式下的所有操作,所以說(shuō)偽分布模式是全分布模式的一個(gè)特例。

在全分布模式下,會(huì)在配置文件中體現(xiàn)出主節(jié)點(diǎn)與分節(jié)點(diǎn),可以指定哪些機(jī)器上運(yùn)行哪些服務(wù)以達(dá)到的成本與效率的平衡。在企業(yè)中主要采用的都是全分布式模式,節(jié)點(diǎn)從數(shù)十個(gè)到上百個(gè)不等。在學(xué)習(xí)階段,如果個(gè)人PC的性能足夠強(qiáng)勁,也可以使用多臺(tái)虛擬機(jī)代替,由于我的PC性能不是太好,這里估計(jì)只會(huì)開(kāi)兩臺(tái)虛擬機(jī)來(lái)進(jìn)行hadoop全分布式的部署。


1. 機(jī)器準(zhǔn)備:

因?yàn)槭遣渴鹑植际侥J?,所以?yīng)該是由多臺(tái)虛擬機(jī)或物理機(jī)組成的集群,我這里使用兩臺(tái)centos虛擬機(jī)來(lái)進(jìn)行相關(guān)的操作,整體搭建步驟如下:

準(zhǔn)備2臺(tái)虛擬機(jī) -> 完成系統(tǒng)安裝和網(wǎng)絡(luò)配置 -> 選擇其中一臺(tái)機(jī)器為主節(jié)點(diǎn)進(jìn)行Hadoop核心配置 -> 將配置后的Hadoop軟件分發(fā)到其他機(jī)器 -> 啟動(dòng)測(cè)試

建議把各主機(jī)名改為具有標(biāo)識(shí)意義的名稱,便于記憶和區(qū)分,同時(shí)建議設(shè)置靜態(tài)ip,以免自動(dòng)分配的ip發(fā)生變化。

!!默認(rèn)安裝了hadoop及jdk。

2. 修改主機(jī)名:

選擇一臺(tái)機(jī)器作為主節(jié)點(diǎn),命名為master:

[root@centos ~]# hostname master  #臨時(shí)生效
[root@centos ~]# hostnamectl set-hostname master #永久生效

【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
重新登錄后:hostname
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
另一臺(tái)機(jī)器為副節(jié)點(diǎn),命名為slave:

[root@centos8 ~]# hostname slave  #臨時(shí)生效
[root@centos8 ~]# hostnamectl set-hostname slave #永久生效

【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
重新登錄后:hostname
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建

3. 配置靜態(tài)ip:

使用root用戶或者sudoers用戶修改當(dāng)前啟用的網(wǎng)卡配置文件,所在目錄路徑為 /etc/sysconfig/network-scripts ,centos6系統(tǒng)默認(rèn)文件為ifcfg-eth0,centos7系統(tǒng)默認(rèn)文件為ifcfg-ens33,centos8系統(tǒng)默認(rèn)文件為ifcfg-ens160。

[root@master ~]# vim /etc/sysconfig/network-scripts/ifcfg-ens33

修改格式如下表所示:

# 原值為dhcp,修改為static
BOOTPROTO=static
# 添加IPADDR,對(duì)應(yīng)的值要與原ip在同一網(wǎng)段
IPADDR=xxx.xxx.xxx.xxx
# 添加NETMASK,指定子網(wǎng)掩碼,默認(rèn)為255.255.255.0
NETMASK=255.255.255.0
# 添加GATEWAY網(wǎng)關(guān),要與虛擬機(jī)網(wǎng)卡的網(wǎng)關(guān)設(shè)置一致,默認(rèn)僅主機(jī)模式為1,NAT模式為2
GATEWAY=xxx.xxx.xxx.1/2
# 如果需要連入外網(wǎng),則可以添加DNS1和DNS2配置,通常會(huì)將DNS1指定為網(wǎng)關(guān)地址

我的虛擬機(jī)是NAT模式,所以網(wǎng)關(guān)的最后一個(gè)字節(jié)為2,查看一下網(wǎng)關(guān):
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
我的網(wǎng)卡配置文件配置如下:完成后保存退出。
master主機(jī):
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
配置完成后保存退出,centos7使用systemctl restart network命令重啟網(wǎng)卡服務(wù)(centos6:service network restart),并使用ifconfig命令查看配置是否正確:

[root@master ~]# systemctl restart network
[root@master ~]# ifconfig

ip地址已經(jīng)更改為192.168.254.130,靜態(tài)ip地址:
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
slave主機(jī):
同理,也是修改網(wǎng)卡配置文件:這里將靜態(tài)ip設(shè)置成了192.168.254.140
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
配置完成后保存退出,centos7使用systemctl restart network命令重啟網(wǎng)卡服務(wù)(centos6:service network restart),并使用ifconfig命令查看配置是否正確:

[root@slave ~]# systemctl restart network
[root@slave ~]# ifconfig

ip地址已經(jīng)更改為192.168.254.140,靜態(tài)ip地址:
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
補(bǔ)充: 關(guān)于centos8的網(wǎng)卡配置:
centos8的網(wǎng)卡配置文件的操作與centos7相同,不同的是重啟網(wǎng)卡的操作。
使用centos7的systemctl restart network命令會(huì)提示:
Failed to restart network.service: Unit network.service not found.
新命令為:nmcli

  • nmcli connection reload ens160 :重啟網(wǎng)卡ens160
  • nmcli connection up ens160 :激活網(wǎng)卡ens160
  • nmcli connection down ens160 :停用網(wǎng)卡ens160

一般來(lái)說(shuō),重啟一個(gè)網(wǎng)卡就是reload + up兩個(gè)操作。

4. 配置hosts映射:

由于是全分布式模式,為了方便各節(jié)點(diǎn)之間的交互,同樣也為了盡量減少配置的修改,通常在配置文件中都會(huì)使用主機(jī)名,這就需要正確的建立主機(jī)名與ip地址的映射。目前已經(jīng)有了兩臺(tái)配置好網(wǎng)絡(luò)的機(jī)器(要保證在同一虛擬網(wǎng)絡(luò)模式下,即:同為NAT、僅主機(jī)、橋接等,這樣才能保證每臺(tái)機(jī)器都處在同一個(gè)網(wǎng)段,能夠正常通信)。現(xiàn)在有兩臺(tái)機(jī)器(master為主節(jié)點(diǎn)):

主機(jī)名稱 ip地址
master 192.168.254.130
slave 192.168.254.140

分別在兩臺(tái)主機(jī)上使用root用戶或者sudoers用戶修改/etc/hosts文件,修改方式為直接在文末追加以下內(nèi)容:

192.168.254.130 master
192.168.254.140 slave

master:

[root@master ~]# vim /etc/hosts

添加以下內(nèi)容:
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
slave:

[root@slave ~]# vim /etc/hosts

添加以下內(nèi)容:
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
配置完成后可以使用ping命令對(duì)主機(jī)名進(jìn)行測(cè)試,看是否能夠正確解析出ip地址,得到目標(biāo)主機(jī)的replay:

master: 可以正常ping通
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
slave: 可以正常ping通
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建


前置工作已經(jīng)完成,下面開(kāi)始對(duì)hadoop全分布式的部署。
注:以下操作均由master主機(jī)完成,之后通過(guò)scp復(fù)制到slave主機(jī)


5. hadoop配置:

對(duì)于hadoop軟件,通常會(huì)新建一個(gè)單獨(dú)的用戶來(lái)管理,下面以普通用戶hadoop為例來(lái)進(jìn)行操作。

配置hadoop環(huán)境變量:

[hadoop@master ~]$ vim ~/.bash_profile 

在文末添加以下信息:

HADOOP_HOME=/home/hadoop/hadoop-2.10.1 #hadoop解壓路徑
PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin ##拼接原有PATH,同時(shí)添加hadoop_home的bin及hadoop_home的sbin
export HADOOP_HOME  #導(dǎo)出HADOOP_HOME,提升為全局

使其內(nèi)容如下圖所示:保存退出。
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
刷新環(huán)境變量,使其立即生效:

[hadoop@master ~]$ source ~/.bash_profile 

使用hadoop version進(jìn)行測(cè)試:出現(xiàn)版本信息即為成功
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建

6. jdk配置:

配置jdk環(huán)境變量:

[hadoop@master ~]$ vim ~/.bash_profile 

在文末添加以下信息:

JAVA_HOME=/home/hadoop/jdk1.8.0_251 #jdk解壓目錄
PATH=$PATH:$JAVA_HOME/bin:$JAVA_HOME/jre/bin #拼接原有PATH,同時(shí)添加jdk的bin及jre/bin

#執(zhí)行export導(dǎo)出,提升為全局
export JAVA_HOME

使其內(nèi)容如下圖所示:保存退出。
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
刷新環(huán)境變量,使其立即生效:

[hadoop@master ~]$ source ~/.bash_profile 

使用java -version進(jìn)行測(cè)試:出現(xiàn)版本信息即為成功
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建

7. HDFS及YARN環(huán)境搭建:

全分布式模式運(yùn)行hadoop需要先進(jìn)行相關(guān)配置,并啟動(dòng)守護(hù)進(jìn)程(后臺(tái)運(yùn)行),基本配置文件所在路徑為hadoop的安裝目錄下的etc文件夾,也就是:
$HADOOP_HOME/etc/hadoop,在當(dāng)前環(huán)境中路徑為:

/home/hadoop/hadoop-2.10.1/etc/hadoop

cd進(jìn)入目錄,ls 查看一下文件夾中具體內(nèi)容:
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建

7.1 hadoop-env.sh:

hadoop-env.sh文件是在啟動(dòng)hadoop進(jìn)程時(shí),系統(tǒng)會(huì)自動(dòng)調(diào)用的一個(gè)腳本文件;在此文件中需配置前置環(huán)境,也就是告訴OS去哪查找jdk;

[hadoop@master hadoop]$ vim hadoop-env.sh

vim 進(jìn)入到 hadoop-env.sh 文件中,找到文件中的第25行JAVA_HOME,將其更改為如下所示:保存退出即可。【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建

7.2 core-site.xml:

core-site.xml 文件是Hadoop的核心配置文件,全部配置項(xiàng)可參考官方文檔:
我是官方文檔!
在這里需指定幾個(gè)配置項(xiàng),其中必須指定的是訪問(wèn)的端口;每一個(gè)配置項(xiàng)都有其默認(rèn)值;配置信息如下:

<configuration>
    <!-- Hadoop臨時(shí)文件存放路徑,默認(rèn)在/tmp目錄下 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/hadoop/hadoop-2.10.1/data</value>
    </property>
    <!-- NameNode結(jié)點(diǎn)的URI(包括協(xié)議、主機(jī)名稱、端口號(hào)) -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://master:9000</value>
    </property>
    <!-- 設(shè)置文件文件刪除后,被完全清空的時(shí)間,默認(rèn)為0,單位為分鐘 -->
    <property>
        <name>fs.trash.interval</name>
        <value>60</value>
    </property>
</configuration>

第一個(gè)配置項(xiàng):指定的是hadoop臨時(shí)文件存放的路徑,比如在執(zhí)行格式化操作之后,會(huì)生成一些跟集群相關(guān)的信息,如果不指定路徑的話,這些信息默認(rèn)會(huì)保存在 /tmp 目錄下:

  <!-- Hadoop臨時(shí)文件存放路徑,默認(rèn)在/tmp目錄下 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/hadoop/hadoop-2.10.1/data</value>
    </property>

第二個(gè)配置項(xiàng):是namenode的一個(gè)訪問(wèn)協(xié)議,也是一個(gè)比較關(guān)鍵的配置項(xiàng),包含協(xié)議,主機(jī)號(hào),端口號(hào)等:

   <!-- NameNode結(jié)點(diǎn)的URI(包括協(xié)議、主機(jī)名稱、端口號(hào)) -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://master:9000</value>
    </property>

第三個(gè)配置項(xiàng):指定的是當(dāng)文件刪除之后,想讓其保留多長(zhǎng)時(shí)間;也就是開(kāi)啟了類似回收站的機(jī)制,默認(rèn)是0min,指定時(shí)間之后就能在規(guī)定時(shí)間內(nèi)在對(duì)應(yīng)目錄中找回文件:

   <!-- 設(shè)置文件文件刪除后,被完全清空的時(shí)間,默認(rèn)為0,單位為分鐘 -->
    <property>
        <name>fs.trash.interval</name>
        <value>60</value>
    </property>

vim 編輯 core-site.xml 文件:
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建

7.3 hdfs-site.xml:

hdfs-site.xml 是跟HDFS相關(guān)的一個(gè)核心配置文件;其全部配置項(xiàng)可參考官方文檔:我是官方文檔!
在修改基本的配置文件:

<configuration>
    <!-- 冗余存儲(chǔ)--塊存儲(chǔ)份數(shù),默認(rèn)為3 -->
    <property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
    <!-- 關(guān)閉權(quán)限校驗(yàn),開(kāi)發(fā)學(xué)習(xí)時(shí)可開(kāi)啟,默認(rèn)為true -->
    <property>
        <name>dfs.permissions</name>
        <value>false</value>
    </property>
    <!-- namenode的http訪問(wèn)地址和端口 -->
    <property>
        <name>dfs.namenode.http-address</name>
        <value>master:50070</value>
    </property>
</configuration>

第一個(gè)配置項(xiàng):Hadoop默認(rèn)的塊存儲(chǔ)份數(shù)為3,Hadoop本身是一個(gè)全分布式的軟件,設(shè)置冗余存儲(chǔ)機(jī)制的目的和作用便是保證數(shù)據(jù)不丟失:

  <!-- 塊存儲(chǔ)份數(shù),默認(rèn)為3 -->
    <property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>

第二個(gè)配置項(xiàng):這里將權(quán)限校驗(yàn)的功能關(guān)閉掉,避免之后用API的方式去進(jìn)行調(diào)用的時(shí)候,不會(huì)出現(xiàn)一些權(quán)限相關(guān)的問(wèn)題;但是當(dāng)真正在工作時(shí)的生產(chǎn)環(huán)境中去部署的時(shí)候就不需要去添加此配置,默認(rèn)為True,也就是默認(rèn)是需要有相關(guān)的權(quán)限才能進(jìn)行操作;

  <!-- 關(guān)閉權(quán)限校驗(yàn),開(kāi)發(fā)學(xué)習(xí)時(shí)可開(kāi)啟,默認(rèn)為true -->
    <property>
        <name>dfs.permissions</name>
        <value>false</value>
    </property>

第三個(gè)配置項(xiàng):namenode的http訪問(wèn)地址和端口可以手動(dòng)進(jìn)行指定,這里指定端口號(hào)為50070;這里需要注意的是,通常情況下端口號(hào)前填寫的應(yīng)該是ip地址,這里用了master進(jìn)行了替代,這里能看出建立名稱和ip地址的映射的必要性:

 <!-- namenode的http訪問(wèn)地址和端口 -->
    <property>
        <name>dfs.namenode.http-address</name>
        <value>master:50070</value>
    </property>

vim 編輯 hdfs-site.xml 文件:
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建

7.4 mapred-site.xml:

mapred-site.xml 是Hadoop計(jì)算功能模塊相關(guān)配置文件,全部配置項(xiàng)可參考官方文檔:我是官方文檔!
直接指定執(zhí)行任務(wù)的方式為YARN,這樣一來(lái),在控制臺(tái)也就是網(wǎng)頁(yè)當(dāng)中可以看到整個(gè)的任務(wù)信息,默認(rèn)的方式為local;

<configuration>
    <!-- 設(shè)置運(yùn)行MapReduce任務(wù)方式為yarn,默認(rèn)為local,可選項(xiàng)還有classic -->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

這里需要注意,mapred-site.xml原來(lái)的配置文件的名稱為mapred-site.xml.template,這里需要先將其重命名為mapred-site.xml

vim 編輯mapred-site.xml文件:
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建

7.5 yarn-site.xml:

yarn-site.xml 是Yarn資源調(diào)度相關(guān)配置文件,比如說(shuō)指定在進(jìn)行任務(wù)運(yùn)行的時(shí)候分配多大的內(nèi)存,統(tǒng)一地由誰(shuí)來(lái)調(diào)配;全部配置項(xiàng)可參考官方文檔:我是官方文檔!

具體配置項(xiàng)如下:

<configuration>
    <!-- resourcemanager的主機(jī)名 -->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>master</value>
    </property>
    <!-- 暴露給客戶端的主機(jī)名及端口號(hào) -->
    <property>
        <name>yarn.resourcemanager.address</name>
        <value>master:8032</value>
    </property>
    <!-- 分配給容器的物理內(nèi)存量,單位是MB,設(shè)置為-1則自動(dòng)分配,默認(rèn)8192MB -->
    <property>
        <name>yarn.nodemanager.resource.memory-mb</name>
        <value>1536</value>
    </property>
    <!-- NodeManager上運(yùn)行的服務(wù)列表,可以配置成mapreduce_shuffle,多個(gè)服務(wù)使用逗號(hào)隔開(kāi) -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

第一個(gè)配置項(xiàng):指定資源統(tǒng)一由誰(shuí)來(lái)進(jìn)行調(diào)配,這里是 resourcemanager ;還有指定所在的機(jī)器,也就是計(jì)算的主體(主節(jié)點(diǎn)),這里是 master;

  <!-- resourcemanager的主機(jī)名 -->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>master</value>
    </property>

第二個(gè)配置項(xiàng):若是想要在從節(jié)點(diǎn)也可提交任務(wù),可以配置如下信息,若是單單只是在主節(jié)點(diǎn)上提交任務(wù)的話,該項(xiàng)也可不配置:

  <!-- 暴露給客戶端的主機(jī)名及端口號(hào) -->
    <property>
        <name>yarn.resourcemanager.address</name>
        <value>master:8032</value>
    </property>

第三個(gè)配置項(xiàng):主要是對(duì)第三個(gè)配置項(xiàng)進(jìn)行配置,分配給容器的物理內(nèi)存量一般來(lái)說(shuō)需要跟虛擬機(jī)的內(nèi)存成正比,我的虛擬機(jī)的內(nèi)存是2G,一般最多分配虛擬機(jī)內(nèi)存的 3/4,我這里自然也就是分配了 2048 * 0.75 = 1536M的空間;分配的空間太多就可能對(duì)其他進(jìn)程的運(yùn)行造成影響了;小伙伴們可以根據(jù)自己虛擬機(jī)的實(shí)際情況是指定一下,設(shè)置為 -1則為自動(dòng)分配,不設(shè)置默認(rèn)為8192M;

  <!-- 分配給容器的物理內(nèi)存量,單位是MB,設(shè)置為-1則自動(dòng)分配,默認(rèn)8192MB -->
    <property>
        <name>yarn.nodemanager.resource.memory-mb</name>
        <value>1536</value>
    </property>

第四個(gè)配置項(xiàng):指定NodeManager獲取數(shù)據(jù)的方式,這里設(shè)置的是mapreduce_shuffle,如果有多個(gè),可以在value處用逗號(hào)分隔:

    <!-- NodeManager上運(yùn)行的服務(wù)列表,可以配置成mapreduce_shuffle,多個(gè)服務(wù)使用逗號(hào)隔開(kāi) -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>

vim 編輯yarn-site.xml文件:
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建

7.6 slaves:

slaves 是從節(jié)點(diǎn)配置文件,在slaves當(dāng)中要配置它的從節(jié)點(diǎn)是哪個(gè);當(dāng)前是配置偽分布式,也就是說(shuō)主節(jié)點(diǎn)跟從節(jié)點(diǎn)都是自己,所以將 slaves 文件中的localhost直接改成slave即可;如果希望主節(jié)點(diǎn)本身也提供數(shù)據(jù)存儲(chǔ)和計(jì)算服務(wù),則可以將主節(jié)點(diǎn)主機(jī)名也填上,如下圖所示:

vim 編輯yarn-site.xml文件:
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建


HDFS及YARN環(huán)境搭建到此基本完成,接下來(lái)進(jìn)行ssh相關(guān)操作。

至此,Hadoop的安裝配置已經(jīng)全部完成,接下來(lái)只需將jdk解壓后的文件夾,hadoop解壓后的文件夾及環(huán)境變量配置文件同步到slave主機(jī)上就可以了,也就是說(shuō)兩臺(tái)主機(jī)的配置文件完全一樣。在centos系統(tǒng)中已經(jīng)默認(rèn)安裝并啟動(dòng)了ssh服務(wù),首先需要先配置免密碼登錄,這樣可以使發(fā)送文件和hadoop的使用更加方便。


8. ssh免密登錄:

在centos系統(tǒng)中已經(jīng)默認(rèn)安裝并啟動(dòng)了ssh服務(wù),首先需要先配置免密碼登錄,這樣可以使發(fā)送文件和hadoop的使用更加方便。

  • ① 生成密鑰:
[hadoop@master ~]$ ssh-keygen -t rsa
#整個(gè)過(guò)程一直回車即可

【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建

  • ② 拷貝公鑰:
# @前為用戶名,@后為主機(jī)名,在主節(jié)點(diǎn)master上執(zhí)行以下命令
[hadoop@master hadoop]$ ssh-copy-id hadoop@master
[hadoop@master hadoop]$ ssh-copy-id hadoop@slave
# 輸入一次hadoop用戶的密碼即可通過(guò)驗(yàn)證

【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
配置完成后,可以從主節(jié)點(diǎn)master免密登錄到從節(jié)點(diǎn)slave,如果希望各主機(jī)之間都可以互相免密登錄,則可以在所有主機(jī)上都執(zhí)行上述操作。

測(cè)試免密登錄:

[hadoop@master hadoop]$ ssh hadoop@slave

可以看到?jīng)]有輸入密碼,免密登錄配置成功:
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建

9. scp跨主機(jī)傳輸配置文件:

需要cp的文件太多,這里可以編寫一個(gè)簡(jiǎn)單的shell腳本來(lái)執(zhí)行:

[hadoop@master hadoop]$ vim scp.sh

編寫如下shell腳本:

# 拷貝JDK
scp -rf /home/hadoop/jdk1.8.0_251 hadoop@slave:/home/hadoop
# 拷貝Hadoop
scp -rf /home/hadoop/hadoop-2.10.1 hadoop@slave:/home/hadoop
# 拷貝環(huán)境變量配置文件,同名文件會(huì)自動(dòng)覆蓋
scp -rf /home/hadoop/.bash_profile hadoop@slave:/home/hadoop

【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
使用bash來(lái)執(zhí)行shell腳本:

[hadoop@master hadoop]$ bash scp.sh 

執(zhí)行完成后在slave主機(jī)上測(cè)試java -versionhadoop version
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
打印出版本信息即說(shuō)明配置移植成功。


注:hadoop集群操作均由master主機(jī)完成。


10. hadoop集群?jiǎn)?dòng):

在hadoop集群?jiǎn)?dòng)之前,先做一個(gè)格式化的操作,格式化主要是去生成集群自己需要的信息,比如主節(jié)點(diǎn)的唯一id等,主要是通過(guò)id來(lái)確認(rèn)哪些主機(jī)歸集群管理,也就是說(shuō)是通過(guò)id來(lái)與主機(jī)進(jìn)行綁定和對(duì)應(yīng)的;

10.1 格式化namenode:

第一次使用hadoop時(shí)需要進(jìn)行初始化,該操作只需要執(zhí)行一次,完成后會(huì)根據(jù)core-site.xml中的配置,在對(duì)應(yīng)的目錄下自動(dòng)創(chuàng)建相應(yīng)的文件夾:

[hadoop@master ~]$ hdfs namenode -format

此操作在之前指定的目錄當(dāng)中創(chuàng)建了一些文件:
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建

10.2 啟動(dòng)Hadoop進(jìn)程:

由于已經(jīng)配置了環(huán)境變量,可以直接執(zhí)行sbin目錄下的腳本:start-all.sh,如果需要停止可以執(zhí)行 stop-all.sh

[hadoop@master ~]$ start-all.sh

生成一些日志的保存路徑,只需將結(jié)尾的out改為log即可查看日志信息。
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建

10.3 jps指令驗(yàn)證:

jps為安裝配置好JDK環(huán)境后的命令,可以查看到當(dāng)前用戶下的Java進(jìn)程,如果無(wú)法正常使用需檢查JDK的環(huán)境變量配置:

[hadoop@master ~]$ jps

出現(xiàn)如下圖所示的5個(gè)進(jìn)程,證明成功(不包括jps本身)。需要注意的是,如果進(jìn)程在啟動(dòng)一小段時(shí)間之后自動(dòng)消失則證明該進(jìn)程存在問(wèn)題,需要根據(jù)日志信息進(jìn)行排查;

出現(xiàn) namenode主節(jié)點(diǎn),數(shù)據(jù)存儲(chǔ)服務(wù)相關(guān)的datanode,以及SecondaryNameNode;證明dfs正確。

出現(xiàn) NodeManager (運(yùn)行在單個(gè)節(jié)點(diǎn)上的代理),ResourceManager (是整個(gè)Yarn集群中最重要的組件之一,其主要的功能包括ApplicationMaster的管理);證明yarn正確。
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
到這里說(shuō)明主節(jié)點(diǎn)master的配置成功。

ssh免密登錄到slave主機(jī),執(zhí)行jps
【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建
出現(xiàn)兩個(gè)與從節(jié)點(diǎn)相關(guān)的進(jìn)程datanode,nodemanager說(shuō)明集群配置完成。

over~文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-401883.html

到了這里,關(guān)于【云計(jì)算平臺(tái)】Hadoop全分布式模式環(huán)境搭建的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • (大數(shù)據(jù)開(kāi)發(fā)隨筆9)Hadoop 3.3.x分布式環(huán)境部署——全分布式模式

    (大數(shù)據(jù)開(kāi)發(fā)隨筆9)Hadoop 3.3.x分布式環(huán)境部署——全分布式模式

    分布式文件系統(tǒng)中,HDFS相關(guān)的守護(hù)進(jìn)程也分布在不同的機(jī)器上,如: NameNode守護(hù)進(jìn)程,盡可能單獨(dú)部署在一臺(tái)硬件性能較好的機(jī)器中 其他的每臺(tái)機(jī)器上都會(huì)部署一個(gè)DataNode進(jìn)程,一般的硬件環(huán)境即可 SecondaryNameNode守護(hù)進(jìn)程最好不要和NameNode在同一臺(tái)機(jī)器上 守護(hù)進(jìn)程布局 Name

    2023年04月16日
    瀏覽(23)
  • hadoop偽分布式環(huán)境搭建,完整的詳細(xì)步驟

    hadoop偽分布式環(huán)境搭建,完整的詳細(xì)步驟

    1、VMware14 2、一臺(tái)ubtuntu 18 64位 3、主機(jī)名位master 4、ip 地址:192.168.136.31 5、本次實(shí)驗(yàn)需要的安裝包 1、 查看id 地址 2、 關(guān)閉防火墻 命令來(lái)關(guān)閉防火墻 命令查看當(dāng)前防火墻狀態(tài) 3、 修改主機(jī)名、 添加主機(jī)映射 修改虛擬機(jī)hosts文件,將ip地址添加進(jìn)來(lái) 使用 :wq 保存 測(cè)試是否修改

    2024年02月08日
    瀏覽(19)
  • 【教程】Hadoop完全分布式環(huán)境搭建全過(guò)程

    【教程】Hadoop完全分布式環(huán)境搭建全過(guò)程

    保姆級(jí)入門教程:圖片講解 + 各種問(wèn)題解決方案 集群服務(wù)器:hadoop102、hadoop103和hadoop104 虛擬機(jī)版本:CentOS7-1804 資源分享處(文章最后)提供CentOS7和Hadoop各組件壓縮包(也可以自行下載,要注意版本兼容的問(wèn)題),有需要自取~ 1, 模板虛擬機(jī)準(zhǔn)備 2, 克隆三臺(tái)虛擬機(jī),作為

    2024年02月06日
    瀏覽(22)
  • Linux環(huán)境搭建Hadoop及完全分布式集群

    Hadoop是一個(gè)開(kāi)源的分布式計(jì)算框架,旨在處理大規(guī)模數(shù)據(jù)集和進(jìn)行并行計(jì)算。核心包括兩個(gè)組件:HFDS、MapReduce。 配置方案 各虛擬機(jī)的用戶名分別為test0、test1、test2,主機(jī)名為hadoop100、hadoop101、hadoop102 虛擬機(jī)的分配如下: hadoop100:NameNode + ResourceManager hadoop101:DataNode + NodeM

    2024年03月23日
    瀏覽(35)
  • ZooKeeper之分布式環(huán)境搭建--仲裁模式與偽分布式環(huán)境搭建

    ZooKeeper之分布式環(huán)境搭建--仲裁模式與偽分布式環(huán)境搭建

    相關(guān)知識(shí) 為了完成本關(guān)任務(wù),你需要掌握:1.ZooKeeper單節(jié)點(diǎn)安裝方法,2.命令行基本操作。 ZooKeeper之仲裁模式 standlone 模式運(yùn)行ZooKeeper,便于評(píng)估,開(kāi)發(fā),測(cè)試和學(xué)習(xí)。但是在實(shí)際生產(chǎn)中,使用ZooKeeper均以仲裁模式( quorum mode )運(yùn)行, quorum mode 具有一組ZooKeeper服務(wù)器,這一組

    2024年02月05日
    瀏覽(22)
  • Spark單機(jī)偽分布式環(huán)境搭建、完全分布式環(huán)境搭建、Spark-on-yarn模式搭建

    Spark單機(jī)偽分布式環(huán)境搭建、完全分布式環(huán)境搭建、Spark-on-yarn模式搭建

    搭建Spark需要先配置好scala環(huán)境。三種Spark環(huán)境搭建互不關(guān)聯(lián),都是從零開(kāi)始搭建。 如果將文章中的配置文件修改內(nèi)容復(fù)制粘貼的話,所有配置文件添加的內(nèi)容后面的注釋記得刪除,可能會(huì)報(bào)錯(cuò)。保險(xiǎn)一點(diǎn)刪除最好。 上傳安裝包解壓并重命名 rz上傳 如果沒(méi)有安裝rz可以使用命

    2024年02月06日
    瀏覽(105)
  • 基于CentOS 7 的 Hadoop3版本分布式環(huán)境配置搭建

    基于CentOS 7 的 Hadoop3版本分布式環(huán)境配置搭建

    以下是在VMware虛擬機(jī)中安裝centos 7去配置hadoop。所以要準(zhǔn)備的包 centos 7:Index of /apache/hadoop/common/hadoop-3.3.5 hadoop3.3.5:Index of /apache/hadoop/common/hadoop-3.3.5 查看原本的jdk版本 ? 其實(shí)原來(lái)的openjdk版本也是可用的,但是hadoop3.x不支持較低版本的jdk,所以這里卸載重新安裝新版本jdk文件

    2024年02月01日
    瀏覽(21)
  • (小白全過(guò)程記錄)Ubuntu下偽分布式Hadoop環(huán)境搭建

    (小白全過(guò)程記錄)Ubuntu下偽分布式Hadoop環(huán)境搭建

    目錄 0.準(zhǔn)備 1.Hadoop偽分布式環(huán)境搭建 2.安裝ssh,配置ssh無(wú)密碼登錄 3.通過(guò)拖拽的方式將文件從windows傳到linux桌面 5.安裝hadoop 6.修改hadoop環(huán)境變量 7.修改配置文件 core-site.xml 8.修改配置文件hdfs-site.xml文件 9.執(zhí)行NameNode的格式化 10.開(kāi)啟NameNode和DataNode守護(hù)進(jìn)程 11.訪問(wèn)web頁(yè)面 12.關(guān)閉

    2024年02月03日
    瀏覽(27)
  • 頭歌Hadoop 開(kāi)發(fā)環(huán)境搭建及HDFS初體驗(yàn)(第2關(guān):配置開(kāi)發(fā)環(huán)境 - Hadoop安裝與偽分布式集群搭建)

    頭歌Hadoop 開(kāi)發(fā)環(huán)境搭建及HDFS初體驗(yàn)(第2關(guān):配置開(kāi)發(fā)環(huán)境 - Hadoop安裝與偽分布式集群搭建)

    注: 1 頭歌《Hadoop 開(kāi)發(fā)環(huán)境搭建及HDFS初體驗(yàn)》三關(guān)在一個(gè)實(shí)驗(yàn)環(huán)境下,需要三關(guān)從前往后按順序評(píng)測(cè),跳關(guān)或者實(shí)驗(yàn)環(huán)境結(jié)束后重新打開(kāi) 不能單獨(dú)評(píng)測(cè)通過(guò) 2 復(fù)制粘貼請(qǐng)用右鍵粘貼,CTRL+C/V不管用哦~ 第1關(guān):配置開(kāi)發(fā)環(huán)境 - JavaJDK的配置: 解壓: 配置環(huán)境變量: 細(xì)節(jié): vi

    2024年02月08日
    瀏覽(351)
  • Hadoop3.x完全分布式環(huán)境搭建Zookeeper和Hbase

    Hadoop3.x完全分布式環(huán)境搭建Zookeeper和Hbase

    集群規(guī)劃 IP地址 主機(jī)名 集群身份 192.168.138.100 hadoop00 主節(jié)點(diǎn) 192.168.138.101 hadoop01 從節(jié)點(diǎn) 192.168.138.102 hadoop02 從節(jié)點(diǎn) Hadoop完全分布式環(huán)境搭建請(qǐng)移步傳送門 先在主節(jié)點(diǎn)上進(jìn)行安裝和配置,隨后分發(fā)到各個(gè)從節(jié)點(diǎn)上。 1.1 解壓zookeeper并添加環(huán)境變量 1)解壓zookeeper到/usr/local文件夾

    2024年02月04日
    瀏覽(29)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包