国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【Hadoop】完全分布式集群搭建

這篇具有很好參考價值的文章主要介紹了【Hadoop】完全分布式集群搭建。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

一、前言

大家好,我是向陽花花花花,這篇文章是我歷時三天,推翻重做兩小時進行搭建的Hadoop集群(完全分布式)個人筆記和感想,收錄于初心的《大數(shù)據(jù)》專欄。

?? 個人主頁:初心%個人主頁
?? 個人簡介:大家好,我是初心,一名正在努力的雙非二本院校計算機專業(yè)學生
?? 座右銘:理想主義的花,終究會盛開在浪漫主義的土壤里!??????
??歡迎大家:這里是CSDN,我記錄知識的地方,喜歡的話請三連,有問題請私信??

在集群搭建期間我經(jīng)歷了各種各樣的錯誤,困難和BUG,不過都被我收割了。成功搭建之后,為了加深對Hadoop集群環(huán)境搭建的理解,我決定推翻重做,這次重做的過程就順利多了!終于,歷時兩小時,我再次搭建好了Hadoop環(huán)境,而這篇文章就是我兩次搭建總結(jié)出來的方法,分享出來希望能幫助到大家。

二、配置三臺虛擬機

2.1 克隆三臺虛擬機

先從一臺虛擬機克隆出三臺虛擬機,作為搭建Hadoop完全分布式的三個節(jié)點。這里我的三個節(jié)點分別叫 hadoop102 hadoop103 hadoop104,克隆這里需要注意的地方

虛擬機要是關(guān)機狀態(tài)才可以克隆
從虛擬機當前狀態(tài)克隆
創(chuàng)建完整克隆,之后填寫虛擬機名稱和存放位置就好
【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式

克隆好之后,分別再修改三臺虛擬機的內(nèi)存如下:

  • hadoop102
    【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式
  • hadoop103

【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式

  • hadoop104

【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式

2.2 配置克隆的虛擬機

  • 修改網(wǎng)絡(luò)配置文件
sudo vim /etc/sysconfig/network-scripts/ifcfg-ens33

【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式

  • 修改主機名
sudo vim /etc/hostname

【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式

  • 修改客戶機內(nèi)容
sudo vim /etc/hosts

【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式

  • 重啟reboot,在另外兩臺虛擬機并上將步驟再重復兩次
sudo reboot
  • Windows配置IP和主機名對應

進入到這個文件夾下,修改hosts文件

C:\Windows\System32\drivers\etc

【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式

將這個文件拖動到桌面,使用記事本打開,進行編輯后放回覆蓋原文件。

【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式

2.3 使用Xshell連接虛擬機

在xshell中新建一個連接,重復三次,分別用xshell連接上三臺虛擬機
【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式
至此,創(chuàng)建三個虛擬機節(jié)點,以及使用Xshell連接虛擬機工作我們就做好了。這是搭建Hadoop集群前的準備工作,這里我的 hadoop102 hadoop103 hadoopp104 分別對應的ip為 192.168.10.102/103/104.

2.4 配置SSH免密登錄

在搭建Hadoop集群之前,我們還要為三臺虛擬機搭建免密登錄,這是基礎(chǔ),否則后面會不斷提示輸入密碼。這是一個繁瑣的操作,因此配置了免密之后我們就可以省略這些步驟,節(jié)省時間。

  • 使用hadoop102登錄hadoop102
ssh localhost

接下來會提示問題,輸入yes就好,之后輸入本機的密碼,就可以連接上本機。我們登錄本機的目的是在 home 目錄下生成 .ssh 隱藏文件夾,以便進行下一步操作,下面退出剛才的登錄。

exit

進入到ssh文件夾(centos-1是我的普通用戶名,如果虛擬機只有root用戶,一定要創(chuàng)建一個普通用戶,否則找不到這個文件夾)。

cd /home/centos-1/.ssh/
  • 在ssh文件夾下生成私鑰

執(zhí)行下面的命令生成本機的私鑰

ssh-keygen -t rsa

執(zhí)行完這個命令之后,查看當前文件夾的文件,可以看到多出這兩個文件

【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式

  • 公私鑰對拷

執(zhí)行下面的命令,將Hadoop102的私鑰拷貝到Hadoop102 Hadoop103 Hadoop104上

ssh-copy-id hadoop102
ssh-copy-id hadoop103
ssh-copy-id hadoop104

最后,在Hadoop103,Hadoop104上重復上面的步驟,這樣就能實現(xiàn)三臺機器之前的相互免密登錄。

思考:root用戶進行免密登錄需不需要輸入密碼?

答案是要。因為root用戶下的.ssh文件夾和普通用戶是不一樣的,如果想要在 root 用戶下還能免密登錄,也要重復上面的步驟,個人認為hadoop102的root用戶配置了免密就可以了,其他的兩臺也可以配置

注意,這里是要為Hadoop102的root用戶配置hadoop102->hadoop103,hadoop102->hadoop104的免密的,否則后面使用分發(fā)腳本可能會提示沒有權(quán)限,無法分發(fā)!

三、Hadoop集群準備

3.1 安裝 rsync

安裝同步工具rsync,這是安裝xsync腳本的基礎(chǔ)

sudo yum install -y rsync

3.2 安裝xsync分發(fā)腳本

  • 查看環(huán)境變量
echo $PATH

【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式

  • 進入到在PATH中的一個目錄
cd /usr/local/bin
  • 復制下面的分發(fā)腳本 xsync.sh ,再使用下面的命令創(chuàng)建xsync文件并粘貼,保存退出
sudo vim xsync
  • 分發(fā)腳本xsync.sh
#! /bin/bash

# 1.判斷參數(shù)個數(shù)
if [ $# -lt 1 ]
then
    echo Not Enough Argument!
    exit;
fi

# 2.遍歷所有集群機器
for host in hadoop102 hadoop103 hadoop104
do
    echo ==================== $host ===================
    # 3.遍歷所有目錄,挨個發(fā)送

    for file in $@
    do
        # 4.判斷文件是否存在
        if [ -e $file ]
            then
                # 5.獲取父目錄
                pdir=$(cd -P $(dirname $file); pwd)

                # 6.獲取當前文件的名稱
                fname=$(basename $file)
                ssh $host "mkdir -p $pdir"
                rsync -av $pdir/$fname $host:$pdir
            else
                echo $file does not exists!
        fi
    done
done
  • 授予可執(zhí)行權(quán)限
sudo chmod 777 xsync

至此,虛擬機的任意目錄就可以使用xsync命令。如果不可以使用,則證明安裝失敗,請仔細檢查。

3.3 安裝JDK和安裝Hadoop

  • 進入centos操作目錄
cd /opt
  • 創(chuàng)建JDK和Hadoop的壓縮包存放目錄和文件存放目錄
sudo mkdir module
sudo mkdir software

在Xshell中通過Xftp文件上傳工具(或者lrzsz、finalShell等),上傳JDK和Hadoop的壓縮包到software目錄

【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式

  • 解壓JDK和Hadoop到module目錄
tar -xzvf jdk-8u202-linux-x64.tar.gz -C /opt/module/
tar -xzvf hadoop-3.1.3.tar.gz -C /opt/module/

3.4 配置環(huán)境變量

  • 進入到/etc/profile.d文件夾
cd /etc/profile.d
  • my_env.sh文件
# JAVA_HOME
# 只需修改java_home 因人而異 是自己的jdk安裝目錄
export JAVA_HOME=/opt/module/jdk1.8.0_202
export PATH=$PATH:$JAVA_HOME/bin

# HADOOP_HOME
# 同理 這里只需修改Hadoop_home,是Hadoop安裝目錄
export HADOOP_HOME=/opt/module/hadoop-3.1.3

export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

# 這里是centos-1是用戶名 因人而異 改為自己的虛擬機的普通用戶名或root
export HDFS_NAMENODE_USER=centos-1
export HDFS_DATANODE_USER=centos-1
export HDFS_SECONDARYNAMENODE_USER=centos-1
export YARN_RESOURCEMANAGER_USER=centos-1
export YARN_NODEMANAGER_USER=centos-1

  • 新建文件my_env.sh,將my_env.sh文件內(nèi)容復制進來
sudo vim my_env.sh
  • 刷新環(huán)境變量
source /etc/profile
  • 測試環(huán)境變量是否配置成功
java
hadoop

如果輸出一大片信息說明配置好了

3.5 分發(fā)

使用xsync將hadoop102的jdk、Hadoop以及環(huán)境變量分發(fā)到另外兩臺虛擬機上。

  • 分發(fā)JDK和Hadoop
xsync /opt/module/
  • 分發(fā)環(huán)境變量
xsync /etc/profile.d/my_env.sh

四、Hadoop集群搭建

4.1 修改配置文件

首次搭建Hadoop完全分布式,要分別修改下面四個文件,這里僅展示configuration標簽內(nèi)的內(nèi)容。

首先進入到Hadoop的etc目錄的hadoop目錄

cd /opt/module/hadoop-3.1.3/etc/hadoop/
vim core-site.xml

core-site.xml

<configuration>
<!--指定NameNode的地址-->
<property>
  <name>fs.defaultFS</name>
  <value>hdfs://hadoop102:8020</value>
  <description>version of this configuration file</description>
</property>
<!-- 指定Hadoop數(shù)據(jù)的存儲目錄-->
<property>
  <name>hadoop.tmp.dir</name>
  <value>/opt/module/hadoop-3.1.3/data</value>
  <description>A base for other temporary directories.</description>
</property>
</configuration>
vim mapred-site.xml

mapred-site.xml

<configuration>
<!-- 指定MapReduce程序運行在Yarn上 -->
<property>
  <name>mapreduce.framework.name</name>
  <value>yarn</value>
</property>
<property>
<name>yarn.app.mapreduce.am.env</name>
  <value>HADOOP_MAPRED_HOME=/opt/module/hadoop-3.1.3</value>
</property>
<property>
<name>mapreduce.map.env</name>
  <value>HADOOP_MAPRED_HOME=/opt/module/hadoop-3.1.3</value>
</property>
<property>
<name>mapreduce.reduce.env</name>
  <value>HADOOP_MAPRED_HOME=/opt/module/hadoop-3.1.3</value>
</property>
</configuration>
vim hdfs-site.xml

hdfs-site.xml


<configuration>
<!-- nn Web端訪問地址-->
<property>
  <name>dfs.namenode.http-address</name>
  <value>hadoop102:9870</value>
  <description>
    The address and the base port where the dfs namenode web ui will listen on.
  </description>
</property>
<!-- 2nn Web端訪問地址 -->
<property>
  <name>dfs.namenode.secondary.http-address</name>
  <value>hadoop104:9868</value>
</property>
</configuration>
vim yarn-site.xml

yarn-site.xml

<configuration>
<!--指定MR走shuffle-->
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
<!-- 指定ResourceManager的地址 -->
  <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>hadoop103</value>
  </property>    
<!--環(huán)境變量的繼承-->
  <property>
    <name>yarn.nodemanager.env-whitelist</name>
    <value>
JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
  </property>
</configuration>

修改完成之后,退出到hadoop目錄

cd /opt/module/hadoop-3.1.3/etc

執(zhí)行分發(fā),將etc下的hadoop目錄的四個配置文件同步

xsync hadoop

4.2 配置workers

進入到配置文件目錄

cd /opt/module/hadoop-3.1.3/etc/hadoop/

修改workers文件,將文件內(nèi)容改成三臺主機名即可,之后再次分發(fā),將修改同步。

vim workers

【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式

xsync /opt/module/hadoop-3.1.3/etc/hadoop/

4.3 格式化集群

在hadoop102上進行格式化

hdfs namenode -format

至此,Hadoop完全分布式(集群)就搭建好了。

4.4 啟動集群

下面這張圖就是我們搭建的Hadoop集群的集群規(guī)劃。首先進入到hadoop目錄

【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式

cd /opt/module/hadoop-3.1.3/

在Hadoop102啟動HDFS(Hadoop分布式文件系統(tǒng))

sbin/start-dfs.sh

在Hadoop103啟動YARN(Hadoop資源調(diào)度管理)

sbin/start-yarn.sh

使用jps命令來查看進程,驗證是否和集群規(guī)劃一致。

【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式
【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式
【Hadoop】完全分布式集群搭建,大數(shù)據(jù),hadoop,大數(shù)據(jù),分布式
如果按照教程來,執(zhí)行jps命令得到的結(jié)果和上圖不一致,請仔細檢查是否哪一步出現(xiàn)了問題,再進行下一步。

4.5 關(guān)閉集群

首先關(guān)閉YARN,再關(guān)閉HDFS,至此,Hadoop集群搭建(完全分布式搭建)成功。

sbin/stop-yarn.sh
sbin/stop-dfs.sh

五、結(jié)語

學習是一個漫長且持續(xù)漸進的過程,其中不免遇到很多困難,有時候讓你頭痛,讓你心慌。有人選擇逃避,有人選擇全力以赴,希望大家的每一天都變得充實。

? 這就是今天要分享給大家的全部內(nèi)容了,我們下期再見!
? 本文由初心原創(chuàng),首發(fā)于CSDN博客, 博客主頁:blog.csdn.net/qq_62592360
?? 理想主義的花,終究會盛開在浪漫主義的土壤里!
?? 如果你喜歡的話,記得點贊收藏關(guān)注,我在CSDN等你!文章來源地址http://www.zghlxwxcb.cn/news/detail-615089.html

到了這里,關(guān)于【Hadoop】完全分布式集群搭建的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • Hadoop完全分布式集群搭建

    Hadoop完全分布式集群搭建

    1.在虛擬機關(guān)機的狀態(tài)下選擇克隆 2.開始克隆 3.選擇從當前狀態(tài)創(chuàng)建 4.創(chuàng)建一個完整的克隆 5.選擇新的虛擬機存儲位置(選擇內(nèi)存充足的磁盤) 6.開始克隆 7.克隆完成 8.同樣的方法克隆第二臺虛擬機 9.在計算機中存在三臺虛擬機 將第一臺虛擬機更名為hadoop01 修改hadoop01的主機

    2024年02月02日
    瀏覽(23)
  • hadoop-3.3.3完全分布式集群搭建

    hadoop-3.3.3完全分布式集群搭建

    隨著大數(shù)據(jù)的不斷發(fā)展,hadoop在前段時間就已經(jīng)更新到了3.x版本,與2.x版本存在著一些差異,在某大數(shù)據(jù)競賽中也是使用的hadoop3.x的版本,本文就介紹hadoop3.x版本的完全分布式集群搭建。 jdk:1.8 hadoop:3.3.3 操作系統(tǒng):centos7 需要的所有安裝包都放在master節(jié)點的/opt目錄下,安

    2024年02月09日
    瀏覽(30)
  • Hadoop3.1.4完全分布式集群搭建

    Hadoop3.1.4完全分布式集群搭建

    在Centos7中直接使用root用戶執(zhí)行hostnamectl命令修改,重啟(reboot)后永久生效。 要求:三臺主機的名字分別為:master slave1 slave2 關(guān)閉后,可查看防火墻狀態(tài),當顯示disavtive(dead)的字樣,說明CentOS 7防火墻已經(jīng)關(guān)閉。 但要注意的是,上面的命令只是臨時關(guān)閉了CentOS 7防火墻,

    2024年04月17日
    瀏覽(56)
  • Linux環(huán)境搭建Hadoop及完全分布式集群

    Hadoop是一個開源的分布式計算框架,旨在處理大規(guī)模數(shù)據(jù)集和進行并行計算。核心包括兩個組件:HFDS、MapReduce。 配置方案 各虛擬機的用戶名分別為test0、test1、test2,主機名為hadoop100、hadoop101、hadoop102 虛擬機的分配如下: hadoop100:NameNode + ResourceManager hadoop101:DataNode + NodeM

    2024年03月23日
    瀏覽(36)
  • 寫給大忙人看Hadoop完全分布式集群搭建

    寫給大忙人看Hadoop完全分布式集群搭建

    vi /usr/local/hadoop/hadoop-2.10.0/etc/hadoop/hdfs-site.xml 修改其內(nèi)容為: dfs.replication 3 dfs.name.dir /usr/local/hadoop/hdfs/name dfs.data.dir /usr/local/hadoop/hdfs/data 復制mapred-site.xml.template為mapred-site.xml cp /usr/local/hadoop/hadoop-2.10.0/etc/hadoop/mapred-site.xml.template /usr/local/hadoop/hadoop-2.10.0/etc/hadoop/mapred-site.xml

    2024年03月27日
    瀏覽(23)
  • 用三臺云服務(wù)器搭建hadoop完全分布式集群

    用三臺云服務(wù)器搭建hadoop完全分布式集群

    本次利用云服務(wù)器搭建Hadoop集群, 在開始之前,你需要3臺云服務(wù)器,可以在同一家購買也可以在不同家購買。此次教程采用百度云產(chǎn)品,可以換不同賬號新手免費試用幾個月,具體配置如下: 服務(wù)器名稱 配置 磁盤容量 master 2cpu 內(nèi)存4GB 40G slave1 1cpu 內(nèi)存2GB 60G slave2 1cpu 內(nèi)存

    2024年02月04日
    瀏覽(87)
  • 搭建Hadoop3.x完全分布式集群(CentOS 9)

    搭建Hadoop3.x完全分布式集群(CentOS 9)

    虛擬機相關(guān): VMware workstation 16:虛擬機 vmware_177981.zip CentOS Stream 9:虛擬機 CentOS-Stream-9-latest-x86_64-dvd1.iso Hadoop相關(guān) jdk1.8:JDK jdk-8u261-linux-x64.tar.gz Hadoop 3.3.6:Hadoop Hadoop 3.3.6.tar.gz 輔助工具 putty:tools putty.exe mtputty:tools mtputty.exe winscp:tools WinSCP-6.3.1-Portable.zip 本文相關(guān)資源可以

    2024年04月14日
    瀏覽(32)
  • 三臺CentOS7.6虛擬機搭建Hadoop完全分布式集群(一)

    三臺CentOS7.6虛擬機搭建Hadoop完全分布式集群(一)

    這個是筆者大學時期的大數(shù)據(jù)課程使用三臺CentOS7.6虛擬機搭建完全分布式集群的案例,已成功搭建完全分布式集群,并測試跑實例。 1.1安裝完虛擬機發(fā)現(xiàn)沒有sudo命令和hadoop用戶執(zhí)行命令失敗 我在安裝CentOS 7.6虛擬機后,我發(fā)現(xiàn)不能執(zhí)行sudo命令,同時hadoop用戶執(zhí)行命令失敗。

    2024年02月03日
    瀏覽(29)
  • 大數(shù)據(jù)技術(shù)棧-Hadoop3.3.4-完全分布式集群搭建部署-centos7(完全超詳細-小白注釋版)虛擬機安裝+平臺部署

    目錄 環(huán)境條件: 1、安裝虛擬機(已安裝好虛擬機的可跳轉(zhuǎn)至? 二、安裝JDK與Hadoop) (1)直接新建一臺虛擬機 (2)首次啟用虛擬機,進行安裝 一、集群前置環(huán)境搭建(三臺機器分別設(shè)置hostname、網(wǎng)卡(ip)配置、ssh免密登錄) 1、查看一下本機與虛擬機的網(wǎng)卡和ip信息 (1)

    2024年02月06日
    瀏覽(31)
  • Linux從零搭建Hadoop集群(CentOS7+hadoop 3.2.0+JDK1.8+Mapreduce完全分布式集群案例)

    Linux從零搭建Hadoop集群(CentOS7+hadoop 3.2.0+JDK1.8+Mapreduce完全分布式集群案例)

    和相關(guān)配置版本 :Linux CentOS Hadoop Java 版本: CentOS7 Hadoop3.2.0 JDK1.8 虛擬機參數(shù)信息內(nèi)存3.2G、處理器2x2、內(nèi)存50G ISO:CentOS-7-x86_64-DVD-2009.iso 基本主從思路: 先把基礎(chǔ)的設(shè)置(SSH、JDK、Hadooop、環(huán)境變量、Hadoop和MapReduce配置信息)在一臺虛擬機(master)上配好,通過

    2024年02月05日
    瀏覽(28)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包