實驗環(huán)境:
操作系統(tǒng):Linux (Ubuntu 20.04.5)
Hadoop版本:3.3.2
JDK版本:1.8.0_162
hadoop與jdk的安裝包可詳見博客中:
https://blog.csdn.net/weixin_52308622/article/details/131947961?spm=1001.2014.3001.5501
(1)創(chuàng)建 hadoop 用戶(使用 /bin/bash 作為 Shell)、設(shè)置密碼(建議簡單)并為其添加管理員權(quán)限。具體命令如下:
sudo useradd -m hadoop -s /bin/bash
sudo passwd hadoop
sudo adduser hadoop sudo
?(2)切換到 hadoop 用戶
sudo?su - hadoop
(3)安裝 SSH server,并測試登陸。
sudo?apt-get install openssh-server
ssh localhost
??在執(zhí)行命令時,注意要按照指示輸入 yes,再輸入 hadoop?用戶的密碼。在執(zhí)行結(jié)束后,即可通過 SSH 登陸到本機。由于 hadoop 需要通過 SSH 來控制集群,所以需要對 SSH 設(shè)置免密登陸,即允許名稱節(jié)點可以無密碼登錄集群中的所有機器。
(4)設(shè)置SSH 免密登錄,利用 ssh-keygen 生成密鑰并將秘鑰加入到授權(quán)中
exit ????????????????????????#退出剛才的ssh localhost
cd ~/.ssh/ ???????????????????#若沒有該目錄,請先執(zhí)行一次ssh localhost
ssh-keygen -t rsa ?????????????#會有提示,都按回車就可以
cat ./id_rsa.pub >> ./authorized_keys ?????#加入授權(quán)
在執(zhí)行 ssh-keygen -t rsa 命令時,每次按回車鍵即可。此時免密設(shè)置完成,使用 ssh localhost 進行驗證。
(5)安裝 Java環(huán)境。Hadoop?3.3.2需要JDK版本在1.8及以上。JDK 1.8安裝方式多種多樣。這里采取手動安裝,需要自行下載 JDK1.8 的安裝包。將 JDK 安裝包放在 Downloads 目錄下,并且創(chuàng)建存放 JDK 文件的目錄。如果在切換?Downloads 目錄時出現(xiàn)找不到目錄,可以重啟系統(tǒng),手動選擇進入 hadoop?用戶。
cd?/usr/lib
sudo mkdir jvm ???#創(chuàng)建/usr/lib/jvm目錄用來存放JDK文件
cd ~/Downloads?? (Ubuntu為中文版則為cd ~/下載)
sudo tar -zxvf ./jdk-8u162-linux-x64.tar.gz -C /usr/lib/jvm ?
#把JDK文件解壓到/usr/lib/jvm目錄下
解壓:
(6)查看 JDK 是否解壓到 jvm 文件夾中。
cd?/usr/lib/jvm
ls
解壓成功:
(7)設(shè)置 java 環(huán)境變量使其生效,并查看版本號驗證是否安裝成功。
vim ~/.bashrc
上述命令使用vim編輯器打開了hadoop這個用戶的環(huán)境變量配置文件.bashrc,請在這個文件的開頭位置插入如下內(nèi)容:
export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_162
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
保存.bashrc文件并退出vim編輯器。然后,繼續(xù)執(zhí)行如下命令讓.bashrc文件的配置立即生效:
source ~/.bashrc
這時,可以使用如下命令查看是否安裝成功:
java -version
插入內(nèi)容:
至此,成功安裝了Java環(huán)境。下面將進入Hadoop的安裝。?
(8)下載 hadoop-3.3.2 至 Downloads 目錄,并將Hadoop安裝至/usr/local/中。
sudo tar -zxvf ~/Downloads/hadoop-3.3.2.tar.gz -C /usr/local #解壓到/usr/local中(/下載)
cd /usr/local/
sudo mv ./hadoop-3.3.2/ ./hadoop ???????#將文件夾名修改為hadoop
sudo chown -R hadoop ./hadoop ????????#修改文件權(quán)限
Hadoop解壓后即可使用。輸入如下命令來檢查Hadoop是否可用,成功則會顯示Hadoop版本信息:
cd?/usr/local/hadoop
./bin/hadoop version
?在執(zhí)行上述命令的過程中,需要注意相對路徑與絕對路徑:
(9)Hadoop偽分布式配置。對core-site和hdfs-site兩個配置文件分別進行修改。
1)cd /usr/local/hadoop/etc/hadoop/
2)vim core-site.xml?????#使用vim打開配置文件core-site.xml并進行修改
將 core-site.xml 中的配置修改為如下內(nèi)容:
<configuration>
????<property>
????????<name>hadoop.tmp.dir</name>
????????<value>file:/usr/local/hadoop/tmp</value>
????????<description>Abase for other temporary directories.</description>
????</property>
????<property>
????????<name>fs.defaultFS</name>
????????<value>hdfs://localhost:9000</value>
????</property>
</configuration>
3)vim hdfs-site.xml ????#使用vim打開配置文件hdfs-site.xml并進行修改
將 hdfs-site.xml 中的配置修改為如下內(nèi)容:
<configuration>
????<property>
????????<name>dfs.replication</name>
????????<value>1</value>
????</property>
????<property>
????????<name>dfs.namenode.name.dir</name>
????????<value>file:/usr/local/hadoop/tmp/dfs/name</value>
????</property>
????<property>
????????<name>dfs.datanode.data.dir</name>
????????<value>file:/usr/local/hadoop/tmp/dfs/data</value>
????</property>
</configuration>
將 core-site.xml 中的配置修改為如下內(nèi)容
將 hdfs-site.xml 中的配置修改為如下內(nèi)容
?(10)對NameNode進行格式化(建議:在執(zhí)行此步之前可以存快照)
cd?/usr/local/hadoop
./bin/hdfs namenode -format
成功的話,會看到“successfully formatted”的提示
看到“successfully formatted”的提示格式化成功
(11)開啟NameNode和DataNode守護進程。
在啟動完成后使用 jps 命令來查看是否啟動成功。若成功啟動則會列出如下進程:NameNode,?DataNode和SecondaryNameNode(如果SecondaryNameNode沒有啟動,請運行./sbin/stop-dfs.sh關(guān)閉進程,然后再次嘗試啟動)。如果沒有 NameNode 或 DataNode,那就是配置不成功,請仔細檢查之前的步驟,或通過查看啟動日志排查原因。
./sbin/start-dfs.sh
jps
?
?啟動成功
若此步運行出錯,可以選擇通過日志查看出錯內(nèi)容,恢復快照改正錯誤再重新啟動進程。若 datanode 沒有啟動,可以輸入以下語句解決:
cd /usr/local/hadoop
./sbin/stop-dfs.sh ??
rm -r ./tmp
./bin/hdfs namenode -format
./sbin/start-dfs.sh
(12)安裝成功后,在 linux 瀏覽器中訪問 http://localhost:9870?來查看NameNode和DataNode信息,還可以在線查看HDFS中的文件文章來源:http://www.zghlxwxcb.cn/news/detail-621438.html
文章來源地址http://www.zghlxwxcb.cn/news/detail-621438.html
到了這里,關(guān)于Hadoop的偽分布式安裝方法的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!