国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程

這篇具有很好參考價值的文章主要介紹了Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

步驟一:

目標:*安裝虛擬機,在自己虛擬機上完成hadoop的偽分布式安裝。(安裝完成后要檢查)*

1)前期環(huán)境準備:(虛擬機、jdk、ssh)

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

2)SSH相關(guān)配置

安裝SSH Server服務(wù)器:apt-get install openssh-server

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

更改默認的SSH密鑰

cd /etc/ssh

mkdir ssh_key_backup

mv ssh_host_* ssh_key_backup

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

創(chuàng)建新密鑰:dpkg-reconfigure openssh-server

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

允許 SSH Root 訪問,修改SSH 配置文件 /etc/ssh/sshd_config :vim /etc/ssh/sshd_config

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

重啟SSH:service ssh restart

查看是否安裝成功:ssh -V

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

SSH登錄本機:ssh localhost

若是登陸失敗提示權(quán)限不足:

sudo passwd root 注意此處的root為當前登錄本機所在的用戶名,不一定是root

sudo service ssh restart

ssh localhost

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

SSH無密登錄:

退出剛才的ssh localhost:exit

cd ~/.ssh/

ssh-keygen -t rsa 這里一直回車就行

cat ~/.ssh/id_rsa.pub >> ./authorized_keys

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

最后,SSH授權(quán)完成,再次ssh localhost 則不再需要密碼了,也不再影響偽分布hadoop啟動。

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

3)安裝Hadoop

首先在官網(wǎng)上下載壓縮包(版本3.2.2)。然后將壓縮包拖進自己喜歡的目錄(個人是/home/jay17)。

1、之后創(chuàng)建一個空的文件夾,用來解壓hadoop

mkdir /home/Hadoop

2、解壓,-C 指定解壓路徑到創(chuàng)建的文件夾路徑。

tar zxvf hadoop-3.2.2.tar.gz -C /home/jay17/Hadoop/

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

3、授權(quán),使文件夾具有讀寫文件的權(quán)利,否則直接影響其他相關(guān)操作,必須要執(zhí)行?。?/p>

chown -R root /home/jay17/Hadoop/hadoop-3.2.2/

4、檢測Hadoop是否解壓安裝正確:

cd /home/jay17/Hadoop/hadoop-3.2.2/

./bin/hadoop version

遇到報錯說java環(huán)境變量不存在。

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

5、解決方法如下:

切換目錄: cd etc/hadoop

執(zhí)行:vim hadoop-env.sh

修改java_home路徑和hadoop_conf_dir路徑為具體的安裝路徑,例如:

export JAVA_HOME=/usr/local/jdk1.8.0_212

export HADOOP_CONF_DIR=/home/jay17/Hadoop/hadoop-3.2.2/etc/hadoop

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

重新加載使修改生效:source hadoop-env.sh

6、回去檢測Hadoop,已經(jīng)解壓安裝!

cd /home/jay17/Hadoop/hadoop-3.2.2/

./bin/hadoop version

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

4)配置Hadoop環(huán)境變量

與java環(huán)境變量的配置類似,用編輯器打開.bashrc文件(vim /root/.bashrc),保存修改后,執(zhí)行source /root/.bashrc命令使其生效:

export HADOOP_HOME=/home/jay17/Hadoop/hadoop-3.2.2

export CLASSPATH= C L A S S P A T H : CLASSPATH: CLASSPATH:HADOOP_HOME/lib

export PATH= P A T H : PATH: PATH:HADOOP_HOME/bin:$HADOOP_HOME/sbin

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

保存并生效后,便可在任何路徑下使用hadoop命令了,使用hadoop version命令驗證。出現(xiàn)此前執(zhí)行./bin/hadoop version命令時所出現(xiàn)的信息,則證明環(huán)境變量修改無誤。

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

一定要確定寫對后再執(zhí)行生效,避免不必要的麻煩,如果操作不當,導(dǎo)致命令幾乎失效的話,請執(zhí)行該命令恢復(fù):

export PATH=/sbin:/bin:/usr/sbin:/usr/bin:/usr/local/bin

5)偽分布模式配置

Hadoop的偽分布運行是指,同一個節(jié)點既是名稱節(jié)點(Name Node),也是數(shù)據(jù)節(jié)點(Data Node),讀取分布式文件系統(tǒng)HDFS的文件。安裝不同模式Hadoop,就是修改其配置文件符合模式要求。

Hadoop有倆配置文件,一個是core-site.xml文件,另一個是hdfs-site.xml,其相對路徑是在 hadoop-3.2.2/etc/hadoop/ 下。

首先,修改core-site.xml配置文件

vim /home/jay17/Hadoop/hadoop-3.2.2/etc/hadoop/core-site.xml

修改添加的內(nèi)容:

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/home/jay17/Hadoop/hadoop-3.2.2/tmp</value>
        <description>Abase for other temporary directories.</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
    <property>
        <name>dfs.permissions</name>
        <value>false</value>
    </property>
</configuration>

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

參數(shù)fs.defaultFS為默認文件系統(tǒng)名稱,其值為Hadoop的Name Node地址和端口號,如hdfs://localhost:9000,即表示Name Node是本機,端口9000是HDFS的RPC端口,是HDFS的默認端口。

參數(shù)hadoop.tmp.dir用于確定Hadoop文件系統(tǒng)的原信息與數(shù)據(jù)保存在哪個目錄下,是Hadoop文件系統(tǒng)依賴的基礎(chǔ)配置,很多路徑都依賴,如果hdfs-site.xml文件中不配置Name Node和Data Node的存放位置,默認放在此路徑中。

參數(shù)dfs.permissions的值如果是true則檢查權(quán)限,否則不檢查權(quán)限(每個人都可以存取文件),該參數(shù)NameNode上設(shè)定。

其次,修改hdfs-site.xml配置文件

vim /home/jay17/Hadoop/hadoop-3.2.2/etc/hadoop/hdfs-site.xml

修改添加的內(nèi)容:

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/home/jay17/Hadoop/hadoop-3.2.2/tmp/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/home/jay17/Hadoop/hadoop-3.2.2/tmp/dfs/data</value>
    </property>
</configuration>

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

參數(shù)dfs.replication指明設(shè)置hdfs副本數(shù),因為是偽分布模式,所以設(shè)置為“1”,默認備份3個副本。

參數(shù)dfs.namenode.name.dir 對應(yīng)的value是存放名稱節(jié)點的路徑,參數(shù)dfs.datanode.data.dir 對應(yīng)的value是存放數(shù)據(jù)節(jié)點的路徑。這倆路徑也可自行設(shè)置,但最好與臨時文件路徑一致,在初期實驗時,遇到問題可以一并處理。

Hadoop的運行方式是由配置文件決定的,因為運行Hadoop時會讀取配置文件,如果需要切換模式,只需要重新增加,刪除或者修改core-site.xml和hdfs-site.xml文件中的配置項。

6)Name Node的格式化和hadoop啟動關(guān)閉

配置完成,執(zhí)行Name Node的格式化:(由于,hadoop生效了環(huán)境變量,所以在任何路徑下均可執(zhí)行。)

hdfs namenode -format

出現(xiàn)"successfully formatted"和"Exiting with status 0"的字樣,則證明格式化成功!

start-dfs.sh只啟動Name Node和Data Node,啟動命令如下:

cd /home/jay17/Hadoop/hadoop-3.2.2

./sbin/start-dfs.sh

遇到以下報錯請參考以下文章:

hadoop啟動報錯:Attempting to operate on hdfs namenode as root_hzp666的博客-CSDN博客

Hadoop單點安裝FAQ-CSDN博客

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

WARNING: HADOOP_SECURE_DN_USER has been replaced by HDFS_DATANODE_SECURE_USER.-CSDN博客

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

查看進程命令:jps

起來四個進程如303108 DataNode 303012 NameNode 303453 Jps 303274 SecondaryNameNode就是正常的。

停止命令如下:

./sbin/stop-dfs.sh

所有命令連貫展示:

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

如果NameNode一直起不來,看看是不是端口沖突了,hadoop配置文件里面我們改的是9000端口,我的portainer(docker管理平臺)也是9000端口,導(dǎo)致我因為NameNode起不來卡了好幾天。。。。

步驟二:

1)在hdp家目錄下新建lab2目錄,在lab2目錄中新建word.txt,并在其中錄入若干單詞。

mkdir /home/lab2

echo jsj >> /home/lab2/word.txt

echo jsj >> /home/lab2/word.txt

echo jay17 >> /home/lab2/word.txt

echo jsj >> /home/lab2/word.txt

echo jay17 >> /home/lab2/word.txt

echo jsj >> /home/lab2/word.txt

echo jsj >> /home/lab2/word.txt

echo jay17 >> /home/lab2/word.txt

echo jsj >> /home/lab2/word.txt

echo jsj >> /home/lab2/word.txt

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

2)在HDFS的根目錄下新建hdp用戶目錄/user/hdp目錄,并在用戶目錄下新建input目錄,將本地文件系統(tǒng)中的lab2目錄中的word.txt文件上傳到HDFS的input目錄中。

hadoop fs -mkdir /user

hadoop fs -mkdir /user/hdp

hadoop fs -mkdir /user/hdp/input

hadoop fs -copyFromLocal /home/lab2/word.txt /user/hdp/input/

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

3)調(diào)用wordcount示例程序統(tǒng)計word.txt中的單詞出現(xiàn)次數(shù),將結(jié)果寫入用戶目錄的output中,查看統(tǒng)計結(jié)果。

hadoop jar /home/jay17/Hadoop/hadoop-3.2.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.2.jar wordcount /user/hdp/input /user/output

Hadoop: 是$HADOOP_HOME/bin下的shell腳本名。

jar:hadoop腳本需要的command參數(shù)。

/home/jay17/Hadoop/hadoop-3.2.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.2.jar :要執(zhí)行的jar包在本地文件系統(tǒng)中的完整路徑,參遞給RunJar類。

wordcount :main方法所在的類,參遞給RunJar類。

/user/hdp/input:傳遞給WordCount類,作為DFS文件系統(tǒng)的路徑,指示輸入數(shù)據(jù)來源。

/user/output:傳遞給WordCount類,作為DFS文件系統(tǒng)的路徑,指示輸出數(shù)據(jù)路徑。

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali

hadoop fs -ls /user/output

hadoop fs -cat /user/output/part-r-00000

Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程,日報專欄,linux,hadoop,運維,大數(shù)據(jù),kali文章來源地址http://www.zghlxwxcb.cn/news/detail-757952.html

到了這里,關(guān)于Kali Linux 安裝搭建 hadoop 平臺 調(diào)用 wordcount 示例程序 詳細教程的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • Hadoop集群WordCount詳解

    Hadoop集群WordCount詳解

    MapReduce理論介紹 MapReduce處理過程 MapReduce代碼 1.1 MapReduce編程模型 MapReduce采用”分而治之”的思想,把對大規(guī)模數(shù)據(jù)集的操作,分發(fā)給一個主節(jié)點管理下的各個分節(jié)點共同完成,然后通過整合各個節(jié)點的中間結(jié)果,得到最終結(jié)果。簡單地說,MapReduce就是”任務(wù)的分解與結(jié)果的

    2023年04月19日
    瀏覽(15)
  • Hadoop 實戰(zhàn) | 詞頻統(tǒng)計WordCount

    通過分析大量文本數(shù)據(jù)中的詞頻,可以識別常見詞匯和短語,從而抽取文本的關(guān)鍵信息和概要,有助于識別文本中頻繁出現(xiàn)的,這對于理解文本內(nèi)容和主題非常關(guān)鍵。同時,通過分析詞在文本中的相對頻率,可以幫助理解詞在不同上下文中的含義和語境。 \\\"紐約時報\\\"評

    2024年02月02日
    瀏覽(25)
  • 大數(shù)據(jù)技術(shù)棧-Hadoop3.3.4-完全分布式集群搭建部署-centos7(完全超詳細-小白注釋版)虛擬機安裝+平臺部署

    目錄 環(huán)境條件: 1、安裝虛擬機(已安裝好虛擬機的可跳轉(zhuǎn)至? 二、安裝JDK與Hadoop) (1)直接新建一臺虛擬機 (2)首次啟用虛擬機,進行安裝 一、集群前置環(huán)境搭建(三臺機器分別設(shè)置hostname、網(wǎng)卡(ip)配置、ssh免密登錄) 1、查看一下本機與虛擬機的網(wǎng)卡和ip信息 (1)

    2024年02月06日
    瀏覽(31)
  • 數(shù)據(jù)挖掘?qū)嶒灒菏褂?Hadoop 實現(xiàn) WordCount 應(yīng)用

    數(shù)據(jù)挖掘?qū)嶒灒菏褂?Hadoop 實現(xiàn) WordCount 應(yīng)用

    使用 Hadoop 實現(xiàn)WordCount 應(yīng)用。 WordCount 是一個最簡單的分布式應(yīng)用實例,主要功能是統(tǒng)計輸入目錄中所有單詞出現(xiàn)的總次數(shù),如文本文件中有如下內(nèi)容: Hello world 則統(tǒng)計結(jié)果應(yīng)為: Hello 1 world 1 WordCount 可以使用多種方式實現(xiàn),本次實驗內(nèi)容選擇使用 Hadoop 實現(xiàn) WordCount 程序,并

    2023年04月17日
    瀏覽(25)
  • 虛擬機+Hadoop下MapReduce的Wordcount案例

    虛擬機+Hadoop下MapReduce的Wordcount案例

    環(huán)境:ubuntu18.04 前提:Hadoop已經(jīng)搭建好 抄作業(yè)記得改標題 輸入內(nèi)容(可以自定義,抄作業(yè)別寫一樣的) yarn-site.xml 內(nèi)容如下,注意第一個property要改: ·輸入hadoop classpath(任意路徑下均可),將返回的內(nèi)容復(fù)制在第一個property的value中 *修改配置文件之后要重啟hadoop(關(guān)了又

    2024年02月07日
    瀏覽(14)
  • Hadoop之——WordCount案例與執(zhí)行本地jar包

    Hadoop之——WordCount案例與執(zhí)行本地jar包

    目錄 一、WordCount代碼 (一)WordCount簡介 1.wordcount.txt (二)WordCount的java代碼 1.WordCountMapper 2.WordCountReduce 3.WordCountDriver (三)IDEA運行結(jié)果 (四)Hadoop運行wordcount 1.在HDFS上新建一個文件目錄 2.新建一個文件,并上傳至該目錄下 3.執(zhí)行wordcount命令 4.查看運行結(jié)果 5.第二次提交報錯原因 6.進

    2024年02月08日
    瀏覽(43)
  • hadoop平臺完全分布式搭建

    安裝前準備 一、設(shè)置ssh免密登錄 1.編輯hosts文件,添加主機名映射內(nèi)容 vim ?/etc/hosts 添加內(nèi)容: 172.17.0.2 ?????master 172.17.0.3 ?????slave1 172.17.0.4 ?????slave2 2.生成公鑰和私鑰 ssh-keygen –t rsa 然后按三次回車 3.復(fù)制公鑰到其他容器(包括自己) ssh-copy-id master ssh-copy-id slav

    2024年03月17日
    瀏覽(30)
  • Hadoop大數(shù)據(jù)平臺搭建(超詳細步驟)

    Hadoop大數(shù)據(jù)平臺搭建(超詳細步驟)

    相關(guān)軟件下載鏈接: Xshell:家庭/學(xué)校免費 - NetSarang Website Xftp:家庭/學(xué)校免費 - NetSarang Website Xshell與Xftp官網(wǎng):XSHELL - NetSarang Website Jdk:百度網(wǎng)盤 請輸入提取碼? 提取碼:jdhp Hadoop:百度網(wǎng)盤 請輸入提取碼? ?提取碼:jdhp 需要配置好的虛擬機與相關(guān)環(huán)境的,可以點擊我的這篇

    2023年04月12日
    瀏覽(21)
  • 【云計算平臺】Hadoop單機模式環(huán)境搭建

    【云計算平臺】Hadoop單機模式環(huán)境搭建

    接上一篇博客 點我跳轉(zhuǎn)到虛擬機搭建,配置好虛擬機環(huán)境后進行hadoop單機模式的部署,我的云計算課程中只要求了簡單的單機模式部署,如果有精力的話,應(yīng)該會把偽分布式部署也簡單地記錄一下 Apache Hadoop 項目為可靠,可擴展的分布式計算開發(fā)開源軟件;Hadoop軟件庫是一個

    2024年02月02日
    瀏覽(22)
  • 大數(shù)據(jù)平臺搭建——hadoop集群(基于CentOS-7)的搭建

    大數(shù)據(jù)平臺搭建——hadoop集群(基于CentOS-7)的搭建

    目錄 總序 一、下載相關(guān)軟件的壓縮包 二、配置虛擬機上主節(jié)點相關(guān)設(shè)置 1、修改主機用戶名 2、進行ip地址映射 3、配置虛擬機網(wǎng)絡(luò)設(shè)置 ? 三、解壓并配置java、hadoop環(huán)境 1、解壓jdk、hadoop壓縮文件 ?2、配置jdk、hadoop環(huán)境 3、修改hadoop中的相關(guān)配置文件信息(最重要) 四、克隆

    2024年02月06日
    瀏覽(48)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包