国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【云平臺技術(shù)】Hadoop全分布式安裝與配置

這篇具有很好參考價值的文章主要介紹了【云平臺技術(shù)】Hadoop全分布式安裝與配置。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

目錄

一、虛擬機安裝?

1、創(chuàng)建虛擬機

2、虛擬機啟動初始化

二、 虛擬機克隆

三、Linux系統(tǒng)的網(wǎng)絡(luò)配置

1、準備工作

2、 主機名和IP映射

2.1 配置主機名

2.2 配置IP映射?

?3、網(wǎng)絡(luò)參數(shù)配置

四、SSH服務(wù)配置?

1、生成密鑰文件

2、將本機公鑰文件復(fù)制到其他虛擬機上?

五、JDK安裝和Hadoop安裝?

1、準備安裝包?

2、下載安裝軟件Xshell

3、安裝JDK(所有虛擬機都要操作)

3.1 傳輸文件

3.2 解壓JDK

3.3 重命名JDK目錄

3.4 配置環(huán)境變量

3.5 使配置文件生效

3.6 查看是否配置成功

?4、Hadoop安裝(所有虛擬機都要操作)

4.1 傳輸文件

4.2 解壓Hadoop

4.3 打開配置文件?

4.4 配置Hadoop環(huán)境變量

4.5 使配置文件生效

4.6 查看是否配置成功

六、Hadoop集群配置

1、進入主節(jié)點配置目錄

?2、修改hadoop-env.sh文件

3、修改core-site.xml文件

4、修改hdfs-site.xml文件

5、修改mapred-site.xml文件

6、修改yarn-site.xml文件?

7、修改slaves文件

8、將主節(jié)點中配置好的文件和hadoop目錄copy給子節(jié)點?

9、使子節(jié)點中的配置文件生效?

10、在主節(jié)點格式化文件系統(tǒng)?

七、Hadoop集群測試

1、啟動集群

1.1 在主節(jié)點啟動所有HDFS服務(wù)進程

1.2 使用jps命令查看進程

2、關(guān)閉防火墻(所有虛擬機都要操作)

3、通過UI界面查看Hadoop運行狀態(tài)

4、查看java版本

5、查看hadoop版本?

??八、Hadoop集群案例?

一、虛擬機安裝?

1、創(chuàng)建虛擬機

? ? ? ?通過自定義的方式創(chuàng)建虛擬機:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?這里列出了VMware Workstation相關(guān)的信息:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?選擇稍后安裝虛擬機,因為安裝虛擬機只是相當于安裝了個裸機,還沒有操作系統(tǒng)。

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?選擇客戶機操作系統(tǒng)和版本:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?要安裝3臺虛擬機,把這三臺虛擬機放在一個大文件夾里,每個虛擬機再單獨放在一個文件夾里,因為所有虛擬機放在一個文件夾里可能會出問題:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?選擇分配處理器,分配越多,性能越好,此處只用作學(xué)習(xí),所以分配一個處理器就夠了:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?虛擬機內(nèi)存分配方法:實驗要求搭建三臺虛擬機,相當于三臺電腦,加上Windows系統(tǒng)本身這臺電腦,一共四臺計算機,可以將內(nèi)存平分一下界面,即同樣根據(jù)個人PC端的物理內(nèi)存進行合理分配,這里搭建的Hadoop01虛擬機后續(xù)將作為Hadoop集群主節(jié)點,所以通常會分配較多的內(nèi)存。

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?完成內(nèi)存設(shè)置后,根據(jù)向?qū)Э梢允褂媚J安裝方式連續(xù)單擊“下一步”按鈕。當進入到“指定磁盤容量”界面后,可以根據(jù)實際需要并結(jié)合PC端硬件情況合理選擇“最大磁盤大小”,此處設(shè)置為50GB,因為有時候20GB不夠用,50GB也不是立即就占用的,只是最大時占用這么多空間。

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?完成磁盤容量設(shè)置后,再次根據(jù)向?qū)Э梢允褂媚J安裝方式連續(xù)單擊“下一步”按鈕。當進入到“已準備好創(chuàng)建虛擬機”界面,就可以查看當前設(shè)置的要創(chuàng)建的虛擬機參數(shù),在確認無誤后單擊“完成”按鈕,即可完成新建虛擬機的設(shè)置。

? ? ? ?需注意,此時只是配置好了一臺虛擬機,他只是相當于一臺裸機,沒有操作系統(tǒng),接下來給他安裝一個操作系統(tǒng)。

2、虛擬機啟動初始化

? ? ? ?選中創(chuàng)建成功的Hadoop01虛擬機,打開“虛擬機設(shè)置”中的“CD/DVD(IDE)”選項,選中“使用ISO鏡像文件(M)”選項,并單擊“瀏覽(B)”按鈕來設(shè)置ISO鏡像文件的具體地址,此時就相當于給該虛擬機插了個安裝光盤,接下來就可以進行安裝了。

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?設(shè)置完ISO鏡像文件后,單擊 “確定”按鈕,然后選擇當前Hadoop01主界面的“打開虛擬機”選項,來啟動Hadoop01虛擬機。

? ? ? ?點擊第一個選項:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?主機名 hostname設(shè)置界面,自定義該臺虛擬機的主機名hostname(此處設(shè)置該臺虛擬機主機名hostname為 hadoop01)。

? ? ? ?完成主機名設(shè)置后,單擊 “Configure”選項,在彈出的窗口中選擇唯一的網(wǎng)卡并選中“Connect automatically(自動連接)”選項,并單擊“Apply(應(yīng)用)”按鈕。

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?完成主機名和網(wǎng)絡(luò)配置后,進行系統(tǒng)時區(qū)的選擇,此處選擇Asia/ShangHai。

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?完成系統(tǒng)時區(qū)配置后,進入到root 用戶密碼設(shè)置界面,可以自定義root用戶密碼,但是要求密碼長度最低6個字符(如果密碼強度較低可能出現(xiàn)提示窗,直接單擊“Use Anyway(無論如何都用)”選項即可),此處設(shè)置為123456。

? ? ? ?然后就是安裝和重啟:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?至此,就完成了CentOS虛擬機的安裝。

? ? ? ?為了規(guī)范后續(xù)Hadoop集群相關(guān)軟件和數(shù)據(jù)的安裝配置,這里在虛擬機的根目錄下創(chuàng)建一些文件夾作為約定,具體如下:

? ? ? ?/export/data/:存放數(shù)據(jù)類文件;

? ? ? ?/export/servers/:存放服務(wù)類軟件;

? ? ? ?/export/software/:存放安裝包文件。

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

二、 虛擬機克隆

? ? ? ?目前已經(jīng)成功安裝好了一臺搭載 CentOS鏡像文件的Linux系統(tǒng),而一臺虛擬機遠遠不能滿足搭建Hadoop集群的需求,因此需要對已安裝的虛擬機進行克隆。VMware提供了兩種類型的克隆,分別是完整克隆和鏈接克隆。

? ? ? ?完整克隆:是對原始虛擬機完全獨立的一個復(fù)制,它不和原始虛擬機共享任何資源,可以脫離原始虛擬機獨立使用。

? ? ? ?鏈接克?。盒枰驮继摂M機共享同一虛擬磁盤文件,不能脫離原始虛擬機獨立運行。但是,采用共享磁盤文件可以極大縮短創(chuàng)建克隆虛擬機的時間,同時還節(jié)省物理磁盤空間。通過鏈接克隆,可以輕松地為不同的任務(wù)創(chuàng)建一個獨立的虛擬機。

? ? ? ?以上兩種克隆方式中,完整克隆的虛擬機文件相對獨立并且安全,在實際開發(fā)中也較為常用,此處使用完整克隆方式。

? ? ? ?在VMware工具左側(cè)系統(tǒng)資源庫中右擊 Hadoop01,選擇“管理”列表下的“克隆”選項,彈出克隆虛擬機向?qū)А?/p>

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?根據(jù)克隆向?qū)нB續(xù)單擊界面中的“下一步”按鈕,進入到“克隆類型”界面后﹐選擇“創(chuàng)建完整克隆(F)”選項。

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?選擇完整克隆方式后,單擊“下一步”按鈕,進入到“新虛擬機名稱”界面,在該界面自定義新虛擬機名稱和位置。

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?設(shè)置好新虛擬機名稱和位置后,單擊“完成”按鈕就會進入新虛擬機克隆過程,稍等片刻就會跳轉(zhuǎn)到虛擬機克隆的結(jié)果界面。在克隆成功界面,單擊“關(guān)閉”按鈕就完成了虛擬機的克隆。

? ? ? ?重復(fù)上述步驟,即可克隆出hadoop03虛擬機:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?有時為了方便管理這三臺虛擬機,在VMware工具左側(cè)系統(tǒng)資源庫中右擊“我的計算機”,新建一個文件夾,將創(chuàng)建好的hadoop01、hadoop02、hadoop03虛擬機拖進去。

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

三、Linux系統(tǒng)的網(wǎng)絡(luò)配置

? ? ? ?通過前面方式安裝的虛擬機hadoop01雖然能夠正常使用,但是該虛擬機的IP是動態(tài)生成的,在不斷的開停過程中很容易改變,非常不利于實際開發(fā);而通過Hadoop01克隆的虛擬機(hadoop02和hadoop03)則完全無法動態(tài)分配到IP,直接無法使用。因此,還需要對這三臺虛擬機的網(wǎng)絡(luò)分別進行配置。?

1、準備工作

? ? ? ?對虛擬機進行網(wǎng)絡(luò)配置,先把網(wǎng)段都改成137。

? ? ? ?并分別對子網(wǎng)、子網(wǎng)掩碼、NAT、DHCP進行設(shè)置:

? ? ? ?子網(wǎng)IP設(shè)置為192.168.137.0,最后一位設(shè)置為0,否則會出現(xiàn)子網(wǎng)掩碼與IP沖突。

? ? ? ?網(wǎng)關(guān)最后一位設(shè)置為2即可。

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?再對Windows進行網(wǎng)絡(luò)配置,要與虛擬機編輯中的虛擬網(wǎng)絡(luò)編輯器中的設(shè)置一致:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?IP地址:這個IP在局域網(wǎng)內(nèi)部不沖突即可

? ? ? ?子網(wǎng)掩碼:默認即可

? ? ? ?默認網(wǎng)關(guān):要與虛擬機編輯中的虛擬網(wǎng)絡(luò)編輯器中的NAT設(shè)置的網(wǎng)關(guān)一致

? ? ? ?首選DNS服務(wù)器:使用谷歌提供的免費的DNS服務(wù)器即可

? ? ? ?配置好之后,點確定即可:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

2、 主機名和IP映射

? ? ? ?遇到的問題:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?解決方法:

? ? ? ?把虛擬機內(nèi)存改為2GB即可。

? ? ? ?開啟三臺虛擬機,使用root身份登錄,并查詢虛擬機hadoop01、hadoop02、hadoop03的主機名,因為hadoop02、hadoop03是從hadoop01克隆過來的,所以主機名都是hadoop01:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

?2.1 配置主機名

? ? ? ?hadoop02:

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?hadoop03:

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?執(zhí)行上述指令后,虛擬機hadoop01, hadoop02,hadoop03主機名依次設(shè)置為hadoop01 , hadoop02和hadoop03。

2.2 配置IP映射?

? ? ? ?配置IP映射,要明確當前虛擬機的IP和主機名,主機名可以參考前面已配置的主機名,但IP地址必須在VMware 虛擬網(wǎng)絡(luò)IP地址范圍內(nèi)。

? ? ? ?然后,執(zhí)行如下指令對IP映射文件 hosts進行編輯:

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?三個虛擬機都按上述步驟執(zhí)行一遍,IP映射配置完成。

?3、網(wǎng)絡(luò)參數(shù)配置

? ? ? ?上一步中,對虛擬機的主機名和IP映射進行了配置,而想要虛擬機能夠正常使用,還需要進行網(wǎng)絡(luò)參數(shù)配置。

hadoop01:

? ? ? ?(1)查看網(wǎng)絡(luò)是否連通

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?(2)安裝net-tools

? ? ? ?yum upgrade

? ? ? ?yum install net-tools

? ? ? ?(3)查看MAC地址(enter后面):

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?(4)修改網(wǎng)絡(luò)配置文件:

? ? ? ?執(zhí)行如下指令:

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?進入文本編輯,把BOOTPROTO改為static,ONBOOT改為yes

? ? ? ?ONBOOT=yes:表示啟動這塊網(wǎng)卡;

? ? ? ?BOOTPROTO=static:表示靜態(tài)路由協(xié)議,可以保持IP固定;

? ? ? ?HWADDR:表示虛擬機 MAC地址,需要與當前虛擬機MAC地址一致;

? ? ? ?IPADDR:表示虛擬機的IP地址,這里設(shè)置的IP地址要與前面IP映射配置時的IP地址一致,否則無法通過主機名找到對應(yīng)IP;

? ? ? ?GATEWAY:表示虛擬機網(wǎng)關(guān),通常都是將IP地址最后一位改成2;

? ? ? ?NETMASK:表示虛擬機子網(wǎng)掩碼,通常都是255.255.255.0;

? ? ? ?DNS1:表示域名解析器,此處采用Google提供的免費DNS服務(wù)器8.8.8.8(也可以設(shè)置為PC端電腦對應(yīng)的DNS)。

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?(5)重啟網(wǎng)絡(luò)服務(wù),查看是否配置成功

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?(6)重啟虛擬機后,查看是否連通網(wǎng)絡(luò)(ip地址并未改變,且能連通網(wǎng)絡(luò)):

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)? ? ? ?hadoop02:

? ? ? ?(1)查看mac地址

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?(2)網(wǎng)絡(luò)配置文件修改

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?(3)重新啟動網(wǎng)絡(luò)配置(查看網(wǎng)絡(luò)是否可用):

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?按照以上步驟,再配置另外一臺虛擬機Hadoop03。

? ? ? ?hadoop03:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

四、SSH服務(wù)配置?

? ? ? ?通過前面的操作,已經(jīng)完成了三臺虛擬機Hadoop01、Hadoop02和Hadoop03的安裝和網(wǎng)絡(luò)配置,雖然這些虛擬機已經(jīng)可以正常使用了,但是依然存在下列問題:

? ? ? ?(1)實際工作中,服務(wù)器被放置在機房中,同時受到地域和管理的限制,開發(fā)人員通常不會進入機房直接上機操作,而是通過遠程連接服務(wù)器,進行相關(guān)操作。

? ? ? ?(2)在集群開發(fā)中,主節(jié)點通常會對集群中各個節(jié)點頻繁地訪問,就需要不斷輸入目標服務(wù)器的用戶名和密碼,這種操作方式非常麻煩并且還會影響集群服務(wù)的連續(xù)運行為了解決上述問題,可以通過配置 SSH 服務(wù)來分別實現(xiàn)遠程登錄和 SSH 免密登錄功能。

1、生成密鑰文件

? ? ? ?四次回車:

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

2、將本機公鑰文件復(fù)制到其他虛擬機上?

? ? ? ?注意:接收方需先開機

? ? ? ?在hadoop01上執(zhí)行,先輸入yes,后輸入對應(yīng)主機的密碼,三臺虛擬機配置操作相同:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?在虛擬機hadoop02,hadoop03都需要執(zhí)行,保證三臺主機都能夠免密登錄:

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

五、JDK安裝和Hadoop安裝?

1、準備安裝包?

? ? ? ?hadoop-2.7.4.tar.gz

? ? ? ?jdk-8u161-linux-x64.tar.gz

2、下載安裝軟件Xshell

? ? ? ?打開Xshell后點擊文件并選擇新建,名稱填hadoop01,主機填寫hadoop01的IP地址,再點擊用戶身份驗證,把hadoop01的賬號、密碼輸入,就可以通過Xshell控制虛擬機,方便后續(xù)軟件的傳輸、復(fù)制、粘貼。

? ? ? ?重復(fù)步驟新建會話控制hadoop02,hadoop03。

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?出現(xiàn)下示界面,即為連接成功:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

3、安裝JDK(所有虛擬機都要操作)

3.1 傳輸文件

? ? ? ?在Xshell先進入software文件內(nèi),然后下載rz命令,并使用rz命令進行文件上傳,此時會彈出上傳的窗口,選擇要上傳的文件,點擊確定即可將本地文件上傳到Linux上。

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

?

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

?3.2 解壓JDK

? ? ? ?cd /export/software

? ? ? ?tar -zxvf jdk-8u161-linux-x64.tar.gz -C /export/servers/

?3.3 重命名JDK目錄

? ? ? ?cd /export/servers

? ? ? ?mv jdk1.8.0_161 jdk

3.4 配置環(huán)境變量

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

?3.5 使配置文件生效

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

3.6 查看是否配置成功

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?(hadoop02、hadoop03都按上述步驟執(zhí)行一遍)

?4、Hadoop安裝(所有虛擬機都要操作)

4.1 傳輸文件

? ? ? ?遇到的問題:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?解決方法:

? ? ? ?雙擊左側(cè)會話,重新連接即可。

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

4.2 解壓Hadoop

? ? ? ?cd /export/software

? ? ? ?tar -zxvf hadoop-2.7.4.tar.gz -C /export/servers/?

4.3 打開配置文件?

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

?4.4 配置Hadoop環(huán)境變量

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

?4.5 使配置文件生效

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

?4.6 查看是否配置成功

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?(hadoop02、hadoop03都按上述步驟執(zhí)行一遍)

六、Hadoop集群配置

1、進入主節(jié)點配置目錄

2、修改hadoop-env.sh文件

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?上述配置文件中設(shè)置的是Hadoop運行時需要的JDK環(huán)境變量,目的是讓Hadoop啟動時能夠執(zhí)行守護進程。

3、修改core-site.xml文件

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

該文件是Hadoop的核心配置文件,其目的是配置HDFS地址、端口號,以及臨時文件目錄。

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?在上述核心配置文件中,配置了HDFS的主進程NameNode運行主機(也就是此次Hadoop集群的主節(jié)點位置),同時配置了Hadoop運行時生成數(shù)據(jù)的臨時目錄。

?4、修改hdfs-site.xml文件

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?該文件用于設(shè)置HDFS的 NameNode和 DataNode兩大進程。

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?在上述配置文件中,配置了HDFS數(shù)據(jù)塊的副本數(shù)量,并根據(jù)需要設(shè)置了Secondary NameNode所在服務(wù)的HTTP協(xié)議地址。

5、修改mapred-site.xml文件

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?在上述配置文件中,就是指定了Hadoop 的MapReduce運行框架為YARN。

6、修改yarn-site.xml文件?

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?本文件是YARN框架的核心配置文件,需要指定YARN集群的管理者。

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?在上述配置文件中,配置了YARN的主進程ResourceManager運行主機為hadoop01 ,同時配置了NodeManager運行時的附屬服務(wù),需要配置為mapreduce_shuffle才能正常運行MapReduce默認程序。

7、修改slaves文件

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?該文件用于記錄Hadoop集群所有從節(jié)點(HDFS的 DataNode和 YARN 的NodeManager所在主機)的主機名,用來配合一鍵啟動腳本啟動集群從節(jié)點。

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

8、將主節(jié)點中配置好的文件和hadoop目錄copy給子節(jié)點?

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

9、使子節(jié)點中的配置文件生效?

? ? ? ?返回hadoop02和hadoop03節(jié)點執(zhí)行下面命令:

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

10、在主節(jié)點格式化文件系統(tǒng)?

? ? ? ?至此,整個集群所有節(jié)點就都有了hadoop運行所需要的環(huán)境和文件,hadoop集群也就安裝配置完成。但是此時還不能直接啟動集群,因為在初次啟動HDFS集群時,必須對主節(jié)點進行格式化處理,具體指令如下。

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?出現(xiàn)successfully formatted 即為格式化成功

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?另外需要注意的是,上述格式化指令只需要在 Hadoop集群初次啟動前執(zhí)行即可,后續(xù)重復(fù)啟動就不再需要執(zhí)行格式化了。

七、Hadoop集群測試

1、啟動集群

1.1 在主節(jié)點啟動所有HDFS服務(wù)進程

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?上述使用腳本一鍵啟動的方式,先啟動了集群所有的HDFS服務(wù)進程,然后再啟動了所有的 YARN服務(wù)進程,這就完成了整個Hadoop集群服務(wù)的啟動。

1.2 使用jps命令查看進程

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

2、關(guān)閉防火墻(所有虛擬機都要操作)

? ? ? ?遇到的問題:

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?解決方法:

? ? ? ?換用新的命令執(zhí)行:

? ? ? ?systemctl disable firewalld.service

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?查看防火墻狀態(tài),顯示操作成功:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

?3、通過UI界面查看Hadoop運行狀態(tài)

? ? ? ?Hadoop集群正常啟動后,它默認開放了50070和8088兩個端口,分別用于監(jiān)控 HDFS集群和YARN集群。通過UI可以方便地進行集群的管理和查看,只需要在本地操作系統(tǒng)的瀏覽器輸入集群服務(wù)的IP和對應(yīng)的端口號即可訪問。

? ? ? ?在Windows系統(tǒng)下,訪問192.168.137.131:50070,查看HDFS集群狀態(tài):

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?在Windows系統(tǒng)下,訪問192.168.137.131:8088,查看Yarn集群狀態(tài):

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

?4、查看java版本

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

5、查看hadoop版本?

?八、Hadoop集群案例

? ? ? ?通過Hadoop經(jīng)典案例——單詞統(tǒng)計,來演示 Hadoop集群的簡單使用。

? ? ? ?打開 HDFS的UI,選擇【Utilities】→【Browse the file system】查看分布式文件系統(tǒng)里的數(shù)據(jù)文件,可以看到新建的HDFS上沒有任何數(shù)據(jù)文件。

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?先在集群主節(jié)點hadoop01 上的/export/data/目錄下,使用“vi word. txt”指令新建一個word.txt文本文件,并編寫一些單詞內(nèi)容。

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?接著,在HDFS上創(chuàng)建/wordcount/input目錄,并將word. txt文件上傳至該目錄下,表示單詞統(tǒng)計源文件所在的目錄:

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?返回HDFS查看是否創(chuàng)建成功:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?接下來,把word.txt文件從本地上傳到input目錄下:

? ? ? ?hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?返回HDFS查看是否上傳成功:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?運行jar包,實現(xiàn)詞頻統(tǒng)計:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?正在運行:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?上傳完成:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?查看輸出目錄下的文件,是否完成單詞統(tǒng)計:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?在C:\ Windows\System32\drivers\etc中添加集群服務(wù)的IP映射:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?單詞統(tǒng)計結(jié)果,顯示成功:

hadoop安裝與配置,分布式,hadoop,大數(shù)據(jù)

? ? ? ?綜上所述,Hadoop集群搭建成功。文章來源地址http://www.zghlxwxcb.cn/news/detail-713915.html

到了這里,關(guān)于【云平臺技術(shù)】Hadoop全分布式安裝與配置的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • Hadoop3.1.3完全分布式安裝配置

    Hadoop3.1.3完全分布式安裝配置

    1. 將hadoop-3.1.3.tar.gz復(fù)制到虛擬機/opt/software目錄下: 2.在/opt/software目錄下使用tar命令解壓hadoop-3.1.3.tar.gz到/opt/module目錄下:? 執(zhí)行結(jié)果如下: 3.在/opt/module目錄下修改文件夾名稱: 執(zhí)行結(jié)果如下: ?4.打開環(huán)境變量: 執(zhí)行結(jié)果如下: 5.將光標移至文件底部,按“i”鍵編輯并作

    2024年02月08日
    瀏覽(25)
  • Hadoop3.1.3安裝教程單機偽分布式配置

    本教程使用 Ubuntu 18.04 64位 作為系統(tǒng)環(huán)境(或者Ubuntu 14.04,Ubuntu16.04 也行,32位、64位均可),請自行安裝系統(tǒng)。裝好了 Ubuntu 系統(tǒng)之后,在安裝 Hadoop 前還需要做一些必備工作。 創(chuàng)建hadoop用戶 如果你安裝 Ubuntu 的時候不是用的 “hadoop” 用戶,那么需要增加一個名為 hadoop 的用

    2024年02月04日
    瀏覽(27)
  • hadoop(偽分布式)上的spark和Scala安裝與配置詳細版

    hadoop(偽分布式)上的spark和Scala安裝與配置詳細版

    在搭建spark和Scala前提下,必需安裝好hive和java,和 Hadoop的偽分布式 哦 1、安裝與配置Scale? ? ? ? (1)去官網(wǎng)下載Scala ? ? ? ? 官網(wǎng)地址: The Scala Programming Language (scala-lang.org) https://www.scala-lang.org/ 這里我要的是scala-2.2.12.12.tgz 然后我們點擊 all releases 點進去之后往下找 然后

    2024年04月28日
    瀏覽(21)
  • hadoop平臺完全分布式搭建

    安裝前準備 一、設(shè)置ssh免密登錄 1.編輯hosts文件,添加主機名映射內(nèi)容 vim ?/etc/hosts 添加內(nèi)容: 172.17.0.2 ?????master 172.17.0.3 ?????slave1 172.17.0.4 ?????slave2 2.生成公鑰和私鑰 ssh-keygen –t rsa 然后按三次回車 3.復(fù)制公鑰到其他容器(包括自己) ssh-copy-id master ssh-copy-id slav

    2024年03月17日
    瀏覽(30)
  • 分布式計算平臺 Hadoop 簡介

    分布式計算平臺 Hadoop 簡介

    Hadoop是一種分析和處理大數(shù)據(jù)的軟件平臺,是一個用Java語言實現(xiàn)的Apache的開源軟件框架,在大量計算機組成的集群中實現(xiàn)了對海量數(shù)據(jù)的分布式計算。其主要采用MapReduce分布式計算框架,包括根據(jù)GFS原理開發(fā)的分布式文件系統(tǒng)HDFS、根據(jù)BigTable原理開發(fā)的數(shù)據(jù)存儲系統(tǒng)HBase以及

    2024年02月01日
    瀏覽(97)
  • 【大數(shù)據(jù)】Hadoop-3.3.4完全分布式安裝(包含VMware16和Ubuntu22的下載安裝及配置)、搭建、配置教程,以及Hadoop基礎(chǔ)簡介

    【大數(shù)據(jù)】Hadoop-3.3.4完全分布式安裝(包含VMware16和Ubuntu22的下載安裝及配置)、搭建、配置教程,以及Hadoop基礎(chǔ)簡介

    注:本篇文章主要涉及到: HDFS (分布式文件系統(tǒng))、 YARN (資源管理和調(diào)度框架)、以及 MapReduce (離線計算)。 以下就是本篇文章所采用的的架構(gòu) 。 (1)HDFS架構(gòu)簡述 HDFS架構(gòu)圖 注:上述的master、slave1、slave2均是主機名(結(jié)點名),可以和本篇文章不一致,但下面所有涉

    2023年04月17日
    瀏覽(21)
  • Hadoop3.3.5云耀云服務(wù)器安裝教程-單機/偽分布式配置

    Hadoop3.3.5云耀云服務(wù)器安裝教程-單機/偽分布式配置

    華為云耀云服務(wù)器試用領(lǐng)取 領(lǐng)取的試用云耀云服務(wù)器在哪 阿里云服務(wù)器免費試用領(lǐng)取 Hadoop3.3.5云耀云服務(wù)器安裝教程-單機/偽分布式配置 阿里云服務(wù)器ECS安裝圖形界面 本篇文章是基于上一篇所配置好的云服務(wù)器進行實驗軟件安裝,該系列文章是根據(jù)林子雨所講述的課程就在

    2024年01月21日
    瀏覽(54)
  • 頭歌Hadoop 開發(fā)環(huán)境搭建及HDFS初體驗(第2關(guān):配置開發(fā)環(huán)境 - Hadoop安裝與偽分布式集群搭建)

    頭歌Hadoop 開發(fā)環(huán)境搭建及HDFS初體驗(第2關(guān):配置開發(fā)環(huán)境 - Hadoop安裝與偽分布式集群搭建)

    注: 1 頭歌《Hadoop 開發(fā)環(huán)境搭建及HDFS初體驗》三關(guān)在一個實驗環(huán)境下,需要三關(guān)從前往后按順序評測,跳關(guān)或者實驗環(huán)境結(jié)束后重新打開 不能單獨評測通過 2 復(fù)制粘貼請用右鍵粘貼,CTRL+C/V不管用哦~ 第1關(guān):配置開發(fā)環(huán)境 - JavaJDK的配置: 解壓: 配置環(huán)境變量: 細節(jié): vi

    2024年02月08日
    瀏覽(352)
  • 大數(shù)據(jù)-安裝 Hadoop3.1.3 詳細教程-偽分布式配置(Centos7)

    大數(shù)據(jù)-安裝 Hadoop3.1.3 詳細教程-偽分布式配置(Centos7)

    **相關(guān)資源:**https://musetransfer.com/s/q43oznf6f(有效期至2023年3月16日)|【Muse】你有一份文件待查收,請點擊鏈接獲取文件 1.檢查是否安裝ssh (CentOS 7 即使是最小化安裝也已附帶openssh 可跳過本步驟) 若已安裝進行下一步驟 若未安裝 請自行百度 本教程不做過多講解 2.配置ss

    2023年04月08日
    瀏覽(24)
  • Hadoop3.1.3安裝教程_單機/偽分布式配置_Hadoop3.1.3/Ubuntu18.04(16.04)

    Hadoop3.1.3安裝教程_單機/偽分布式配置_Hadoop3.1.3/Ubuntu18.04(16.04)

    目錄 前言: 一、VMware Workstation 二、Ubuntu系統(tǒng)安裝 新建虛擬機 三、Ubuntu系統(tǒng)的配置 四、更新apt 五、安裝SSH、配置SSH無密碼登陸? 六、安裝Java環(huán)境 七、安裝 Hadoop3.1.3 八、Hadoop單機配置(非分布式) 九、Hadoop偽分布式配置 前言: ????????本篇教程由作者本人進行修改,原教

    2024年02月03日
    瀏覽(57)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包