国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Hadoop的安裝和使用,Windows使用shell命令簡單操作HDFS

這篇具有很好參考價(jià)值的文章主要介紹了Hadoop的安裝和使用,Windows使用shell命令簡單操作HDFS。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

目錄

1,Hadoop簡介

2,分布式文件系統(tǒng)HDFS

1. HDFS簡介

2.HDFS體系結(jié)構(gòu)

3,Hadoop的安裝

1.使用WEB管理頁面操作HDFS

2.使用命令操作HDFS

?4,HDFS的基本使用方法

1)啟動(dòng)hadoop,為當(dāng)前登錄的Windows用戶在HDFS中創(chuàng)建用戶目錄

2)在用戶名user/zhangna下創(chuàng)建test目錄

3)將windows操作系統(tǒng)本地的一個(gè)文件上傳到hdfs的test目錄中

4)把test目錄復(fù)制到windows本地文件系統(tǒng)某個(gè)目錄下

5)我把hadoop使用命令停了


1,Hadoop簡介

Hadoop是一個(gè)能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架,并且是以一種可靠、高效、可伸縮的方式進(jìn)行處理的,它具有以下幾個(gè)方面的特性。 高可靠性。 高效性。 高可擴(kuò)展性。 高容錯(cuò)性。 成本低。 運(yùn)行在Linux平臺(tái)上。 支持多種編程語言。,2,分布式文件系統(tǒng)HDFS

2,分布式文件系統(tǒng)HDFS

1. HDFS簡介

Hadoop分布式文件系統(tǒng)(Hadoop Distributed File System,HDFS)是Hadoop項(xiàng)目的兩大核心之一,是針對谷歌文件系統(tǒng)(Google File System,GFS)的開源實(shí)現(xiàn)。 總體而言,HDFS要實(shí)現(xiàn)以下目標(biāo): 兼容廉價(jià)的硬件設(shè)備。 流數(shù)據(jù)讀寫。 大數(shù)據(jù)集。 簡單的文件模型。 強(qiáng)大的跨平臺(tái)兼容性。

2.HDFS體系結(jié)構(gòu)

安裝hadoop后hdf是怎么使用,大數(shù)據(jù)采集與預(yù)處理,hdfs,hadoop,大數(shù)據(jù)

Hadoop包含了HDFS和MapReduce兩大核心組件,本教程主要使用HDFS,沒有使用MapReduce,但是,仍然要完整地安裝Hadoop。這里采用的Apache Hadoop版本是3.1.3。 Hadoop包括三種安裝模式:

單機(jī)模式:只在一臺(tái)機(jī)器上運(yùn)行,存儲(chǔ)是采用本地文件系統(tǒng),沒有采用分布式文件系統(tǒng)HDFS;

偽分布式模式:存儲(chǔ)采用分布式文件系統(tǒng)HDFS,但是,HDFS的名稱節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)都在同一臺(tái)機(jī)器上;

分布式模式:存儲(chǔ)采用分布式文件系統(tǒng)HDFS,而且,HDFS的名稱節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)位于不同機(jī)器上。

3,Hadoop的安裝

這里介紹Hadoop偽分布式模式的安裝方法。

到Hadoop官網(wǎng)(https://archive.apache.org/dist/hadoop/common/hadoop-3.1.3/)下載Hadoop3.1.3安裝文件hadoop-3.1.3.tar.gz。

由于Hadoop不直接支持Windows系統(tǒng),因此,需要使用工具集winutils進(jìn)行支持。到github.com網(wǎng)站(https://github.com/s911415/apache-hadoop-3.1.3-winutils)下載與Hadoop3.1.3配套的winutils。進(jìn)入下載頁面后,如圖2-16所示,點(diǎn)擊“Code”按鈕,然后在彈出的菜單中點(diǎn)擊“Download ZIP”即可下載得到壓縮文件apache-hadoop-3.1.3-winutils-master.zip,再將該壓縮文件進(jìn)行解壓縮。

把Hadoop3.1.3安裝文件hadoop-3.1.3.tar.gz解壓縮到“C:\”(或者其他目錄),使用winutils中的bin目錄整個(gè)替換Hadoop中的bin目錄。

在“C:\ hadoop-3.1.3”目錄下新建tmp目錄,再在tmp目錄下新建兩個(gè)子目錄,分別是datanode和namenode。

安裝hadoop后hdf是怎么使用,大數(shù)據(jù)采集與預(yù)處理,hdfs,hadoop,大數(shù)據(jù)

安裝hadoop后hdf是怎么使用,大數(shù)據(jù)采集與預(yù)處理,hdfs,hadoop,大數(shù)據(jù)

對“C:\ hadoop-3.1.3\etc\hadoop”下面的3個(gè)配置文件進(jìn)行修改。

把core-site.xml文件的配置修改為如下:

<configuration>
     <property>
        <name>fs.default.name</name>
        <value>hdfs://localhost:9000</value>
    </property>
 </configuration>

把hdfs-site.xml文件的配置修改為如下:

<configuration>
     <property>
         <name>dfs.replication</name>
         <value>1</value>
     </property>
     <property> 
      <name>dfs.permissions</name> 
      <value>false</value> 
     </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/C:/hadoop-3.1.3/tmp/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/C:/hadoop-3.1.3/tmp/datanode</value>
    </property>
</configuration>

修改hadoop-env.cmd文件,找到如下一行: set JAVA_HOME=%JAVA_HOME% 把%JAVA_HOME%替換成JDK的絕對路徑,比如: set JAVA_HOME=C:\ Java\jdk1.8.0_111 需要注意的是,如果JDK路徑中包含了空格,如果直接使用如下設(shè)置后面步驟會(huì)報(bào)錯(cuò): set JAVA_HOME= C:\Program Files\Java\jdk1.8.0_111 如果采用這種帶有空格的路徑,后面運(yùn)行“hdfs namenode -format”命令時(shí)就會(huì)報(bào)錯(cuò),因?yàn)镻rogram Files中存在空格。為了解決這個(gè)問題,可以使用下面兩種方式之一進(jìn)行處理:

(1)只需要用PROGRA~1 代替Program Files,即改為C:\PROGRA~1\Java\jdk1.8.0_111 (2)或是使用雙引號,即改為 “C:\Program Files”\Java\jdk1.8.0_111

然后,在Windows系統(tǒng)中打開一個(gè)cmd窗口,執(zhí)行如下命令對Hadoop系統(tǒng)進(jìn)行格式化:

> cd c:\hadoop-3.1.3\bin

> hdfs namenode -format

上述命令執(zhí)行以后,如果返回類似如下的信息則表示格式化成功:

\hadoop-3.1.3\tmp\namenode has been successfully formatted. 執(zhí)行如下命令啟動(dòng)

> cd c:\hadoop-3.1.3\sbin

> start-dfs.cmd 執(zhí)行該命令以后,會(huì)同時(shí)彈出另外2個(gè)cmd窗口,這2個(gè)新彈出的cmd窗口不要關(guān)閉,然后,在剛才執(zhí)行start-dfs.cmd命令的cmd窗口內(nèi),繼續(xù)執(zhí)行JDK自帶的命令jps查看Hadoop已經(jīng)啟動(dòng)的進(jìn)程:

> jps

需要注意的是,這里在使用jps命令的時(shí)候,沒有帶上絕對路徑,是因?yàn)橐呀?jīng)把JDK添加到了Path環(huán)境變量中。 執(zhí)行jps命令以后,如果能夠看到“DataNode”和“NameNode”這兩個(gè)進(jìn)程,就說明Hadoop啟動(dòng)成功。 需要關(guān)閉Hadoop時(shí),可以執(zhí)行如下命令:

> cd c:\hadoop-3.1.3\sbin > stop-dfs.cmd

1.使用WEB管理頁面操作HDFS

首先啟動(dòng)Hadoop,然后可以在瀏覽器中輸入“http://localhost:9870”,就可以訪問Hadoop的WEB管理頁面

安裝hadoop后hdf是怎么使用,大數(shù)據(jù)采集與預(yù)處理,hdfs,hadoop,大數(shù)據(jù)

在WEB管理頁面中,點(diǎn)擊頂部右側(cè)的菜單選項(xiàng)“Utilities”,在彈出的子菜單中點(diǎn)擊“Browse the file system”,會(huì)出現(xiàn)如圖2-20所示的HDFS文件系統(tǒng)操作頁面,在這個(gè)頁面中可以創(chuàng)建、查看、刪除目錄和文件

2.使用命令操作HDFS

除了在瀏覽器中通過WEB方式操作HDFS以外,還可以在cmd窗口中使用命令對HDFS進(jìn)行操作。

安裝hadoop后hdf是怎么使用,大數(shù)據(jù)采集與預(yù)處理,hdfs,hadoop,大數(shù)據(jù)

?4,HDFS的基本使用方法

1)啟動(dòng)hadoop,為當(dāng)前登錄的Windows用戶在HDFS中創(chuàng)建用戶目錄

安裝hadoop后hdf是怎么使用,大數(shù)據(jù)采集與預(yù)處理,hdfs,hadoop,大數(shù)據(jù)

?

安裝hadoop后hdf是怎么使用,大數(shù)據(jù)采集與預(yù)處理,hdfs,hadoop,大數(shù)據(jù)

安裝hadoop后hdf是怎么使用,大數(shù)據(jù)采集與預(yù)處理,hdfs,hadoop,大數(shù)據(jù)

安裝hadoop后hdf是怎么使用,大數(shù)據(jù)采集與預(yù)處理,hdfs,hadoop,大數(shù)據(jù)

2)在用戶名user/zhangna下創(chuàng)建test目錄

安裝hadoop后hdf是怎么使用,大數(shù)據(jù)采集與預(yù)處理,hdfs,hadoop,大數(shù)據(jù)

安裝hadoop后hdf是怎么使用,大數(shù)據(jù)采集與預(yù)處理,hdfs,hadoop,大數(shù)據(jù)

在user/zhangna下有了test目錄了

3)將windows操作系統(tǒng)本地的一個(gè)文件上傳到hdfs的test目錄中

安裝hadoop后hdf是怎么使用,大數(shù)據(jù)采集與預(yù)處理,hdfs,hadoop,大數(shù)據(jù)

我把文件保存到了D盤,并且用hadoop命令put把文件傳到了test目錄中

安裝hadoop后hdf是怎么使用,大數(shù)據(jù)采集與預(yù)處理,hdfs,hadoop,大數(shù)據(jù)

在cmd命令提示符中出現(xiàn)了亂碼,在瀏覽器查看hadoop可以顯示出內(nèi)容

安裝hadoop后hdf是怎么使用,大數(shù)據(jù)采集與預(yù)處理,hdfs,hadoop,大數(shù)據(jù)

4)把test目錄復(fù)制到windows本地文件系統(tǒng)某個(gè)目錄下

安裝hadoop后hdf是怎么使用,大數(shù)據(jù)采集與預(yù)處理,hdfs,hadoop,大數(shù)據(jù)

安裝hadoop后hdf是怎么使用,大數(shù)據(jù)采集與預(yù)處理,hdfs,hadoop,大數(shù)據(jù)

在D盤下面我創(chuàng)建的zhang的文件夾下有test目錄,并且有test.txt文件

安裝hadoop后hdf是怎么使用,大數(shù)據(jù)采集與預(yù)處理,hdfs,hadoop,大數(shù)據(jù)文章來源地址http://www.zghlxwxcb.cn/news/detail-767354.html

5)我把hadoop使用命令停了

到了這里,關(guān)于Hadoop的安裝和使用,Windows使用shell命令簡單操作HDFS的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 【Hadoop】-HDFS的Shell操作[3]

    【Hadoop】-HDFS的Shell操作[3]

    目錄 前言 一、HDFS集群啟停命令 1.一鍵啟停腳本可用 2.獨(dú)立進(jìn)程啟停可用 ?二、文件系統(tǒng)操作命令 1、創(chuàng)建文件夾 2、查看指定目錄下內(nèi)容 3、上傳文件到HDFS指定目錄下? 4、查看HDFS文件內(nèi)容 5、下載HDFS文件 6、拷貝HDFS文件 7、追加數(shù)據(jù)到HDFS文件中 8、HDFS數(shù)據(jù)移動(dòng)操作 9、HDFS數(shù)

    2024年04月26日
    瀏覽(28)
  • Hadoop大數(shù)據(jù)技術(shù)-通過shell命令訪問HDFS

    Hadoop大數(shù)據(jù)技術(shù)-通過shell命令訪問HDFS

    HDFS shell大致可以分為操作命令、管理命令、其他命令三類。 注意:當(dāng)命令以“$”開頭時(shí),當(dāng)前用戶為普通用戶;以“#”開頭時(shí),當(dāng)前用戶為root用戶。 操作命令是以“ hdfs dfs ”開頭的命令,用戶可以通過執(zhí)行這些命令,完成對文件的查找、上傳、刪除等操作。 [-p]:表示如

    2023年04月11日
    瀏覽(27)
  • 0202hdfs的shell操作-hadoop-大數(shù)據(jù)學(xué)習(xí)

    0202hdfs的shell操作-hadoop-大數(shù)據(jù)學(xué)習(xí)

    以下命令執(zhí)行默認(rèn)配置了hadoop的環(huán)境變量,且使用新命令。 一鍵啟停腳本 獨(dú)立進(jìn)程啟停 2.1 HDFS文件系統(tǒng)基本信息 HDFS作為分布式存儲(chǔ)的文件系統(tǒng),有其對數(shù)據(jù)的路徑表達(dá)式。如果熟悉Linux文件系統(tǒng),可以對比學(xué)習(xí)。 HDFS同Linux系統(tǒng)一樣,均是以/作為根目錄的組織形式 如何區(qū)分

    2024年02月10日
    瀏覽(31)
  • 從零開始的Hadoop學(xué)習(xí)(五)| HDFS概述、shell操作、API操作

    從零開始的Hadoop學(xué)習(xí)(五)| HDFS概述、shell操作、API操作

    1.1 HDFS 產(chǎn)出背景及定義 1) HDFS 產(chǎn)生背景 隨著數(shù)據(jù)量越來越大,在一個(gè)操作系統(tǒng)存不下所有的數(shù)據(jù),那么就分配到更多的操作系統(tǒng)管理的磁盤中,但是不方便管理和維護(hù),迫切 需要一種系統(tǒng)來管理多臺(tái)機(jī)器上的文件 ,這就是分布式文件管理系統(tǒng)。 HDFS只是分布式文件管理系統(tǒng)

    2024年02月10日
    瀏覽(94)
  • HDFS操作常用的Shell命令

    HDFS操作常用的Shell命令

    目錄 (1)?? 向HDFS 中上傳任意文本文件,如果指定的文件在HDFS中已經(jīng)存在,由用戶指定是追加到原有文件末尾還是覆蓋原有的文件; (2)?? 從HDFS中下載指定文件,如果本地文件與要下載的文件名稱相同,則自動(dòng)對下載的文件重命名; (3)?? 將HDFS中指定文件的內(nèi)容輸出到終端中

    2023年04月10日
    瀏覽(59)
  • 實(shí)驗(yàn)二 HDFS的Shell命令操作,和HDFS的API操作

    實(shí)驗(yàn)二 HDFS的Shell命令操作,和HDFS的API操作

    來自博主卷毛迷你豬的授權(quán) ,這是我的老師的博客多多關(guān)注 掌握 Hadoop 中 HDFS 的 Shell 命令操作 掌握 Hadoop 中 HDFS 的API操作 ? 項(xiàng)目1:HDFS常見命令練習(xí) ? 項(xiàng)目2:HDFS命令的綜合運(yùn)用實(shí)踐 ? 項(xiàng)目3:HDFS的API使用實(shí)踐 ? 項(xiàng)目4:HDFS的API單元測試程序和更多思考(選做) ? HDFS是

    2024年04月26日
    瀏覽(25)
  • 【Hadoop-HDFS】HDFS常用操作命令

    hadoop fs -ls / 普通創(chuàng)建: hadoop fs -mkdir /xiaolin 遞歸創(chuàng)建: hadoop fs -mkdir -p /xiaolin/xiaoyin mkdir xuan.txt hadoop fs -moveFromLocal xuan.txt /xiaolin hadoop fs -copyFromLocal xuan.txt / hadoop fs -put xuan.txt / 文件名稱相同時(shí)覆蓋hdfs上的文件: -f hadoop fs -put -f xuan.txt / hadoop fs -copyToLocal /xiaolin ./ hadoop fs -get

    2024年02月05日
    瀏覽(20)
  • 大數(shù)據(jù):HDFS的Shell常用命令操作

    大數(shù)據(jù):HDFS的Shell常用命令操作

    HDFS允許用戶數(shù)據(jù)組織成文件和文件夾的方式,它提供一個(gè)叫DFSShell的接口,使用戶可以和HDFS中的數(shù)據(jù)交互。命令集的語法跟其他用戶熟悉的shells(bash,csh)相似。 Shell在計(jì)算機(jī)科學(xué)中俗稱“殼”,是提供給使用者使用界面的進(jìn)行與系統(tǒng)交互的軟件,通過接收用戶輸入的命令執(zhí)

    2023年04月09日
    瀏覽(34)
  • Hadoop原理與技術(shù)——hdfs命令行基本操作

    Hadoop原理與技術(shù)——hdfs命令行基本操作

    點(diǎn)擊鏈接查看文檔 一、實(shí)驗(yàn)?zāi)康?熟悉hdfs命令行基本操作 二、實(shí)驗(yàn)環(huán)境 Windows 10 VMware Workstation Pro虛擬機(jī) Hadoop環(huán)境 Jdk1.8 三、實(shí)驗(yàn)內(nèi)容 1:hdfs常見命令: (1)查看幫助:hdfs dfs -help (2)查看當(dāng)前目錄信息:hdfs dfs -ls / (3)創(chuàng)建文件夾:hdfs dfs -mkdir /文件夾名 (4)上傳文件:

    2023年04月16日
    瀏覽(16)
  • Hadoop HDFS分布式文件系統(tǒng)(介紹以及基礎(chǔ)操作命令)

    Hadoop HDFS分布式文件系統(tǒng)(介紹以及基礎(chǔ)操作命令)

    目錄 一、為什么需要分布式存儲(chǔ)? 二、分布式的基礎(chǔ)架構(gòu)分析 ?三、HDFS基礎(chǔ)架構(gòu) 1.HDFS簡介 四、HDFS集群啟停命令 1.一鍵啟停腳本 2.單進(jìn)程啟停 五、HDFS基本操作命令 1.創(chuàng)建文件夾 ?2.查看指定目錄下內(nèi)容? 3.上傳文件到HDFS指定目錄下 ?4.查看HDFS文件內(nèi)容 5.下載HDFS文件 ?6.拷貝

    2024年02月05日
    瀏覽(166)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包