国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Hadoop HDFS分布式文件系統(tǒng)(介紹以及基礎(chǔ)操作命令)

這篇具有很好參考價(jià)值的文章主要介紹了Hadoop HDFS分布式文件系統(tǒng)(介紹以及基礎(chǔ)操作命令)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

目錄

一、為什么需要分布式存儲(chǔ)?

二、分布式的基礎(chǔ)架構(gòu)分析

?三、HDFS基礎(chǔ)架構(gòu)

1.HDFS簡(jiǎn)介

四、HDFS集群?jiǎn)⑼C?/p>

1.一鍵啟停腳本

2.單進(jìn)程啟停

五、HDFS基本操作命令

1.創(chuàng)建文件夾

?2.查看指定目錄下內(nèi)容?

3.上傳文件到HDFS指定目錄下

?4.查看HDFS文件內(nèi)容

5.下載HDFS文件

?6.拷貝HDFS文件

?7.追加數(shù)據(jù)到HDFS文件中

8.HDFS數(shù)據(jù)移動(dòng)操作?

?9.HDFS數(shù)據(jù)刪除操作

六、HDFS權(quán)限不足解決方法

1.超級(jí)用戶

2.修改權(quán)限(和Linu一致)


一、為什么需要分布式存儲(chǔ)?

? ? ? ? ①數(shù)據(jù)量太大,單機(jī)存儲(chǔ)能力有上限,需要靠數(shù)量來(lái)解決問(wèn)題。

? ? ? ? ②數(shù)量的提升帶來(lái)的是網(wǎng)絡(luò)傳輸、磁盤(pán)讀寫(xiě)、CPU、內(nèi)存等方面綜合提升。分布式組合在引擎可以達(dá)到1+1>2的效果。

二、分布式的基礎(chǔ)架構(gòu)分析

大數(shù)據(jù)體系中,分布式的調(diào)度主要有兩類(lèi)價(jià)格模式:

? ? ? ? 1.去(無(wú))中心化模式

? ? ? ? 去中心化模式?jīng)]有明確的中心,眾多服務(wù)器之間基于特定規(guī)則進(jìn)行同步協(xié)調(diào)。區(qū)塊鏈和P2P就是典型的去中心化模式。

? ? ? ? 2.中心化模式(大部分基礎(chǔ)架構(gòu))

? ? ? ? 以一個(gè)節(jié)點(diǎn)作為中心,去同意調(diào)度其他節(jié)點(diǎn)。這種模式也被稱(chēng)為一主多從模式,簡(jiǎn)稱(chēng)主從模式(Master And Slaves)。Hadoop就是典型的主從模式(中心化模式)架構(gòu)的技術(shù)框架。

hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

?三、HDFS基礎(chǔ)架構(gòu)

1.HDFS簡(jiǎn)介

? ? ? ? HDFS是Hadoop三大組件(HDFS、MApReduce、YARN)之一。全稱(chēng)是Hadoop Distributed File System(Hadoop分布式文件系統(tǒng))。是Hadoop技術(shù)棧內(nèi)提供的分布式數(shù)據(jù)存儲(chǔ)解決方案,可以在多臺(tái)服務(wù)器上構(gòu)建集群,存儲(chǔ)海量的數(shù)據(jù)。

2.HDFS基礎(chǔ)架構(gòu)

? ? ? ? HDFS是一個(gè)典型的主從模式的架構(gòu)

? ? ? ? HDFS集群分為三個(gè)角色:

? ? ? ? ·主節(jié)點(diǎn)(NameNode):HDFS系統(tǒng)的主角色,是一個(gè)獨(dú)立的進(jìn)程,負(fù)責(zé)管理HDFS整個(gè)文件系統(tǒng),負(fù)責(zé)管理DataNode。

? ? ? ? ·從節(jié)點(diǎn)(DataNode):HDFS系統(tǒng)的從角色,是一個(gè)獨(dú)立進(jìn)程,主要負(fù)責(zé)數(shù)據(jù)的存儲(chǔ),即存入數(shù)據(jù)和取出數(shù)據(jù)。

? ? ? ? ·主節(jié)點(diǎn)輔助節(jié)點(diǎn)(SecondaryNameNode):Name Node的輔助,是一個(gè)獨(dú)立的進(jìn)程,主要幫助NameNode完成元數(shù)據(jù)整理工作(打雜)。

hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

四、HDFS集群?jiǎn)⑼C?/h4>

1.一鍵啟停腳本

·$HADOOP_HOME/sbin/start-dfs.sh,一鍵啟動(dòng)HDFS集群

? ? ? ? 執(zhí)行原理:

? ? ? ? ·在執(zhí)行此腳本的機(jī)器上,啟動(dòng)SecondaryNameNode

? ? ? ? ·讀取core-site.xml內(nèi)容(fs.defaultFS項(xiàng)),確認(rèn)NameNode所在的機(jī)器,啟動(dòng)NameNode

? ? ? ? ·讀取workers內(nèi)容,確認(rèn)DataNode所在的機(jī)器,啟動(dòng)全部DataNode

hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

·$HADOOP_HOME/sbin/stop-dfs.sh,一鍵關(guān)閉HDFS集群

? ? ? ? 執(zhí)行原理:

? ? ? ? ·在執(zhí)行此腳本的機(jī)器上,關(guān)閉SecondaryNameNode

? ? ? ? ·讀取core-site.xml(fs.defaultFS項(xiàng)),確認(rèn)NameNode所在機(jī)器,關(guān)閉NameNode

? ? ? ? ·讀取workers內(nèi)容,確認(rèn)DataNode所在機(jī)器,關(guān)閉全部NameNodehadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

2.單進(jìn)程啟停

(1)$HADOOP_HOME/sbin/hadoop-daemon.sh,此腳本可以單獨(dú)控制所在機(jī)器的進(jìn)程的啟停(只能在對(duì)應(yīng)機(jī)器管理對(duì)應(yīng)服務(wù))

用法:hadoop-daemon.sh ( start | status | stop ) ( namenode | secondarynamenode | datanode )

hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

(2)$HADOOP_HOME/bin/hdfs,此程序也可以用以單獨(dú)控制所在機(jī)器的進(jìn)程的啟停(只能在對(duì)應(yīng)機(jī)器管理對(duì)應(yīng)的服務(wù))

用法:hdfs --daemon( start | status | stop )( namenode | secondarynamenode | datanode )

hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

五、HDFS基本操作命令

????????HDFS文件系統(tǒng)基本信息

? ? ? ? HDFS作為分布式存儲(chǔ)的文件系統(tǒng),有其對(duì)數(shù)據(jù)的路徑表達(dá)方式。HDFS同Linux系統(tǒng)一樣,均是以 / 作為根目錄的組織形式。

hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

?路徑表示:

????????·Linux:file:///

????????·HDFS:hdfs://namenode:port/

例:

????????Linux:file:///usr/local/hello.txt

????????HDFS: hdfs://node1:8020/usr/local/hello.txt

? ? ? ? ?協(xié)議頭 file:/// 或 hdfs://node1:8020/?可以省略,需要提供Linux路徑的參數(shù),會(huì)自動(dòng)識(shí)別為file://,需要HDFS路徑的參數(shù),會(huì)自動(dòng)識(shí)別為hdfs://,除非你明確需要寫(xiě)或不寫(xiě)會(huì)有BUG,否則一般不用寫(xiě)協(xié)議頭.

????????HDFS命令體系介紹

? ? ? ? 關(guān)于HDFS文件系統(tǒng)的操作命令,Hadoop提供了兩套命令體系。

(1)hadoop命令(老版本用法),用法:hadoop fs [ generic options ]

hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

(2)hdfs命令(新版本用法),用法:hdfs dfs [ generic?options ]?

hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)? ? ? ?

???????? 兩者在文件系統(tǒng)操作,用法完全一致,用哪個(gè)都可以。

1.創(chuàng)建文件夾

? ? ? ? hadoop? fs? -mkdir? [-p]? <path>? ....

? ? ? ? hdfs? dfs -mkdir [-p]? <path> ....

? ? ? ? ? ? ? ? path為待創(chuàng)建的目錄

? ? ? ? ? ? ? ? -p選項(xiàng)的行為與Linux mkdir -p 一致

hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

?2.查看指定目錄下內(nèi)容?

? ? ? ? hadoop? fs? -ls? [-h] [-R] [ <path> ...]

? ? ? ? hdfs dfs -ls [-h] [-R] [<path> ...]

? ? ? ? ? ? ? ? -h 人性化顯示文件size

? ? ? ? ? ? ? ? path 指定目錄路徑

? ? ? ? ? ? ? ? -R 遞歸查看指定目錄及其子目錄

hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

3.上傳文件到HDFS指定目錄下

? ? ? ? hadoop fs -put [-f] [-p] <localsrc>...<dst>?

? ? ? ? hdfs dfs -put [-f] [-p] <localsrc>...<dst>

? ? ? ? ? ? ? ? -f 覆蓋目標(biāo)文件(已存在下)

? ? ? ? ? ? ? ? -p 保留訪問(wèn)和修改時(shí)間,所有權(quán)和權(quán)限。

? ? ? ? ? ? ? ? localsrc 本地文件系統(tǒng)(客戶端所在機(jī)器)

? ? ? ? ? ? ? ? dst 目標(biāo)文件系統(tǒng)(HDFS)

hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

?4.查看HDFS文件內(nèi)容

? ? ? ? hadop fs -cat <src>...

? ? ? ? hdfs dfs -cat <src>...

hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

?讀取大文件可以使用管道符配合more對(duì)文件進(jìn)行翻頁(yè)處理

? ? ? ? hadoop fs -cat <src> | more

? ? ? ? hdfs dfs -cat <src> | more

5.下載HDFS文件

? ? ? ? hadoop fs -get [-f] [-p] <src>...<localdst>

? ? ? ? hdfs dfs -get [-f] [-p] <src>...<localdst>

? ? ? ? ? ? ? ? 下載文件到本地文件系統(tǒng)指定目錄,localdst必須是目錄

? ? ? ? ? ? ? ? ?-f 覆蓋目標(biāo)文件(已存在下)

? ? ? ? ? ? ? ? -p 保留訪問(wèn)和修改時(shí)間,所有權(quán)和權(quán)限

hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

?6.拷貝HDFS文件

? ? ? ? hadoop fs? -cp [-f] <src>...<dst>

? ? ? ? hdfs dfs -cp [-f] <src>...<dst>

? ? ? ? ? ? ? ? -f 覆蓋目標(biāo)文件(已存在下)

hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

?7.追加數(shù)據(jù)到HDFS文件中

? ? ? ? hadoop fs -appendToFile <localsrc>...<dst>

? ? ? ? hdfs dfs -appendToFile <localsrc>...<dst>

? ? ? ? 將所以給本地文件的內(nèi)容追加到給定dst文件,如果dst文件不存在,將創(chuàng)建該文件,如果<localSrc>為-,則輸入為從標(biāo)準(zhǔn)輸入中讀取。hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

8.HDFS數(shù)據(jù)移動(dòng)操作?

? ? ? ? hadoop fs -mv <src>...<dst>

? ? ? ? hdfs dfs -mv <src>...<dst>

? ? ? ? 移動(dòng)文件到指定文件夾下

? ? ? ? 可以使用該命令移動(dòng)數(shù)據(jù),重命名文件的名稱(chēng)

hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

?9.HDFS數(shù)據(jù)刪除操作

? ? ? ? hadoop fs -rm -r [-skipTrash] URI [URI ...]

? ? ? ? hdfs dfs -rm -r [-skipTrash] URI [URI ...]

? ? ? ? 刪除指定路徑的文件或文件夾(-r)

? ? ? ? -skipTrash 跳過(guò)回收站,直接刪除hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

?回收站功能默認(rèn)關(guān)閉,如果要開(kāi)啟需要在 core-site.xml 內(nèi)配置:
<property>
????????<name>fs.trash.interval</name>? #設(shè)置文件保留期間,1440為一個(gè)星期
????????<value>1440</value>
</property>
<property>
????????<name>fs.trash.checkpoint.interval</name>? #檢查區(qū)間,表示回收站每120分鐘檢查一次
????????<value>120</value>
</property>
無(wú)需重啟集群,在哪個(gè)機(jī)器配置的,在哪個(gè)機(jī)器執(zhí)行命令就生效。
回收站默認(rèn)位置在: /user/ 用戶名 (hadoop)/.Trash

hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

六、HDFS權(quán)限不足解決方法

1.超級(jí)用戶

? ? ? ? HDFS中,也是有權(quán)限控制的,其控制邏輯和Linux系統(tǒng)完全一致。但Linux的超級(jí)用戶是root,HDFS文件系統(tǒng)的超級(jí)用戶:是啟動(dòng)namenode的用戶。

hadoop分布式文件系統(tǒng),大數(shù)據(jù),hadoop,hdfs,大數(shù)據(jù)

2.修改權(quán)限(和Linu一致)

(1)修改所屬用戶和組

????????hadoop fs -chown [-R] root:root /xxx.txt

? ? ? ? hdfs dfs -chown [-R] root:root /xxx.txt

(2)修改權(quán)限

? ? ? ? hadoop fs -chmod [-R] 777 /xxx.txt

? ? ? ? hdfs dfs -chmod [-R] 777 /xxx.txt文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-744399.html

到了這里,關(guān)于Hadoop HDFS分布式文件系統(tǒng)(介紹以及基礎(chǔ)操作命令)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • hadoop-hdfs分布式文件系統(tǒng)理論(一)

    hadoop-hdfs分布式文件系統(tǒng)理論(一)

    可以更好的支持分布式計(jì)算。 hadoop distribute file system是一個(gè)分布式 文件系統(tǒng),操作的是文件,增、刪都是以文件為單位。 文件線性按字節(jié)切割成塊(block),具有offset,id offset是指block的偏移量,比如block大小是10,offset可以是0,10,20,30。。。 id是block的名稱(chēng),比如block1,block

    2024年02月11日
    瀏覽(41)
  • Hadoop的分布式文件存儲(chǔ)系統(tǒng)HDFS組件的使用

    Hadoop的分布式文件存儲(chǔ)系統(tǒng)HDFS組件的使用

    存儲(chǔ)整個(gè)HDFS集群的元數(shù)據(jù)(metaData) —— 整個(gè)集群中存儲(chǔ)的目錄和文件的索引 管理整個(gè)HDFS集群 接收客戶端的請(qǐng)求 負(fù)責(zé)節(jié)點(diǎn)的故障轉(zhuǎn)移 存儲(chǔ)數(shù)據(jù),是以block塊的形式進(jìn)行數(shù)據(jù)的存放。 默認(rèn)情況下block塊的大小是128M。 blocksize大小的計(jì)算公式: 尋址時(shí)間:下載文件時(shí)找到文件

    2024年02月09日
    瀏覽(97)
  • Hadoop大數(shù)據(jù)從入門(mén)到實(shí)戰(zhàn)(二)分布式文件系統(tǒng)HDFS

    Hadoop大數(shù)據(jù)從入門(mén)到實(shí)戰(zhàn)(二)分布式文件系統(tǒng)HDFS

    頭歌實(shí)踐教學(xué)平臺(tái) 教學(xué)課堂 大數(shù)據(jù)從入門(mén)到實(shí)戰(zhàn) - 第2章 分布式文件系統(tǒng)HDFS 任務(wù)描述 本關(guān)任務(wù):使用 Hadoop 命令來(lái)操作分布式文件系統(tǒng)。 編程要求 在右側(cè)命令行中啟動(dòng) Hadoop ,進(jìn)行如下操作。 在 HDFS 中創(chuàng)建 /usr/output/ 文件夾; 在本地創(chuàng)建 hello.txt 文件并添加內(nèi)容:“ HDFS的

    2024年02月12日
    瀏覽(18)
  • 分布式集群——搭建Hadoop環(huán)境以及相關(guān)的Hadoop介紹

    分布式集群——搭建Hadoop環(huán)境以及相關(guān)的Hadoop介紹

    分布式集群——jdk配置與zookeeper環(huán)境搭建 分布式集群——搭建Hadoop環(huán)境以及相關(guān)的Hadoop介紹 文章目錄 前言 一 hadoop的相關(guān)概念 1.1 Hadoop概念 補(bǔ)充:塊的存儲(chǔ) 1.2 HDFS是什么 1.3 三種節(jié)點(diǎn)的功能 I、NameNode節(jié)點(diǎn) II、fsimage與edits文件存放的內(nèi)容介紹 III、DataNode節(jié)點(diǎn) IV、SecondaryNameNod

    2024年02月10日
    瀏覽(22)
  • 分布式文件系統(tǒng)HDFS

    分布式文件系統(tǒng)HDFS

    分布式文件系統(tǒng) 把文件分布存儲(chǔ)到多個(gè)計(jì)算機(jī)節(jié)點(diǎn) 上,通過(guò)網(wǎng)絡(luò)實(shí)現(xiàn)文件在多臺(tái)主機(jī)上進(jìn)行分布式存儲(chǔ)的文件系統(tǒng)。 分布式文件系統(tǒng)有兩大模式: Remote Access Model: 非本地文件不會(huì)復(fù)制到本地,所以對(duì)非本地文件的讀取和修改,利用RPC進(jìn)行。 Upload/ Download Model:所有非本地文

    2024年02月09日
    瀏覽(20)
  • 2. 分布式文件系統(tǒng) HDFS

    2. 分布式文件系統(tǒng) HDFS

    問(wèn)題一:如果一個(gè)文件中有 10 個(gè)數(shù)值,一行一個(gè),并且都可以用 int 來(lái)度量?,F(xiàn)在求 10 個(gè)數(shù)值的和 思路: 逐行讀取文件的內(nèi)容 把讀取到的內(nèi)容轉(zhuǎn)換成 int 類(lèi)型 把轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行相加 輸出最后的一個(gè)累加和 問(wèn)題二:10000 個(gè)文件,每個(gè)文件 2T,文件里的內(nèi)容依然是每行一個(gè)

    2024年02月08日
    瀏覽(22)
  • 大數(shù)據(jù)——HDFS(分布式文件系統(tǒng))

    大數(shù)據(jù)——HDFS(分布式文件系統(tǒng))

    Hadoop的兩大核心組件 HDFS ( Hadoop Distributed Filesystem ):是一個(gè)易于擴(kuò)展的 分布式文件系統(tǒng) ,運(yùn)行在 成百上千 臺(tái) 低成本 的 機(jī)器 上。 HDFS 具有 高度容錯(cuò)能力 ,旨在部署在低成本機(jī)器上。 HDFS 主要用于對(duì) 海量文件信息 進(jìn)行 存儲(chǔ) 和 管理 ,也就是解決大數(shù)據(jù)文件(如 TB 乃至

    2023年04月17日
    瀏覽(28)
  • 頭歌 分布式文件系統(tǒng)HDFS 答案

    頭歌 分布式文件系統(tǒng)HDFS 答案

    第1關(guān):HDFS的基本操作 在右側(cè)命令行中啟動(dòng) Hadoop ,進(jìn)行如下操作。 在 HDFS 中創(chuàng)建 /usr/output/ 文件夾; 在本地創(chuàng)建 hello.txt 文件并添加內(nèi)容:“ HDFS的塊比磁盤(pán)的塊大,其目的是為了最小化尋址開(kāi)銷(xiāo)。 ”; 將 hello.txt 上傳至 HDFS 的 /usr/output/ 目錄下; 刪除 HDFS 的 /user/hadoop 目錄

    2023年04月27日
    瀏覽(22)
  • 【頭歌實(shí)訓(xùn)】分布式文件系統(tǒng) HDFS

    【頭歌實(shí)訓(xùn)】分布式文件系統(tǒng) HDFS

    本關(guān)任務(wù):使用 Hadoop 命令來(lái)操作分布式文件系統(tǒng)。 為了完成本關(guān)任務(wù)你需要了解的知識(shí)有:1. HDFS 的設(shè)計(jì),2. HDFS 常用命令。 HDFS的設(shè)計(jì) 分布式文件系統(tǒng) 客戶:幫我保存一下這幾天的數(shù)據(jù)。 程序猿:好嘞,有多大呢? 客戶: 1T 。 程序猿:好沒(méi)問(wèn)題,買(mǎi)個(gè)硬盤(pán)就搞定了。

    2024年04月15日
    瀏覽(27)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包