国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

HDFS Hadoop分布式文件存儲系統(tǒng)整體概述

這篇具有很好參考價值的文章主要介紹了HDFS Hadoop分布式文件存儲系統(tǒng)整體概述。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

HDFS

整體概述舉例:

HDFS Hadoop分布式文件存儲系統(tǒng)整體概述,hadoop,hadoop,分布式,hdfs

包括機架 rack1、rack2 包括5個Datanode,一個Namenode(主角色)帶領(lǐng)5個Datanode(從角色),每一個rack中包含不同的block模塊文件為分塊存儲模式。塊與塊之間通過replication進行副本備份,進行冗余存儲,Namenode對存儲的元數(shù)據(jù)進行記錄。該架構(gòu)可以概括為一個抽象統(tǒng)一的目錄樹結(jié)構(gòu)。

  1. 主從架構(gòu)

    HDFS集群是標(biāo)準(zhǔn)的master/slave主從架構(gòu)群,一般一個HDFS集群有一個Namenode和一定數(shù)目的Datanode組成,Namenode是HDFS主節(jié)點(維護元數(shù)據(jù)),Datanode(管理數(shù)據(jù)塊)是HDFS從節(jié)點,兩種角色共同完成分布式文件的存儲服務(wù)。

  2. 分塊存儲

    HDFS中文件在物理上是分塊存儲的,每一塊默認(rèn)大小是128M,不足128M則自身為一塊。

    塊的大小可以通過配置參數(shù)來規(guī)定,位于hdfs-default.xml中,dfs.blocksize

  3. 副本機制

    文件的每個block都會有副本,副本系數(shù)可以在文件創(chuàng)建的時候指定,也可以在之后通過命令改變,副本數(shù)量由參數(shù)dfs.replication控制,默認(rèn)數(shù)為3,連同本身共三塊副本。

  4. 元數(shù)據(jù)(解釋型數(shù)據(jù))管理

    HDFS中元數(shù)據(jù)包括兩種類型:

    1)文件自身屬性信息:文件名稱、權(quán)限,修改時間、文件大小、復(fù)制因子、數(shù)據(jù)塊大小。

    2)文件塊位置映射信息:記錄文件塊和Datenode之間的映射信息,即哪個塊位于哪個節(jié)點上。

  5. 抽象目錄樹(namespace)

    即傳統(tǒng)的層次文件組織結(jié)構(gòu)。用戶可以創(chuàng)建目錄,然后將文件保存在目錄中,Namenode負(fù)責(zé)維護文件系統(tǒng)的namespace名稱空間,任何對文件系統(tǒng)名稱空間或?qū)傩缘男薷亩紝⒈籒amenode記錄下。

  6. 數(shù)據(jù)塊存儲

    文件各個block的具體存儲管理由DataNode節(jié)點承擔(dān),每一個block都可以在多個DataNode上存儲。

常用操作

文件系統(tǒng)的shell命令 hadoop fs [generic options]

hadoop fs -ls file:/// #操作本地文件系統(tǒng)

hadoop fs -ls hdfs://node1:8020/ #操作HDFS分布文件系統(tǒng)

hadoop fs -ls / #直接根目錄,沒有指定協(xié)議,將加載讀取fs.defaultFS

? 2.創(chuàng)建文件夾 hadoop fs -mkdir [-p]

… (-p 沿著路徑創(chuàng)建父目錄)

? 3.查看指定目錄下內(nèi)容 hadoop fs -ls [-h] [-R] [

…] (path 指定目錄路徑、-h 人性化顯示文件size、 -R遞歸查看指定目錄及其子目錄)

? 4.上傳文件到HDFS指定目錄下 hadoop fs -put [-f] [-p] … ( -f覆蓋目標(biāo)文件【已經(jīng)存在下】,-p保留訪問和修改時間,所有權(quán)和權(quán)限,localsrc本地文件系統(tǒng), dst目標(biāo)文件系統(tǒng))

? 5.查看HDFS文件內(nèi)容 hadoop fs -cat … 讀取指定文件全部內(nèi)容,顯示在標(biāo)準(zhǔn)輸出控制臺。

? 6.下載HDFS文件 hadoop fs -get [-f] [-p] … (下載文件到本地文件系統(tǒng)指定目錄, localdst必須是目錄, -f 覆蓋目標(biāo)文件 -p保留訪問和修改時間,所有權(quán)和權(quán)限)

? 7.拷貝HDFS文件 hadoop fs -cp [-f] …(-f 覆蓋目標(biāo)文件)

? 8.追加數(shù)據(jù)到HDFS文件中 hadoop fs -appendToFile …(將所有給定本地文件的內(nèi)容追加到給定dst文件,dst如果不存在,將創(chuàng)建該文件)

工作流程

HDFS Hadoop分布式文件存儲系統(tǒng)整體概述,hadoop,hadoop,分布式,hdfs文章來源地址http://www.zghlxwxcb.cn/news/detail-599706.html

  1. 管道傳輸
  2. ACK校驗
  3. 副本原則

到了這里,關(guān)于HDFS Hadoop分布式文件存儲系統(tǒng)整體概述的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • hadoop-hdfs分布式文件系統(tǒng)理論(一)

    hadoop-hdfs分布式文件系統(tǒng)理論(一)

    可以更好的支持分布式計算。 hadoop distribute file system是一個分布式 文件系統(tǒng),操作的是文件,增、刪都是以文件為單位。 文件線性按字節(jié)切割成塊(block),具有offset,id offset是指block的偏移量,比如block大小是10,offset可以是0,10,20,30。。。 id是block的名稱,比如block1,block

    2024年02月11日
    瀏覽(41)
  • Hadoop HDFS分布式文件系統(tǒng)(介紹以及基礎(chǔ)操作命令)

    Hadoop HDFS分布式文件系統(tǒng)(介紹以及基礎(chǔ)操作命令)

    目錄 一、為什么需要分布式存儲? 二、分布式的基礎(chǔ)架構(gòu)分析 ?三、HDFS基礎(chǔ)架構(gòu) 1.HDFS簡介 四、HDFS集群啟停命令 1.一鍵啟停腳本 2.單進程啟停 五、HDFS基本操作命令 1.創(chuàng)建文件夾 ?2.查看指定目錄下內(nèi)容? 3.上傳文件到HDFS指定目錄下 ?4.查看HDFS文件內(nèi)容 5.下載HDFS文件 ?6.拷貝

    2024年02月05日
    瀏覽(166)
  • Hadoop大數(shù)據(jù)從入門到實戰(zhàn)(二)分布式文件系統(tǒng)HDFS

    Hadoop大數(shù)據(jù)從入門到實戰(zhàn)(二)分布式文件系統(tǒng)HDFS

    頭歌實踐教學(xué)平臺 教學(xué)課堂 大數(shù)據(jù)從入門到實戰(zhàn) - 第2章 分布式文件系統(tǒng)HDFS 任務(wù)描述 本關(guān)任務(wù):使用 Hadoop 命令來操作分布式文件系統(tǒng)。 編程要求 在右側(cè)命令行中啟動 Hadoop ,進行如下操作。 在 HDFS 中創(chuàng)建 /usr/output/ 文件夾; 在本地創(chuàng)建 hello.txt 文件并添加內(nèi)容:“ HDFS的

    2024年02月12日
    瀏覽(18)
  • 大數(shù)據(jù)技術(shù)原理與應(yīng)用 概念、存儲、處理、分析和應(yīng)用(林子雨)——第三章 分布式文件系統(tǒng)HDFS

    大數(shù)據(jù)技術(shù)原理與應(yīng)用 概念、存儲、處理、分析和應(yīng)用(林子雨)——第三章 分布式文件系統(tǒng)HDFS

    大數(shù)據(jù)要解決數(shù)據(jù)存儲問題,所以有了分布式文件系統(tǒng)(DFS),但可能不符合當(dāng)時的一些應(yīng)用需求,于是谷歌公司開發(fā)了GFS(Google file System)。GFS是閉源的,而HDFS是對GFS的開源實現(xiàn)。 1.GFS和DFS有什么區(qū)別? GFS(Google File System)和DFS(Distributed File System)都是分布式文件系統(tǒng),

    2024年02月03日
    瀏覽(99)
  • 分布式文件系統(tǒng)HDFS

    分布式文件系統(tǒng)HDFS

    分布式文件系統(tǒng) 把文件分布存儲到多個計算機節(jié)點 上,通過網(wǎng)絡(luò)實現(xiàn)文件在多臺主機上進行分布式存儲的文件系統(tǒng)。 分布式文件系統(tǒng)有兩大模式: Remote Access Model: 非本地文件不會復(fù)制到本地,所以對非本地文件的讀取和修改,利用RPC進行。 Upload/ Download Model:所有非本地文

    2024年02月09日
    瀏覽(20)
  • 2. 分布式文件系統(tǒng) HDFS

    2. 分布式文件系統(tǒng) HDFS

    問題一:如果一個文件中有 10 個數(shù)值,一行一個,并且都可以用 int 來度量?,F(xiàn)在求 10 個數(shù)值的和 思路: 逐行讀取文件的內(nèi)容 把讀取到的內(nèi)容轉(zhuǎn)換成 int 類型 把轉(zhuǎn)換后的數(shù)據(jù)進行相加 輸出最后的一個累加和 問題二:10000 個文件,每個文件 2T,文件里的內(nèi)容依然是每行一個

    2024年02月08日
    瀏覽(22)
  • 大數(shù)據(jù)——HDFS(分布式文件系統(tǒng))

    大數(shù)據(jù)——HDFS(分布式文件系統(tǒng))

    Hadoop的兩大核心組件 HDFS ( Hadoop Distributed Filesystem ):是一個易于擴展的 分布式文件系統(tǒng) ,運行在 成百上千 臺 低成本 的 機器 上。 HDFS 具有 高度容錯能力 ,旨在部署在低成本機器上。 HDFS 主要用于對 海量文件信息 進行 存儲 和 管理 ,也就是解決大數(shù)據(jù)文件(如 TB 乃至

    2023年04月17日
    瀏覽(28)
  • 頭歌 分布式文件系統(tǒng)HDFS 答案

    頭歌 分布式文件系統(tǒng)HDFS 答案

    第1關(guān):HDFS的基本操作 在右側(cè)命令行中啟動 Hadoop ,進行如下操作。 在 HDFS 中創(chuàng)建 /usr/output/ 文件夾; 在本地創(chuàng)建 hello.txt 文件并添加內(nèi)容:“ HDFS的塊比磁盤的塊大,其目的是為了最小化尋址開銷。 ”; 將 hello.txt 上傳至 HDFS 的 /usr/output/ 目錄下; 刪除 HDFS 的 /user/hadoop 目錄

    2023年04月27日
    瀏覽(22)
  • 【頭歌實訓(xùn)】分布式文件系統(tǒng) HDFS

    【頭歌實訓(xùn)】分布式文件系統(tǒng) HDFS

    本關(guān)任務(wù):使用 Hadoop 命令來操作分布式文件系統(tǒng)。 為了完成本關(guān)任務(wù)你需要了解的知識有:1. HDFS 的設(shè)計,2. HDFS 常用命令。 HDFS的設(shè)計 分布式文件系統(tǒng) 客戶:幫我保存一下這幾天的數(shù)據(jù)。 程序猿:好嘞,有多大呢? 客戶: 1T 。 程序猿:好沒問題,買個硬盤就搞定了。

    2024年04月15日
    瀏覽(27)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包