国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Hadoop大數(shù)據(jù)從入門到實(shí)戰(zhàn)(二)分布式文件系統(tǒng)HDFS

這篇具有很好參考價(jià)值的文章主要介紹了Hadoop大數(shù)據(jù)從入門到實(shí)戰(zhàn)(二)分布式文件系統(tǒng)HDFS。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

頭歌實(shí)踐教學(xué)平臺(tái)

教學(xué)課堂

大數(shù)據(jù)從入門到實(shí)戰(zhàn) - 第2章 分布式文件系統(tǒng)HDFS

第1關(guān):HDFS的基本操作

任務(wù)描述

本關(guān)任務(wù):使用Hadoop命令來操作分布式文件系統(tǒng)。

編程要求

在右側(cè)命令行中啟動(dòng)Hadoop,進(jìn)行如下操作。

  • HDFS中創(chuàng)建/usr/output/文件夾;
  • 在本地創(chuàng)建hello.txt文件并添加內(nèi)容:“HDFS的塊比磁盤的塊大,其目的是為了最小化尋址開銷。”;
  • hello.txt上傳至HDFS/usr/output/目錄下;
  • 刪除HDFS/user/hadoop目錄;
  • Hadoop上的文件hello.txtHDFS復(fù)制到本地/usr/local目錄。

測試說明

平臺(tái)會(huì)查看你本地的文件和HDFS的文件是否存在,如果存在,則會(huì)將其內(nèi)容輸出到控制臺(tái)。

預(yù)期輸出:

HDFS的塊比磁盤的塊大,其目的是為了最小化尋址開銷。

HDFS的塊比磁盤的塊大,其目的是為了最小化尋址開銷。

代碼

start-dfs.sh
hadoop fs -mkdir /usr
hadoop fs -mkdir /usr/output
vim hello.txt
hadoop fs -put hello.txt /usr/output
hadoop fs -rm -r /user/hadoop
hadoop fs -copyToLocal /usr/output/hello.txt /usr/local

截圖

hdfs創(chuàng)建文件夾,大數(shù)據(jù),hadoop,分布式

?第2關(guān):HDFS-JAVA接口之讀取文件

任務(wù)描述

本關(guān)任務(wù):使用HDFSJava接口進(jìn)行文件的讀寫,文件uri地址為hdfs://localhost:9000/user/hadoop/task.txt。

編程要求

在右側(cè)代碼編輯區(qū)中編寫代碼實(shí)現(xiàn)如下功能:

  • 使用FSDataInputStream獲取HDFS/user/hadoop/目錄下的task.txt的文件內(nèi)容,并輸出,其中urihdfs://localhost:9000/user/hadoop/task.txt。

測試說明

點(diǎn)擊評(píng)測,平臺(tái)會(huì)通過腳本創(chuàng)建/user/hadoop/task.txt文件并添加相應(yīng)內(nèi)容,無需你自己創(chuàng)建,開啟hadoop,編寫代碼點(diǎn)擊評(píng)測即可。因?yàn)?code>Hadoop環(huán)境非常消耗資源,所以你如果一段時(shí)間不在線,后臺(tái)會(huì)銷毀你的鏡像,之前的數(shù)據(jù)會(huì)丟失(你的代碼不會(huì)丟失),這個(gè)時(shí)候需要你重新啟動(dòng)Hadoop。

預(yù)期輸出: WARN [main] - Unable to load native-hadoop library for your platform... using builtin-java classes where applicable 怕什么真理無窮,進(jìn)一寸有一寸的歡喜。

第一行打印出來的是log4j的日志警告,可以忽略。

代碼

//請(qǐng)?jiān)贐egin-End之間添加你的代碼,完成任務(wù)要求。
/********* Begin *********/
URI uri = URI.create("hdfs://localhost:9000/user/hadoop/task.txt");
Configuration config = new Configuration();
FileSystem fs = FileSystem.get(uri, config);
InputStream in = null;
try{
    in = fs.open(new Path(uri));
    IOUtils.copyBytes(in,System.out,2048,false);
}catch(Exception e){
    IOUtils.closeStream(in);
}
/********* End *********/

截圖

hdfs創(chuàng)建文件夾,大數(shù)據(jù),hadoop,分布式

hdfs創(chuàng)建文件夾,大數(shù)據(jù),hadoop,分布式

第3關(guān):HDFS-JAVA接口之上傳文件

任務(wù)描述

本關(guān)任務(wù):使用HDFSAPI上傳文件至集群。

編程要求

在右側(cè)代碼編輯區(qū)和命令行中,編寫代碼與腳本實(shí)現(xiàn)如下功能:

  • /develop/input/目錄下創(chuàng)建hello.txt文件,并輸入如下數(shù)據(jù): 迢迢牽牛星,皎皎河漢女。 纖纖擢素手,札札弄機(jī)杼。 終日不成章,泣涕零如雨。 河漢清且淺,相去復(fù)幾許? 盈盈一水間,脈脈不得語。 《迢迢牽牛星》

  • 使用FSDataOutputStream對(duì)象將文件上傳至HDFS/user/tmp/目錄下,并打印進(jìn)度。

測試說明

平臺(tái)會(huì)運(yùn)行你的java程序,并查看集群的文件將文件信息輸出到控制臺(tái),第一行屬于警告信息可以忽略。

預(yù)期輸出:

hdfs創(chuàng)建文件夾,大數(shù)據(jù),hadoop,分布式

?代碼

//請(qǐng)?jiān)?Begin-End 之間添加代碼,完成任務(wù)要求。
        /********* Begin *********/
		File localPath = new File("/develop/input/hello.txt");
        String hdfsPath = "hdfs://localhost:9000/user/tmp/hello.txt";
        InputStream in = new BufferedInputStream(new FileInputStream(localPath));
        Configuration conf = new Configuration();
        FileSystem fs = FileSystem.get(URI.create(hdfsPath),conf);
        long fileSize = localPath.length() > 65536 ? localPath.length() / 65536 : 1;
        FSDataOutputStream out = fs.create(new Path(hdfsPath),new Progressable(){
            long fileCount = 0;
            public void progress(){
                System.out.println("總進(jìn)度"+(fileCount / fileSize) * 100 + "%");
                fileCount++;
            }
        });
		IOUtils.copyBytes(in,out,2048,true);
		
		
		/********* End *********/

?截圖

hdfs創(chuàng)建文件夾,大數(shù)據(jù),hadoop,分布式

?hdfs創(chuàng)建文件夾,大數(shù)據(jù),hadoop,分布式

第4關(guān):HDFS-JAVA接口之刪除文件?

任務(wù)描述

本關(guān)任務(wù):刪除HDFS中的文件和文件夾。

編程要求

在右側(cè)代碼區(qū)填充代碼,實(shí)現(xiàn)如下功能:

  • 刪除HDFS/user/hadoop/目錄(空目錄);
  • 刪除HDFS/tmp/test/目錄(非空目錄);
  • 列出HDFS根目錄下所有的文件和文件夾;
  • 列出HDFS/tmp/的所有文件和文件夾。

測試說明

HDFS的文件夾在你點(diǎn)擊評(píng)測是會(huì)通過腳本自動(dòng)創(chuàng)建,不需要你自己創(chuàng)建哦,依照題意編寫代碼點(diǎn)擊評(píng)測即可。

預(yù)期輸出:

hdfs創(chuàng)建文件夾,大數(shù)據(jù),hadoop,分布式

?代碼

//請(qǐng)?jiān)?Begin-End 之間添加代碼,完成本關(guān)任務(wù)。
        /********* Begin *********/
        String uri = "hdfs://localhost:9000/";
        String path1 = "hdfs://localhost:9000/user/hadoop";
        String path2 = "hdfs://localhost:9000/tmp/test";
        Configuration config = new Configuration();
        FileSystem fs = FileSystem.get(URI.create(uri),config);
        fs.delete(new Path(path1),true);
        fs.delete(new Path(path2),true);
        Path[] paths = {new Path(uri),new Path("hdfs://localhost:9000/tmp")};
        FileStatus[] status = fs.listStatus(paths);
        Path[] listPaths = FileUtil.stat2Paths(status);
 
        for(Path path : listPaths){
            System.out.println(path);
        }
 
        /********* End *********/

截圖

hdfs創(chuàng)建文件夾,大數(shù)據(jù),hadoop,分布式

?hdfs創(chuàng)建文件夾,大數(shù)據(jù),hadoop,分布式

?文章來源地址http://www.zghlxwxcb.cn/news/detail-526194.html

到了這里,關(guān)于Hadoop大數(shù)據(jù)從入門到實(shí)戰(zhàn)(二)分布式文件系統(tǒng)HDFS的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • Hadoop:HDFS--分布式文件存儲(chǔ)系統(tǒng)

    Hadoop:HDFS--分布式文件存儲(chǔ)系統(tǒng)

    目錄 ? HDFS的基礎(chǔ)架構(gòu) VMware虛擬機(jī)部署HDFS集群 HDFS集群啟停命令 HDFS Shell操作 hadoop 命令體系: 創(chuàng)建文件夾 -mkdir ?查看目錄內(nèi)容 -ls ?上傳文件到hdfs -put 查看HDFS文件內(nèi)容 -cat 下載HDFS文件 -get 復(fù)制HDFS文件 -cp 追加數(shù)據(jù)到HDFS文件中 -appendToFile HDFS文件移動(dòng) -mv ?刪除HDFS文件 -rm ?

    2024年02月09日
    瀏覽(92)
  • HDFS Hadoop分布式文件存儲(chǔ)系統(tǒng)整體概述

    HDFS Hadoop分布式文件存儲(chǔ)系統(tǒng)整體概述

    整體概述舉例: 包括機(jī)架 rack1、rack2 包括5個(gè)Datanode,一個(gè)Namenode( 主角色 )帶領(lǐng)5個(gè)Datanode( 從角色 ),每一個(gè)rack中包含不同的block模塊文件為 分塊存儲(chǔ)模式 。塊與塊之間通過replication進(jìn)行 副本備份 ,進(jìn)行冗余存儲(chǔ),Namenode對(duì)存儲(chǔ)的 元數(shù)據(jù)進(jìn)行記錄 。該架構(gòu)可以概括為一個(gè) 抽象

    2024年02月16日
    瀏覽(89)
  • hadoop-hdfs分布式文件系統(tǒng)理論(一)

    hadoop-hdfs分布式文件系統(tǒng)理論(一)

    可以更好的支持分布式計(jì)算。 hadoop distribute file system是一個(gè)分布式 文件系統(tǒng),操作的是文件,增、刪都是以文件為單位。 文件線性按字節(jié)切割成塊(block),具有offset,id offset是指block的偏移量,比如block大小是10,offset可以是0,10,20,30。。。 id是block的名稱,比如block1,block

    2024年02月11日
    瀏覽(41)
  • Hadoop的分布式文件存儲(chǔ)系統(tǒng)HDFS組件的使用

    Hadoop的分布式文件存儲(chǔ)系統(tǒng)HDFS組件的使用

    存儲(chǔ)整個(gè)HDFS集群的元數(shù)據(jù)(metaData) —— 整個(gè)集群中存儲(chǔ)的目錄和文件的索引 管理整個(gè)HDFS集群 接收客戶端的請(qǐng)求 負(fù)責(zé)節(jié)點(diǎn)的故障轉(zhuǎn)移 存儲(chǔ)數(shù)據(jù),是以block塊的形式進(jìn)行數(shù)據(jù)的存放。 默認(rèn)情況下block塊的大小是128M。 blocksize大小的計(jì)算公式: 尋址時(shí)間:下載文件時(shí)找到文件

    2024年02月09日
    瀏覽(97)
  • Hadoop HDFS分布式文件系統(tǒng)(介紹以及基礎(chǔ)操作命令)

    Hadoop HDFS分布式文件系統(tǒng)(介紹以及基礎(chǔ)操作命令)

    目錄 一、為什么需要分布式存儲(chǔ)? 二、分布式的基礎(chǔ)架構(gòu)分析 ?三、HDFS基礎(chǔ)架構(gòu) 1.HDFS簡介 四、HDFS集群啟停命令 1.一鍵啟停腳本 2.單進(jìn)程啟停 五、HDFS基本操作命令 1.創(chuàng)建文件夾 ?2.查看指定目錄下內(nèi)容? 3.上傳文件到HDFS指定目錄下 ?4.查看HDFS文件內(nèi)容 5.下載HDFS文件 ?6.拷貝

    2024年02月05日
    瀏覽(167)
  • 大數(shù)據(jù) | 實(shí)驗(yàn)零:安裝 Hadoop 偽分布式系統(tǒng)

    大數(shù)據(jù) | 實(shí)驗(yàn)零:安裝 Hadoop 偽分布式系統(tǒng)

    ?? 前言 :本篇是個(gè)人配置環(huán)境的總結(jié),基于指導(dǎo)書,補(bǔ)充了許多在配置過程中出現(xiàn)的問題的解決細(xì)節(jié)。希望能幫到你??。 Vmware workstation pro 16 Ubuntu 20.04 JDK 1.8 Hadoop 3.2.2 下邊資源是本篇博客會(huì)用到的相關(guān)文件 (建議直接下載,相關(guān)代碼直接對(duì)應(yīng)的下述文件, 下載完先不要?jiǎng)?/p>

    2023年04月17日
    瀏覽(15)
  • Hadoop是一個(gè)開源的分布式處理系統(tǒng),主要用于處理和存儲(chǔ)大量數(shù)據(jù)

    Hadoop是一個(gè)開源的分布式處理系統(tǒng),主要用于處理和存儲(chǔ)大量數(shù)據(jù)

    Hadoop是一個(gè)開源的分布式處理系統(tǒng),主要用于處理和存儲(chǔ)大量數(shù)據(jù)。它是由Apache軟件基金會(huì)開發(fā)的,現(xiàn)在已經(jīng)成為大數(shù)據(jù)領(lǐng)域中廣泛使用的技術(shù)之一。 Hadoop架構(gòu) Hadoop的架構(gòu)包括以下幾個(gè)主要組件: Hadoop Distributed File System (HDFS) : HDFS是Hadoop的核心組件之一,它是一個(gè)分布式文

    2024年02月04日
    瀏覽(24)
  • 大數(shù)據(jù)——HDFS(分布式文件系統(tǒng))

    大數(shù)據(jù)——HDFS(分布式文件系統(tǒng))

    Hadoop的兩大核心組件 HDFS ( Hadoop Distributed Filesystem ):是一個(gè)易于擴(kuò)展的 分布式文件系統(tǒng) ,運(yùn)行在 成百上千 臺(tái) 低成本 的 機(jī)器 上。 HDFS 具有 高度容錯(cuò)能力 ,旨在部署在低成本機(jī)器上。 HDFS 主要用于對(duì) 海量文件信息 進(jìn)行 存儲(chǔ) 和 管理 ,也就是解決大數(shù)據(jù)文件(如 TB 乃至

    2023年04月17日
    瀏覽(28)
  • 【云計(jì)算】Hadoop2.x完全分布式集群(入門)

    【云計(jì)算】Hadoop2.x完全分布式集群(入門)

    【虛擬機(jī)】VMware Workstation 16 Pro 【鏡像】CentOS-7-x86_64-DVD-1804.iso 【java】jdk-8u281-linux-x64.rpm 【Hadoop】hadoop-2.7.1.tar.gz 【SSH遠(yuǎn)程】SecureCRTPortable.exe 【上傳下載】SecureFXPortable.exe 配網(wǎng)卡ens33 重啟網(wǎng)絡(luò) 私鑰、公鑰 克隆、改名、改IP 三臺(tái)機(jī)都要做:?? 生成密鑰 密鑰發(fā)送 登錄測試 had

    2024年04月12日
    瀏覽(26)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包