国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount

這篇具有很好參考價值的文章主要介紹了Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

寫在前面

本系列文章索引以及一些默認好的條件在 傳送門

step1 eclipse訪問hadoop

首先需要明確eclipse安裝目錄,然后將hadoop-eclipse-plugin_版本號.jar插件放在安裝目錄的dropins下

Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount
關(guān)于插件,可以通過博主上傳到csdn的免費資源獲取,鏈接
具體版本可以自己選擇:
Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount

step2 重啟并配置eclipse

在eclipse界面中依次選擇:Window→show view→other→MapReduce Tools/Map/Reduce Locations
Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount
然后在界面上會顯示一個大象符號,如下圖:
Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount
點擊大象符號,然后就會配置一個DFS Location
配置參數(shù)為:
Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount
配置好后點擊finish
然后會出現(xiàn):
Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount

step3 新建Map/Reduce項目

在Eclipse中依次選擇File→New→Other…→Map/Reduce Project→Next,
輸入項目名TestWordCount,瀏覽并選擇Hadoop路徑/usr/local/hadoop,單擊“Finish”按鈕,則新建項目TestWordCount成功
新建包并在包下創(chuàng)建相應(yīng)的類,具體項目結(jié)構(gòu)如下:
Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount

step4 復(fù)制粘貼代碼

package wordCount;

import java.io.IOException;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class WordCount {
	public static class WordCountMapper extends Mapper<Object, Text, Text, IntWritable> {
		/**
		 * 定義final 靜態(tài)變量one,用來標示鍵值對<String,One>
		 * 然后定義Text類型的變量來存儲字符串
		 */
		private final static IntWritable one = new IntWritable(1);
		private Text word = new Text();
		public void map(Object key, Text value, Context context)
		throws IOException, InterruptedException {
			StringTokenizer itr = new StringTokenizer(value.toString());
			while (itr.hasMoreTokens()) {//
				word.set(itr.nextToken());
				/**
				 * 寫入鍵值對
				 */
				context.write(word, one);
			}
		}
	}
	public static class WordCountReducer extends Reducer<Text, IntWritable, Text, IntWritable> {
		private IntWritable result = new IntWritable();
		public void reduce(Text key, Iterable<IntWritable> values, Context context)
		throws IOException, InterruptedException {
			int sum = 0;
			for (IntWritable val : values) {
				sum += val.get();
			}
			result.set(sum);
			context.write(key, result);
		}
	}
	public static void main(String[] args) throws Exception {
		Configuration conf = new Configuration();
		if (args.length != 2) {
			System.err.println("Usage: <in> <out>");
			System.exit(2); 
		}
		Job job = Job.getInstance(conf, "word count");
		job.setJarByClass(WordCount.class);
		job.setMapperClass(WordCountMapper.class);
		job.setCombinerClass(WordCountReducer.class);
		job.setReducerClass(WordCountReducer.class);
		job.setOutputKeyClass(Text.class);
		job.setOutputValueClass(IntWritable.class);
		FileInputFormat.addInputPath(job, new Path(args[0]));
		FileOutputFormat.setOutputPath(job, new Path(args[1]));
		System.exit(job.waitForCompletion(true) ? 0 : 1);
	}
}
 

step5 配置運行參數(shù)

啟動hadoop集群后在終端寫入:

hadoop fs -mkdir /tmp
hadoop fs -chmod -R 777 /tmp

Run→Run Configurations選項,以配置輸入輸出參數(shù)
大致為:
Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount
點擊run直接跑
然后在左側(cè)的目錄下會顯示文件夾:
Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount
點進去看下part-r-00000文件就會發(fā)現(xiàn),該文件存儲結(jié)果:
Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount
其中輸入為:
Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount
結(jié)果與預(yù)期一致,項目成功~文章來源地址http://www.zghlxwxcb.cn/news/detail-406862.html

整個hadoop就到此結(jié)束啦

到了這里,關(guān)于Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 大數(shù)據(jù)技術(shù)棧-Hadoop3.3.4-完全分布式集群搭建部署-centos7(完全超詳細-小白注釋版)虛擬機安裝+平臺部署

    目錄 環(huán)境條件: 1、安裝虛擬機(已安裝好虛擬機的可跳轉(zhuǎn)至? 二、安裝JDK與Hadoop) (1)直接新建一臺虛擬機 (2)首次啟用虛擬機,進行安裝 一、集群前置環(huán)境搭建(三臺機器分別設(shè)置hostname、網(wǎng)卡(ip)配置、ssh免密登錄) 1、查看一下本機與虛擬機的網(wǎng)卡和ip信息 (1)

    2024年02月06日
    瀏覽(31)
  • Spark集群搭建記錄 | 云計算[CentOS7] | Scala Maven項目訪問Spark(local模式)實現(xiàn)單詞計數(shù)

    Spark集群搭建記錄 | 云計算[CentOS7] | Scala Maven項目訪問Spark(local模式)實現(xiàn)單詞計數(shù)

    本系列文章索引以及一些默認好的條件在 傳送門 要想完成Spark的配置,首先需要完成HadoopSpark的配置 Hadoop配置教程:鏈接 若未進行明確說明,均按照root用戶操作 本來在Eclipse的Marketplace便可以下載,可是現(xiàn)在官網(wǎng)都寄了 所以說只好找到之前的版本湊合來用 下載鏈接 這個軟件

    2024年02月05日
    瀏覽(26)
  • CentOS7搭建hadoop集群

    CentOS7搭建hadoop集群

    說明: ? ? ? ? 1.準備三臺虛擬機,參考:CentOS7集群環(huán)境搭建(以3臺為例) ? ? ? ? 2.配置虛擬機間免密登陸:參考:CentOS7集群配置免密登錄 ? ? ? ? 3.虛擬機分別安裝jdk:參考:CentOS7集群安裝JDK1.8 ? ? ? ? 4.hadoop安裝包下載,下載地址 準備開始搭建hadoop集群,以下操作在第

    2024年02月09日
    瀏覽(22)
  • CentOS7搭建偽分布式Hadoop(全過程2023)

    CentOS7搭建偽分布式Hadoop(全過程2023)

    可以使用XFTP,用物理主機鏈接虛擬機的centos傳送java文件,或者直接去java官網(wǎng)下載文件,解壓。配置文件,啟動配置。 驗證java是否配置好 輸入: java javac java -version 修改六個配置文件hadoop-env.sh 啟動hadoop之前需要格式化(具體在出現(xiàn)的問題第六點) 驗證: 出現(xiàn)錯誤,解決和驗

    2024年02月08日
    瀏覽(62)
  • 【hadoop】centos7.6+hadoop3.1.1搭建分布式hadoop環(huán)境——包含各類問題解決方案

    【hadoop】centos7.6+hadoop3.1.1搭建分布式hadoop環(huán)境——包含各類問題解決方案

    本文針對centos7.4即以上版本的hadoop環(huán)境搭建,因為這部分搭建是個很復(fù)雜且很容易出錯的內(nèi)容,所以在結(jié)合了多種搭建方案后給出最適宜當前版本的搭建。 本教程適用于CentOS 7.4即以上版本,如果是Ubuntu等其它linux內(nèi)核版本則不適合。 查看系統(tǒng)版本: 軟件 版本 獲取方法 Ope

    2024年02月16日
    瀏覽(24)
  • spark 基于物理機centos7環(huán)境搭建分布式集群

    非生產(chǎn)環(huán)境,就使用一個新一點的版本,提前先踩踩坑,版本的選型真是一個頭疼的問題,先看一下apache的官網(wǎng)的測試圖: 偽分布式看這里: 配置之前:若是用偽分布式時,在本機必須生成key-gen 與ssh-copy-id到本機,且hosts中必須加入127.0.0.1 ?本機名并關(guān)閉防火墻這幾步才可

    2024年02月03日
    瀏覽(27)
  • 搭建Hadoop3.x完全分布式集群(CentOS 9)

    搭建Hadoop3.x完全分布式集群(CentOS 9)

    虛擬機相關(guān): VMware workstation 16:虛擬機 vmware_177981.zip CentOS Stream 9:虛擬機 CentOS-Stream-9-latest-x86_64-dvd1.iso Hadoop相關(guān) jdk1.8:JDK jdk-8u261-linux-x64.tar.gz Hadoop 3.3.6:Hadoop Hadoop 3.3.6.tar.gz 輔助工具 putty:tools putty.exe mtputty:tools mtputty.exe winscp:tools WinSCP-6.3.1-Portable.zip 本文相關(guān)資源可以

    2024年04月14日
    瀏覽(32)
  • Centos7原生hadoop環(huán)境,搭建Impala集群和負載均衡配置

    Centos7原生hadoop環(huán)境,搭建Impala集群和負載均衡配置

    Impala集群包含一個Catalog Server (Catalogd)、一個Statestore Server (Statestored) 和若干個Impala Daemon (Impalad)。Catalogd主要負責(zé)元數(shù)據(jù)的獲取和DDL的執(zhí)行,Statestored主要負責(zé)消息/元數(shù)據(jù)的廣播,Impalad主要負責(zé)查詢的接收和執(zhí)行。 Impalad又可配置為coordinator only、 executor only 或coordinator and exe

    2024年02月04日
    瀏覽(51)
  • 云計算集群搭建記錄[Hadoop|Zookeeper|Hbase|Spark | Docker |OpenStack]更新索引 |動態(tài)更新

    云計算集群搭建記錄[Hadoop|Zookeeper|Hbase|Spark | Docker |OpenStack]更新索引 |動態(tài)更新

    為了能夠更好的查看所更新的文章,講該博文設(shè)為索引 為了解決在編輯文件等操作的過程中的權(quán)限問題,博主一律 默認采用 root 賬戶登錄 對于初次安裝的用戶可以采用如下命令行: 另外推薦一款終端工具:Tabby,既能夠連接自己的服務(wù)器,也能夠連接自己本地的虛擬機,還

    2023年04月13日
    瀏覽(27)
  • CentOS7安裝Zookeeper分布式集群

    前言 ZooKeeper 是一個開源的分布式協(xié)調(diào)服務(wù)框架,主要用于分布式系統(tǒng)中的數(shù)據(jù)同步、配置管理、集群控制和命名服務(wù)等方面的處理。本文在3個系統(tǒng)為CentOS7的Linux節(jié)點上配置了Zookeeper分布式集群,安裝配置的過程均在普通用戶 sxZhang 的賬戶上完成,安裝路徑為 ~/bigdata ,3個

    2024年01月17日
    瀏覽(26)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包