国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount

2年前作者：PushyTao分類：Toy博客閱讀(56)違法舉報

這篇具有很好參考價值的文章主要介紹了Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

寫在前面

本系列文章索引以及一些默認好的條件在傳送門

step1 eclipse訪問hadoop

首先需要明確eclipse安裝目錄，然后將hadoop-eclipse-plugin_版本號.jar插件放在安裝目錄的dropins下

Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount
關(guān)于插件，可以通過博主上傳到csdn的免費資源獲取，鏈接
具體版本可以自己選擇：

step2 重啟并配置eclipse

在eclipse界面中依次選擇：Window→show view→other→MapReduce Tools/Map/Reduce Locations
Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount
然后在界面上會顯示一個大象符號，如下圖：

點擊大象符號，然后就會配置一個DFS Location
配置參數(shù)為：

配置好后點擊finish
然后會出現(xiàn)：
Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount

step3 新建Map/Reduce項目

在Eclipse中依次選擇File→New→Other…→Map/Reduce Project→Next，
輸入項目名TestWordCount，瀏覽并選擇Hadoop路徑/usr/local/hadoop，單擊“Finish”按鈕，則新建項目TestWordCount成功
新建包并在包下創(chuàng)建相應(yīng)的類，具體項目結(jié)構(gòu)如下：
Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount

step4 復(fù)制粘貼代碼

package wordCount;

import java.io.IOException;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class WordCount {
	public static class WordCountMapper extends Mapper<Object, Text, Text, IntWritable> {
		/**
		 * 定義final 靜態(tài)變量one,用來標示鍵值對<String,One>
		 * 然后定義Text類型的變量來存儲字符串
		 */
		private final static IntWritable one = new IntWritable(1);
		private Text word = new Text();
		public void map(Object key, Text value, Context context)
		throws IOException, InterruptedException {
			StringTokenizer itr = new StringTokenizer(value.toString());
			while (itr.hasMoreTokens()) {//
				word.set(itr.nextToken());
				/**
				 * 寫入鍵值對
				 */
				context.write(word, one);
			}
		}
	}
	public static class WordCountReducer extends Reducer<Text, IntWritable, Text, IntWritable> {
		private IntWritable result = new IntWritable();
		public void reduce(Text key, Iterable<IntWritable> values, Context context)
		throws IOException, InterruptedException {
			int sum = 0;
			for (IntWritable val : values) {
				sum += val.get();
			}
			result.set(sum);
			context.write(key, result);
		}
	}
	public static void main(String[] args) throws Exception {
		Configuration conf = new Configuration();
		if (args.length != 2) {
			System.err.println("Usage: <in> <out>");
			System.exit(2); 
		}
		Job job = Job.getInstance(conf, "word count");
		job.setJarByClass(WordCount.class);
		job.setMapperClass(WordCountMapper.class);
		job.setCombinerClass(WordCountReducer.class);
		job.setReducerClass(WordCountReducer.class);
		job.setOutputKeyClass(Text.class);
		job.setOutputValueClass(IntWritable.class);
		FileInputFormat.addInputPath(job, new Path(args[0]));
		FileOutputFormat.setOutputPath(job, new Path(args[1]));
		System.exit(job.waitForCompletion(true) ? 0 : 1);
	}
}

step5 配置運行參數(shù)

啟動hadoop集群后在終端寫入：

hadoop fs -mkdir /tmp
hadoop fs -chmod -R 777 /tmp

Run→Run Configurations選項，以配置輸入輸出參數(shù)
大致為：
Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount
點擊run直接跑
然后在左側(cè)的目錄下會顯示文件夾：

點進去看下part-r-00000文件就會發(fā)現(xiàn)，該文件存儲結(jié)果：

其中輸入為：

結(jié)果與預(yù)期一致，項目成功~文章來源地址http://www.zghlxwxcb.cn/news/detail-406862.html

整個hadoop就到此結(jié)束啦

到了這里，關(guān)于Hadoop集群搭建記錄 | 云計算[CentOS7] | 偽分布式集群 Master運行WordCount的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

大數(shù)據(jù)技術(shù)棧-Hadoop3.3.4-完全分布式集群搭建部署-centos7（完全超詳細-小白注釋版）虛擬機安裝+平臺部署
目錄環(huán)境條件： 1、安裝虛擬機（已安裝好虛擬機的可跳轉(zhuǎn)至? 二、安裝JDK與Hadoop）（1）直接新建一臺虛擬機（2）首次啟用虛擬機，進行安裝一、集群前置環(huán)境搭建（三臺機器分別設(shè)置hostname、網(wǎng)卡（ip）配置、ssh免密登錄） 1、查看一下本機與虛擬機的網(wǎng)卡和ip信息（1）
2024年02月06日
瀏覽(31)
Spark集群搭建記錄 | 云計算[CentOS7] | Scala Maven項目訪問Spark(local模式)實現(xiàn)單詞計數(shù)
本系列文章索引以及一些默認好的條件在傳送門要想完成Spark的配置，首先需要完成HadoopSpark的配置 Hadoop配置教程：鏈接若未進行明確說明，均按照root用戶操作本來在Eclipse的Marketplace便可以下載，可是現(xiàn)在官網(wǎng)都寄了所以說只好找到之前的版本湊合來用下載鏈接這個軟件
2024年02月05日
瀏覽(26)
CentOS7搭建hadoop集群
說明： ? ? ? ? 1.準備三臺虛擬機，參考：CentOS7集群環(huán)境搭建(以3臺為例) ? ? ? ? 2.配置虛擬機間免密登陸：參考：CentOS7集群配置免密登錄 ? ? ? ? 3.虛擬機分別安裝jdk：參考：CentOS7集群安裝JDK1.8 ? ? ? ? 4.hadoop安裝包下載，下載地址準備開始搭建hadoop集群，以下操作在第
2024年02月09日
瀏覽(22)
CentOS7搭建偽分布式Hadoop（全過程2023）
可以使用XFTP，用物理主機鏈接虛擬機的centos傳送java文件，或者直接去java官網(wǎng)下載文件，解壓。配置文件，啟動配置。驗證java是否配置好輸入： java javac java -version 修改六個配置文件hadoop-env.sh 啟動hadoop之前需要格式化(具體在出現(xiàn)的問題第六點）驗證：出現(xiàn)錯誤，解決和驗
2024年02月08日
瀏覽(62)
【hadoop】centos7.6+hadoop3.1.1搭建分布式hadoop環(huán)境——包含各類問題解決方案
本文針對centos7.4即以上版本的hadoop環(huán)境搭建，因為這部分搭建是個很復(fù)雜且很容易出錯的內(nèi)容，所以在結(jié)合了多種搭建方案后給出最適宜當前版本的搭建。本教程適用于CentOS 7.4即以上版本，如果是Ubuntu等其它linux內(nèi)核版本則不適合。查看系統(tǒng)版本：軟件版本獲取方法 Ope
2024年02月16日
瀏覽(24)
spark 基于物理機centos7環(huán)境搭建分布式集群
非生產(chǎn)環(huán)境，就使用一個新一點的版本，提前先踩踩坑，版本的選型真是一個頭疼的問題，先看一下apache的官網(wǎng)的測試圖：偽分布式看這里：配置之前：若是用偽分布式時，在本機必須生成key-gen 與ssh-copy-id到本機，且hosts中必須加入127.0.0.1 ?本機名并關(guān)閉防火墻這幾步才可
2024年02月03日
瀏覽(27)
搭建Hadoop3.x完全分布式集群（CentOS 9）
虛擬機相關(guān)： VMware workstation 16：虛擬機 vmware_177981.zip CentOS Stream 9：虛擬機 CentOS-Stream-9-latest-x86_64-dvd1.iso Hadoop相關(guān) jdk1.8：JDK jdk-8u261-linux-x64.tar.gz Hadoop 3.3.6：Hadoop Hadoop 3.3.6.tar.gz 輔助工具 putty：tools putty.exe mtputty：tools mtputty.exe winscp：tools WinSCP-6.3.1-Portable.zip 本文相關(guān)資源可以
2024年04月14日
瀏覽(32)
Centos7原生hadoop環(huán)境，搭建Impala集群和負載均衡配置
Impala集群包含一個Catalog Server (Catalogd)、一個Statestore Server (Statestored) 和若干個Impala Daemon (Impalad)。Catalogd主要負責(zé)元數(shù)據(jù)的獲取和DDL的執(zhí)行，Statestored主要負責(zé)消息/元數(shù)據(jù)的廣播，Impalad主要負責(zé)查詢的接收和執(zhí)行。 Impalad又可配置為coordinator only、 executor only 或coordinator and exe
2024年02月04日
瀏覽(51)
云計算集群搭建記錄[Hadoop|Zookeeper|Hbase|Spark | Docker |OpenStack]更新索引 |動態(tài)更新
為了能夠更好的查看所更新的文章，講該博文設(shè)為索引為了解決在編輯文件等操作的過程中的權(quán)限問題，博主一律默認采用 root 賬戶登錄對于初次安裝的用戶可以采用如下命令行：另外推薦一款終端工具：Tabby，既能夠連接自己的服務(wù)器，也能夠連接自己本地的虛擬機，還
2023年04月13日
瀏覽(27)
CentOS7安裝Zookeeper分布式集群
前言 ZooKeeper 是一個開源的分布式協(xié)調(diào)服務(wù)框架，主要用于分布式系統(tǒng)中的數(shù)據(jù)同步、配置管理、集群控制和命名服務(wù)等方面的處理。本文在3個系統(tǒng)為CentOS7的Linux節(jié)點上配置了Zookeeper分布式集群，安裝配置的過程均在普通用戶 sxZhang 的賬戶上完成，安裝路徑為 ~/bigdata ，3個
2024年01月17日
瀏覽(26)