目錄
分布式內(nèi)存計算Spark環(huán)境部署
1.? 簡介
2.? 安裝
2.1【node1執(zhí)行】下載并解壓
2.2【node1執(zhí)行】修改配置文件名稱
2.3【node1執(zhí)行】修改配置文件,spark-env.sh
2.4 【node1執(zhí)行】修改配置文件,slaves
2.5【node1執(zhí)行】分發(fā)
2.6【node2、node3執(zhí)行】設置軟鏈接
2.7【node1執(zhí)行】啟動Spark集群
2.8? 打開Spark監(jiān)控頁面,瀏覽器打開:
2.9【node1執(zhí)行】提交測試任務
分布式內(nèi)存計算Flink環(huán)境部署
1.? 簡介
2.? 安裝
2.1【node1操作】下載安裝包
2. 2【node1操作】修改配置文件,conf/flink-conf.yaml
2.3 【node1操作】,修改配置文件,conf/slaves
2.4【node1操作】分發(fā)Flink安裝包到其它機器
2.5 【node2、node3操作】
2.6 【node1操作】,啟動Flink
2.7? ?驗證Flink啟動
2.8? ?提交測試任務
注意:
本小節(jié)的操作,基于:大數(shù)據(jù)集群(Hadoop生態(tài))安裝部署環(huán)節(jié)中所構建的Hadoop集群,如果沒有Hadoop集群,請參閱前置內(nèi)容,部署好環(huán)境。
大數(shù)據(jù)集群(Hadoop生態(tài))安裝部署:
大數(shù)據(jù)集群(Hadoop生態(tài))安裝部署_時光の塵的博客-CSDN博客
大數(shù)據(jù)NoSQL數(shù)據(jù)庫HBase集群部署:
大數(shù)據(jù)NoSQL數(shù)據(jù)庫HBase集群部署-CSDN博客
分布式內(nèi)存計算Spark環(huán)境部署
1.? 簡介
Spark是一款分布式內(nèi)存計算引擎,可以支撐海量數(shù)據(jù)的分布式計算。
Spark在大數(shù)據(jù)體系是明星產(chǎn)品,作為最新一代的綜合計算引擎,支持離線計算和實時計算。
在大數(shù)據(jù)領域廣泛應用,是目前世界上使用最多的大數(shù)據(jù)分布式計算引擎。
我們將基于前面構建的Hadoop集群,部署Spark Standalone集群。
2.? 安裝
2.1【node1執(zhí)行】下載并解壓
wget https: / archive.apache.org/dist/spark/spark-2.4.5/spark-2.4.5-bin-hadoop2.7.tgz
# 解壓
tar -zxvf spark-2.4.5-bin-hadoop2.7.tgz -C /export/server/
# 軟鏈接
ln -s /export/server/spark-2.4.5-bin-hadoop2.7 /export/server/spark
2.2【node1執(zhí)行】修改配置文件名稱
# 改名
cd /export/server/spark/conf
mv spark-env.sh.template spark-env.sh
mv slaves.template slaves
2.3【node1執(zhí)行】修改配置文件,spark-env.sh
#設置JAVA安裝目錄
JAVA_HOME=/export/server/jdk
#HADOOP軟件配置文件目錄,讀取HDFS上文件和運行YARN集群
HADOOP_CONF_DIR=/export/server/hadoop/etc/hadoop
YARN_CONF_DIR=/export/server/hadoop/etc/hadoop
#指定spark老大Master的IP和提交任務的通信端口
export SPARK_MASTER_HOST=node1
export SPARK_MASTER_PORT=7077
SPARK_MASTER_WEBUI_PORT=8080
SPARK_WORKER_CORES=1
SPARK_WORKER_MEMORY=1g
2.4 【node1執(zhí)行】修改配置文件,slaves
node1
node2
node3
2.5【node1執(zhí)行】分發(fā)
scp -r spark-2.4.5-bin-hadoop2.7 node2:$PWD
scp -r spark-2.4.5-bin-hadoop2.7 node3:$PWD
2.6【node2、node3執(zhí)行】設置軟鏈接
ln -s /export/server/spark-2.4.5-bin-hadoop2.7 /export/server/spark
2.7【node1執(zhí)行】啟動Spark集群
/export/server/spark/sbin/start-all.sh
# 如需停止,可以
/export/server/spark/sbin/stop-all.sh
2.8? 打開Spark監(jiān)控頁面,瀏覽器打開:
http://node1:8081
2.9【node1執(zhí)行】提交測試任務
/export/server/spark/bin/spark-submit --master
spark: / node1:7077 - class
org.apache.spark.examples.SparkPi
/export/server/spark/examples/jars/spark-examples_2.11-2.4.5.jar
分布式內(nèi)存計算Flink環(huán)境部署
1.? 簡介
Flink同Spark一樣,是一款分布式內(nèi)存計算引擎,可以支撐海量數(shù)據(jù)的分布式計算。
Flink在大數(shù)據(jù)體系同樣是明星產(chǎn)品,作為最新一代的綜合計算引擎,支持離線計算和實時計算。
在大數(shù)據(jù)領域廣泛應用,是目前世界上除去Spark以外,應用最為廣泛的分布式計算引擎。
我們將基于前面構建的Hadoop集群,部署Flink Standalone集群
Spark更加偏向于離線計算而Flink更加偏向于實時計算。
2.? 安裝
2.1【node1操作】下載安裝包
wget https: / archive.apache.org/dist/flink/flink-1.10.0/flink-1.10.0-bin-scala_2.11.tgz
# 解壓
tar -zxvf flink-1.10.0-bin-scala_2.11.tgz -C
/export/server/
# 軟鏈接
ln -s /export/server/flink-1.10.0
/export/server/flink
2. 2【node1操作】修改配置文件,conf/flink-conf.yaml
# jobManager 的IP地址
jobmanager.rpc.address: node1
# JobManager 的端口號
jobmanager.rpc.port: 6123
# JobManager JVM heap 內(nèi)存大小
jobmanager.heap.size: 1024m
# TaskManager JVM heap 內(nèi)存大小
taskmanager.heap.size: 1024m
# 每個 TaskManager 提供的任務 slots 數(shù)量大小
taskmanager.numberOfTaskSlots: 2
#是否進行預分配內(nèi)存,默認不進行預分配,這樣在我們不使用flink集群時候不會占用集群資源
taskmanager.memory.preallocate: false
# 程序默認并行計算的個數(shù)
parallelism.default: 1
#JobManager的Web界面的端口(默認:8081)
jobmanager.web.port: 8081
2.3 【node1操作】,修改配置文件,conf/slaves
node1
node2
node3
2.4【node1操作】分發(fā)Flink安裝包到其它機器
cd /export/server
scp -r flink-1.10.0 node2:`pwd`/
scp -r flink-1.10.0 node3:`pwd`/
2.5 【node2、node3操作】
# 配置軟鏈接
ln -s /export/server/flink-1.10.0
/export/server/flink
2.6 【node1操作】,啟動Flink
/export/server/flink/bin/start-cluster.sh
2.7? ?驗證Flink啟動
# 瀏覽器打開
http://node1:8081
2.8? ?提交測試任務
【node1執(zhí)行】
/export/server/flink/bin/flink run
/export/server/flink-1.10.0/examples/batch/WordCount.jar
更多環(huán)境部署:
MySQL5.7版本與8.0版本在CentOS系統(tǒng)安裝:
MySQL5.7版本與8.0版本在CentOS系統(tǒng)安裝_時光の塵的博客-CSDN博客
MySQL5.7版本與8.0版本在Ubuntu(WSL環(huán)境)系統(tǒng)安裝:
MySQL5.7版本與8.0版本在Ubuntu(WSL環(huán)境)系統(tǒng)安裝-CSDN博客
Tomcat在CentOS上的安裝部署:
Tomcat在CentOS上的安裝部署-CSDN博客
Nginx在CentOS上的安裝部署、RabbitMQ在CentOS上安裝部署:
Nginx在CentOS上的安裝部署、RabbitMQ在CentOS上安裝部署-CSDN博客
集群化環(huán)境前置準備:
集群化環(huán)境前置準備_時光の塵的博客-CSDN博客
Zookeeper集群安裝部署、Kafka集群安裝部署:文章來源:http://www.zghlxwxcb.cn/news/detail-714686.html
Zookeeper集群安裝部署、Kafka集群安裝部署_時光の塵的博客-CSDN博客文章來源地址http://www.zghlxwxcb.cn/news/detail-714686.html
到了這里,關于分布式內(nèi)存計算Spark環(huán)境部署與分布式內(nèi)存計算Flink環(huán)境部署的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!