国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

這篇具有很好參考價值的文章主要介紹了大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

前言:七八九用于Spark的編程實驗

大數(shù)據(jù)開源框架之基于Spark的氣象數(shù)據(jù)處理與分析_木子一個Lee的博客-CSDN博客_spark輿情分析

目錄

實驗環(huán)境:

實驗步驟:

一、解壓

二、配置環(huán)境變量:?

三、修改配置文件?

1.修改spark-env.sh配置文件:

2.修改配置文件slaves:

3.分發(fā)配置文件:

四、測試:

五、網(wǎng)頁測試:

?六、解決能啟動Spark Shell但是報錯:

七、安裝python3.6

八、Jupyter Notebook

1.安裝pip

2.安裝jupyter

3.配置環(huán)境變量

4.創(chuàng)建Jupyter默認配置文件?

5.啟動和測試

九、Pip安裝matplotlib


實驗環(huán)境:

操作系統(tǒng):Ubuntu 18.04

Python:3.6.9

Spark版本:2.4.0

實驗步驟:

一、解壓

tar -zxf ./spark-2.4.0-bin-without-hadoop.tgz -C /usr/local

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

修改文件名字

mv spark-2.4.0-bin-without-hadoop spark

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

二、配置環(huán)境變量:?

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

vim /etc/profile

?添加:

export SPARK_HOME=/usr/local/spark
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

三、修改配置文件?

1.修改spark-env.sh配置文件:

cd /usr/local/spark/conf
cp spark-env.sh.template spark-env.sh:

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

添加(最后一項不添加也行):

export JAVA_HOME=/usr/local/jdk

export SPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoop classpath)

export HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop

export SPARK_MASTER_HOST=master

export SPARK_MAETER_PORT=7070

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

#spark默認web訪問端口為8080,為了防止沖突,可以修改(不改也行)

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

2.修改配置文件slaves:

cp slaves.template slaves

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

添加slave1和slave2:?

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

3.分發(fā)配置文件:

scp -r /usr/local/spark root@slave1:/usr/local/
scp -r /usr/local/spark root@slave2:/usr/local/

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

四、測試:

先啟動hadoop

start-dfs.sh
start-yarn.sh

?再啟動spark:

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

啟動spark master節(jié)點:

start-master.sh

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

啟動spark所有slave節(jié)點:

start-slaves.sh

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

Jps:

master節(jié)點:

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

slaves:

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

五、網(wǎng)頁測試:

在master瀏覽器打開

?http://master:8080?

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

Spark的關(guān)閉:

關(guān)閉Master節(jié)點

stop-master.sh

關(guān)閉Worker節(jié)點

sbin/stop-slaves.sh

關(guān)閉Hadoop集群

stop-dfs.sh
stop-yarn.sh

?測試自帶樣例:

./run-example sparkPi 2>&1|grep "Pi is"

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

六、解決能啟動Spark Shell但是報錯:

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

解決:

vim /etc/profile

添加:

export TERM=xterm-color

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

刷新環(huán)境變量:?

source /etc/profile

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

重新啟動即可

shark-shell

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

七、安裝python3.6

apt-get install python3.6-tk

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

查看版本:

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

八、Jupyter Notebook

1.安裝pip

apt-get install -y python3-pip

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

更新pip:

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

2.安裝jupyter

python3 - pip install jupyter

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

3.配置環(huán)境變量

vim /etc/profile

添加如下代碼?

export PATH=$PATH:~/.local/bin

退出編輯并執(zhí)行

source /etc/profile

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

4.創(chuàng)建Jupyter默認配置文件?

jupyter notebook --generate-config

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

生成SHA1加密的密鑰,保存密鑰,如''argon2:$argon2idXXX''

ipython
from notebook.auth import passwd

下面命令需要自己自定義一個密碼:?

passwd()
exit()

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

?把這個argon2字符串復(fù)制粘貼到一個文件中保存起來,后面用于配置密碼。(每個人都不一樣!??!)

'argon2:$argon2id$v=19$m=10240,t=10,p=8$0o4PUoInp4ez5ieMPdBn4Q$PzBU/k+PjTRNXnDnZYXXvE9MB/AR5dTLwwZfdZCo1io'(每個人都不一樣!??!)

設(shè)置密鑰,修改配置文件

執(zhí)行?

vim /root/.jupyter/jupyter_notebook_config.py

添加:

c.NotebookApp.ip='*'???????????????????? # 就是設(shè)置所有ip皆可訪問
c.NotebookApp.password = 'argon2:$argon2id$v=19$m=10240,t=10,p=8$0o4PUoInp4ez5ieMPdBn4Q$PzBU/k+PjTRNXnDnZYXXvE9MB/AR5dTLwwZfdZCo1io'
???? # 上面復(fù)制的那個argon2密文'
c.NotebookApp.open_browser = False?????? # 禁止自動打開瀏覽器
c.NotebookApp.port =8888????????????? # 端口

需要注意的是,在配置文件中,c.NotebookApp.password的值,就是剛才前面生成以后保存到文件中的sha1密文。另外,c.NotebookApp.notebook_dir = '/home/hadoop/jupyternotebook' 這行用于設(shè)置Notebook啟動進入的目錄,由于該目錄還不存在,所以需要在終端中執(zhí)行如下命令創(chuàng)建:

mkdir -p /home/hadoop/jupyternotebook

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

5.啟動和測試

jupyter notebook

報錯:

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

繞過root用戶運行:

jupyter notebook --allow-root

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

測試:

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

以上步驟參考:Ubuntu 安裝jupyter notebook - Leon_梁遠 - 博客園 (cnblogs.com)

可以首先安裝Anaconda,然后再配置Jupyter Notebook

使用Jupyter Notebook調(diào)試PySpark程序_廈大數(shù)據(jù)庫實驗室博客 (xmu.edu.cn)

九、Pip安裝matplotlib

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

這個會報錯:

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

可以用

???????apt-get install python3-matplotlib

大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署

配置完成?文章來源地址http://www.zghlxwxcb.cn/news/detail-502022.html

到了這里,關(guān)于大數(shù)據(jù)開源框架環(huán)境搭建(七)——Spark完全分布式集群的安裝部署的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • Linux環(huán)境搭建Hadoop及完全分布式集群

    Hadoop是一個開源的分布式計算框架,旨在處理大規(guī)模數(shù)據(jù)集和進行并行計算。核心包括兩個組件:HFDS、MapReduce。 配置方案 各虛擬機的用戶名分別為test0、test1、test2,主機名為hadoop100、hadoop101、hadoop102 虛擬機的分配如下: hadoop100:NameNode + ResourceManager hadoop101:DataNode + NodeM

    2024年03月23日
    瀏覽(36)
  • 【教程】Hadoop完全分布式環(huán)境搭建全過程

    【教程】Hadoop完全分布式環(huán)境搭建全過程

    保姆級入門教程:圖片講解 + 各種問題解決方案 集群服務(wù)器:hadoop102、hadoop103和hadoop104 虛擬機版本:CentOS7-1804 資源分享處(文章最后)提供CentOS7和Hadoop各組件壓縮包(也可以自行下載,要注意版本兼容的問題),有需要自取~ 1, 模板虛擬機準備 2, 克隆三臺虛擬機,作為

    2024年02月06日
    瀏覽(22)
  • Zookeeper+Hadoop+Spark+Flink+Kafka+Hbase+Hive 完全分布式高可用集群搭建(保姆級超詳細含圖文)

    Zookeeper+Hadoop+Spark+Flink+Kafka+Hbase+Hive 完全分布式高可用集群搭建(保姆級超詳細含圖文)

    說明: 本篇將詳細介紹用二進制安裝包部署hadoop等組件,注意事項,各組件的使用,常用的一些命令,以及在部署中遇到的問題解決思路等等,都將詳細介紹。 ip hostname 192.168.1.11 node1 192.168.1.12 node2 192.168.1.13 node3 1.2.1系統(tǒng)版本 1.2.2內(nèi)存建議最少4g、2cpu、50G以上的磁盤容量 本次

    2024年02月12日
    瀏覽(37)
  • Hadoop3.x完全分布式環(huán)境搭建Zookeeper和Hbase

    Hadoop3.x完全分布式環(huán)境搭建Zookeeper和Hbase

    集群規(guī)劃 IP地址 主機名 集群身份 192.168.138.100 hadoop00 主節(jié)點 192.168.138.101 hadoop01 從節(jié)點 192.168.138.102 hadoop02 從節(jié)點 Hadoop完全分布式環(huán)境搭建請移步傳送門 先在主節(jié)點上進行安裝和配置,隨后分發(fā)到各個從節(jié)點上。 1.1 解壓zookeeper并添加環(huán)境變量 1)解壓zookeeper到/usr/local文件夾

    2024年02月04日
    瀏覽(29)
  • Hadoop(偽分布式)+Spark(local模式)搭建Hadoop和Spark組合環(huán)境

    Hadoop(偽分布式)+Spark(local模式)搭建Hadoop和Spark組合環(huán)境

    環(huán)境 使用 Ubuntu 14.04 64位 作為系統(tǒng)環(huán)境(Ubuntu 12.04,Ubuntu16.04 也行,32位、64位均可),請自行安裝系統(tǒng)。 Hadoop版本 : Hadoop 2.7.4 創(chuàng)建hadoop用戶 如果你安裝 Ubuntu 的時候不是用的 \\\"hadoop\\\" 用戶,那么需要增加一個名為 hadoop 的用戶。 首先按 ctrl+alt+t 打開終端窗口,輸入如下命令創(chuàng)

    2023年04月08日
    瀏覽(39)
  • spark 基于物理機centos7環(huán)境搭建分布式集群

    非生產(chǎn)環(huán)境,就使用一個新一點的版本,提前先踩踩坑,版本的選型真是一個頭疼的問題,先看一下apache的官網(wǎng)的測試圖: 偽分布式看這里: 配置之前:若是用偽分布式時,在本機必須生成key-gen 與ssh-copy-id到本機,且hosts中必須加入127.0.0.1 ?本機名并關(guān)閉防火墻這幾步才可

    2024年02月03日
    瀏覽(26)
  • hadoop完全分布式集群搭建(超詳細)-大數(shù)據(jù)集群搭建

    hadoop完全分布式集群搭建(超詳細)-大數(shù)據(jù)集群搭建

    本次搭建完全分布式集群用到的環(huán)境有: jdk1.8.0 hadoop-2.7.7 本次搭建集群所需環(huán)境也給大家準備了,下載鏈接地址:https://share.weiyun.com/dk7WgaVk 密碼:553ubk 本次完全分布式集群搭建需要提前建立好三臺虛擬機,我分別把它們的主機名命名為:master,slave1,slave2 一.配置免密登陸 首先

    2024年02月10日
    瀏覽(29)
  • 大數(shù)據(jù)內(nèi)容分享(九):Hadoop-生產(chǎn)集群搭建(完全分布式)

    大數(shù)據(jù)內(nèi)容分享(九):Hadoop-生產(chǎn)集群搭建(完全分布式)

    目錄 Hadoop運行模式——完全分布式 1、準備3臺虛擬機(關(guān)閉防火墻、配置靜態(tài)IP 和 主機名稱) 2、安裝JDK 和 Hadoop 并配置JDK和Hadoop的環(huán)境變量 3、配置完全分布式集群 4、集群配置 1)集群部署規(guī)劃 2)配置文件說明 3)配置集群 5、集群啟動 與 測試 1)workers的配置 2)啟動集

    2024年02月21日
    瀏覽(24)
  • 大數(shù)據(jù)開發(fā)·關(guān)于虛擬機Hadoop完全分布式集群搭建教程

    大數(shù)據(jù)開發(fā)·關(guān)于虛擬機Hadoop完全分布式集群搭建教程

    官網(wǎng)鏈接 進入后網(wǎng)站如圖,各位按需下載 官網(wǎng)鏈接 進入頁面點擊下載 再根據(jù)我們需要下載的軟件進入下載頁面 點擊右側(cè)紅框內(nèi)的免費授權(quán)頁面獲取免費許可 進入后如圖,兩者我們都需要所以都勾選,填寫的郵箱用于接收下載鏈接,下載后進行安裝即可 這里先和大家強調(diào)一

    2024年02月07日
    瀏覽(32)
  • Hbase數(shù)據(jù)庫完全分布式搭建以及java中操作Hbase

    Hbase數(shù)據(jù)庫完全分布式搭建以及java中操作Hbase

    基礎(chǔ)的環(huán)境準備不在贅述,包括jdk安裝,防火墻關(guān)閉,網(wǎng)絡(luò)配置,環(huán)境變量的配置,各個節(jié)點之間進行免密等操作等。使用的版本2.0.5. 參考官方文檔 分布式的部署,都是在單節(jié)點服務(wù)的基礎(chǔ)配置好配置,直接分發(fā)到其他節(jié)點即可。 jdk路徑的配置,以及不適用內(nèi)部自帶的zk. 配

    2024年02月03日
    瀏覽(29)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包