国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

這篇具有很好參考價(jià)值的文章主要介紹了Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

1. 需求背景

1.1 大數(shù)據(jù)可視化面臨的挑戰(zhàn)

??大數(shù)據(jù)的興起,關(guān)于數(shù)據(jù)的存儲(chǔ)、計(jì)算技術(shù)層出不窮,但是最終的數(shù)據(jù)可視化呈現(xiàn),數(shù)據(jù)的探索,也成為頗為重要的一環(huán),這一塊并沒有像存儲(chǔ)、計(jì)算技術(shù)棧那么百花齊放,大家在做大數(shù)據(jù)可視化時(shí)是否也曾有這些困惑呢?

  1. 傳統(tǒng)的可視化對(duì)接傳統(tǒng)數(shù)據(jù)庫,對(duì)大數(shù)據(jù)組件的hive,spark,presto、elasticsearch、clickhouse等兼容性差,甚至不兼容,每次還需要多一道將大數(shù)據(jù)集群數(shù)據(jù)分發(fā)到傳統(tǒng)數(shù)據(jù)庫的冗余操作;
  2. 商用產(chǎn)品昂貴、甚至產(chǎn)品設(shè)置技術(shù)壁壘,很多甚至要求對(duì)接該商家的自己的大數(shù)據(jù)技術(shù)方可對(duì)接;
  3. 群眾基數(shù)大的Excel拖來拽習(xí)慣、SQL操作的方便性,排斥自成一派的新技術(shù),網(wǎng)頁版賬號(hào)登錄優(yōu)于用戶下載客戶端登錄;
  4. 公司開發(fā)人員配置緊張,沒有多余的人力自研大數(shù)據(jù)可視化平臺(tái),但是決策層希望有一個(gè)統(tǒng)一的可視化平臺(tái)。

??諸如此類,確實(shí)令人頭疼,現(xiàn)在就推薦一款解藥Apache Superser——開源的大數(shù)據(jù)分析探索、可視化報(bào)表的神器。

1.2 大數(shù)據(jù)數(shù)據(jù)可視化的目標(biāo)架構(gòu)

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖1.2 大數(shù)據(jù)數(shù)據(jù)可視化架構(gòu)

??做事還是需要立一個(gè)目標(biāo)架構(gòu),最后所有的事情都是圍繞目標(biāo)架構(gòu)展開,才能越做越輕松,如圖1.2,可是架構(gòu)分為三個(gè)梯隊(duì);

  1. 第一梯隊(duì):ClickHouse、DorisDB、Kylin等優(yōu)秀OLAP技術(shù)做存儲(chǔ),利用自帶的連接引擎,快速響應(yīng),同時(shí)支持實(shí)時(shí)數(shù)據(jù)和離線數(shù)據(jù)的接入,外接可視化平臺(tái),通過權(quán)限管控后呈現(xiàn)給用戶;
  2. 第二梯隊(duì):數(shù)據(jù)存在數(shù)據(jù)倉庫Hive內(nèi)或者NoSQL的Hbase,再通過較為優(yōu)秀且高效的引擎Presto、Flink、Spark等接入可視化平臺(tái),通過權(quán)限管控后呈現(xiàn)給用戶;
  3. 剩下就是一個(gè)特殊的,如MySQL,臨時(shí)文件等文件的接入;

??注意:常用的也還有其它技術(shù)架構(gòu),如ELK架構(gòu),ELK由ElasticSearch、Logstash和Kiabana三個(gè)開源工具組成。Elasticsearch是個(gè)開源分布式搜索引擎,它的特點(diǎn)有:分布式,零配置,自動(dòng)發(fā)現(xiàn),索引自動(dòng)分片,索引副本機(jī)制,restful風(fēng)格接口,多數(shù)據(jù)源,自動(dòng)搜索負(fù)載等。 Logstash是一個(gè)完全開源的工具,他可以對(duì)你的日志進(jìn)行收集、分析,并將其存儲(chǔ)供以后使用(如,搜索)。 kibana 也是一個(gè)開源和免費(fèi)的工具,他Kibana可以為 Logstash 和 ElasticSearch 提供的日志分析友好的 Web 界面,可以幫助您匯總、分析和搜索重要數(shù)據(jù)日志。這個(gè)后續(xù)再講,這里書歸正傳,先講講Apache Superser。

2. Apache Superset簡介

2.1 Apache Superset是什么?

??Apache Superset是一款由Python語言為主開發(fā)的開源時(shí)髦?jǐn)?shù)據(jù)探索分析以及可視化的報(bào)表平臺(tái);她支持豐富的數(shù)據(jù)源,且擁有多姿多彩的可視化圖表選擇。

  • 官網(wǎng) :https://superset.apache.org/
  • github :https://github.com/apache/superset
  • 國內(nèi)支持的鏡像站 :阿里云:http://mirrors.aliyun.com/pypi/simple/、豆瓣:https://pypi.douban.com/simple/ 等
  • 開發(fā)語言Python為主

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖2.1.1 Apache Superset定義

2.2 為什么選Apache Superset?

  1. 支持豐富的數(shù)據(jù)庫作為數(shù)據(jù)源,基本上平時(shí)用到的數(shù)據(jù)庫都支持;如圖2.2.0,支持的數(shù)據(jù)源有:
  • Amazon Athena
  • Amazon Redshift
  • Apache Drill
  • Apache Druid
  • Apache Hive
  • Apache Impala
  • Apache Kylin
  • Apache Pinot
  • Apache Solr
  • Apache Spark SQL
  • Ascend.io
  • Azure MS SQL
  • Big Query
  • ClickHouse
  • CockroachDB
  • Dremio
  • Elasticsearch
  • Exasol
  • Google Sheets
  • Hologres
  • IBM Db2
  • IBM Netezza Performance Server
  • MySQL
  • Oracle
  • PostgreSQL
  • Trino
  • Presto
  • SAP Hana
  • Snowflake
  • SQLite
  • SQL Server
  • Teradata
  • Vertica
    Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)
圖2.2.0 Apache Superset支持的數(shù)據(jù)源
  1. 多姿多彩的可視化圖表,Apache Superset擁有非常豐富的圖表,來實(shí)現(xiàn)不同的可視化需求,如圖2.2.1。
    Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)
圖2.2.1 Apache Superset支持的圖表
  1. 輕量級(jí)和高度可擴(kuò)展,利用現(xiàn)有數(shù)據(jù)基礎(chǔ)模型的直接進(jìn)行數(shù)據(jù)探索和可視化呈現(xiàn),而不需要另一個(gè)攝取層,如圖2.2.2,配置好數(shù)據(jù)庫后,進(jìn)入SQL Lab(SQL實(shí)驗(yàn)室),就可以對(duì)數(shù)據(jù)進(jìn)行探索分析,SQL Lab更像是一個(gè)數(shù)據(jù)庫連接查詢客戶端,當(dāng)然要更好的數(shù)據(jù)可視化呈現(xiàn),還必須結(jié)合圖表和儀表盤功能。
    Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

    圖2.2.2 Apache Superset的SQL Lab
  2. 使用簡單,如圖2.3.3,Apache Superset使用層面主要分為以下個(gè)部分;

  • Data:主要功能是新增數(shù)據(jù)源和數(shù)據(jù)集Dataset(舊版本也叫Table),Dataset作為數(shù)據(jù)圖表可視化的基礎(chǔ);
  • Charts:圖表,就是針對(duì)準(zhǔn)備好的Dataset數(shù)據(jù)集,選擇一款合適的圖表呈現(xiàn);
  • Dashboards:儀表盤,其實(shí)就是報(bào)表、看板大屏展示,可以將多個(gè)Charts組合到一個(gè)儀表盤內(nèi)一起展示。
  • SQL Lab:SQL實(shí)驗(yàn)室,其實(shí)就是一個(gè)類似DBeaver、Navicat、DataGrip等一樣的多功能數(shù)據(jù)庫連接客戶端,但是只有查詢功能,配置驅(qū)動(dòng)和連接后可以進(jìn)行數(shù)據(jù)庫、表、字段等模型的SQL查詢操作。
  • 設(shè)置:語言選擇,登錄注銷、人員權(quán)限,操作日志等設(shè)置;

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖2.2.3 Apache Superset使用預(yù)覽

2.3 對(duì)比Metabase

??之前博主也寫過一篇關(guān)于Metabase的大數(shù)據(jù)可視化神器Metabase——開源的大數(shù)據(jù)分析探索、可視化報(bào)表神器的博客,那么對(duì)于與Metabase,Apache Superset有哪些優(yōu)劣呢;

  • 天生自帶支持的數(shù)據(jù)源Apache Superset完勝M(fèi)etabase;
  • 數(shù)據(jù)圖表形式Apache Superset完勝M(fèi)etabase;
  • 操作界面美觀絲滑度Apache Superset稍遜Metabase;
  • 托拉拽操作Apache Superset稍遜Metabase;

??向來博主都是魚與熊掌能兼得就兼得,畢竟小孩才做選擇嘛,可以考慮兩個(gè)都裝,Metabase用于專注業(yè)務(wù)數(shù)據(jù)需求人員,Apache Superset用于懂SQL的數(shù)據(jù)需求人員,二者生成的通用儀表盤,則可以利用一個(gè)統(tǒng)一的網(wǎng)頁超鏈接到一起,形成一個(gè)統(tǒng)一的報(bào)表平臺(tái)。

3. 快速上手

??這里先快速上手帶大家體驗(yàn)一把,細(xì)節(jié)后續(xù)章節(jié)細(xì)講,首先配置好數(shù)據(jù)庫連接(配置方法參考后續(xù)的5.1 新建Databases(數(shù)據(jù)庫)),然后打開SQL Lab,選擇好配置數(shù)據(jù)庫,寫SQL語句分析探索數(shù)據(jù),如圖3.1.0,然后運(yùn)行語句,得到數(shù)據(jù)結(jié)果,可以點(diǎn)擊保存將常用的探索SQL保存下來,然后點(diǎn)擊查詢結(jié)果上方的EXPLORE按鈕,就可以跳轉(zhuǎn)圖表分析圖3.1.1;
Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖3.1.0 Apache Superset在SQL Lab上探索數(shù)據(jù)

??利用SQL Lab探索得到的數(shù)據(jù)集,選擇合適需求的數(shù)據(jù)圖表,選擇合適的指標(biāo),度量值,點(diǎn)擊上方的RUN就可以得到結(jié)果,非常的方便,可以直接點(diǎn)擊上方的SAVE保存圖表;
Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖3.1.1 Apache Superset數(shù)據(jù)可視化

??新建Dashboard,然后編輯Dashboard,將之前生成好的Charts(圖表)拖拽到Dashboard,就完成了數(shù)據(jù)儀表盤的最終呈現(xiàn),然后就可以分享給需求方,也可以生成訪問鏈接分享。

??注意:拖拽時(shí)盡量往Dashboard的上面拖拽,會(huì)出現(xiàn)一條藍(lán)色的分界線就可以松手,否則可能出現(xiàn)無法拖拽的情況,這個(gè)設(shè)計(jì)很坑。

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖3.1.1 Apache Superset數(shù)據(jù)儀表盤呈現(xiàn)

4. 部署安裝

4.1 部署方式及版本

  • 支持Linux、Windows、Mac的Docker部署
  • 支持Linux、Windows、Mac的Python環(huán)境代碼部署
  • 可以在github,官網(wǎng)、或者國內(nèi)鏡像網(wǎng)站查看版本,但是別先下載,因?yàn)锳pache Superset依賴包很多,最好能在線安裝;
    Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)
圖4.1.0 Apache Superset版本預(yù)覽
  • 博主選的是apache-superset-0.38.1.tar.gz在Linux上的Python環(huán)境代碼部署。

4.2 配置需求

  • apache-superset-0.38.1.tar.gz
  • CentOS 7 16核 32G(非硬性,一般性能的服務(wù)器即可)
  • Python 3.6
  • 要求服務(wù)器網(wǎng),如果沒有,可以使用能聯(lián)網(wǎng)的代理服務(wù)器,依賴很多,采用在線安裝的形式

4.3 下載安裝

  1. 下載安裝Python3.6,可以選擇安裝anaconda集成的python,可以參考博客Linux通過anaconda來安裝python,對(duì)應(yīng)的版本是Anaconda3-5.2.0-Linux-x86_64.sh,下載傳送門:Anaconda Download;安裝好以后,如果老的服務(wù)器上存在python2,默認(rèn)的環(huán)境變量啟動(dòng)是python2,沒關(guān)系,只需要設(shè)置一個(gè)新的環(huán)境變量確保 python3啟動(dòng)是剛剛安裝的版本即可。

  2. 安裝python虛擬機(jī),并啟動(dòng),然后安裝Apache Superset。

# 切換到自己安裝軟件的目錄,博主的是在/usr/local/tools,并新建superset目錄
cd /usr/local/tools
mkdir superset
cd superset

# 安裝虛擬機(jī),有網(wǎng)就不需要的代理服務(wù)器,配置代理服務(wù)器10.212.18.34:3129方法:
# 寫入配置文件 /etc/profile里面追加
# export http_proxy=10.212.18.34:3129
# export https_proxy=10.212.18.34:3129
# 然后wq! 保存退出,source /etc/profile刷新配置文件
# 安裝完可以刪除代理,記得再source /etc/profile
# 如果不想配置/etc/profile或者無權(quán)限,可以采用以下命令
# pip install virtualenv --proxy=10.212.18.34:3129,每次都需要,煩
pip install virtualenv

# 配置命名虛擬機(jī)
python3 -m venv venv

# 啟動(dòng)虛擬機(jī),會(huì)在當(dāng)前目錄下自動(dòng)創(chuàng)建venv目錄
. venv/bin/activate

# 退出虛擬機(jī)指令,但是這里不需要退出
# 退出虛擬機(jī)指令,但是這里不需要退出
# 退出虛擬機(jī)指令,但是這里不需要退出
deactivate

# 安裝更新一些依賴
pip install --upgrade setuptools pip -i https://pypi.douban.com/simple/

yum install gcc gcc-c++ libffi-devel python-devel python-pip python-wheel openssl-devel libsasl2-devel openldap-devel mysql-devel gcc-devel

# 如果報(bào)錯(cuò):GPG key retrieval failed: [Errno 14] curl#37 - "Couldn't open file /etc/pki/rpm-gpg/RPM-GPG-KEY-EPEL-7"
# 解決:
vi /etc/yum.repos.d/epel.repo
gpgcheck=0
# 然后wq!保存再試一次yum install gcc gcc-c++ libffi-devel python-devel python-pip python-wheel openssl-devel libsasl2-devel openldap-devel mysql-devel gcc-devel

# 先用官網(wǎng)下載,因?yàn)楣倬W(wǎng)的會(huì)自動(dòng)把依賴也給你一起安裝了,實(shí)在不行再用其他網(wǎng)站的鏡像
pip install apache-superset==1.4.2

# 安裝superset,指定版本,不指定版本默認(rèn)是最新版本
pip install superset==0.30.1 -i https://pypi.douban.com/simple

# 安裝email_validator 
pip3 install email_validator -i https://pypi.douban.com/simple/

# 更新數(shù)據(jù)庫
superset db upgrade

# 創(chuàng)建admin的用戶名,用戶名隨便寫,bigdata123,admin都行,寫完用戶名后會(huì)讓你輸入姓,名,郵箱,這三項(xiàng)可寫可不寫,不寫就直接回車,然后是設(shè)置密碼,一點(diǎn)要寫。
export FLASK_APP=superset
superset fab create-admin

# 加載樣例數(shù)據(jù),考驗(yàn)網(wǎng)絡(luò),如果實(shí)在一致加載報(bào)錯(cuò)就放棄,不影響后續(xù)使用。
superset load_examples

# 初始化
superset init

# 啟動(dòng),官網(wǎng)是superset run -p 8088 --with-threads --reload --debugger
# 建議用gunicorn啟動(dòng),方便快速,先直接啟動(dòng),確保打印在客戶端的日志正常
pip install gunicorn
gunicorn -w 5 --timeout 120 -b  10.218.10.290:9089 "superset.app:create_app()" 

# gunicorn 是一個(gè)Python WEB服務(wù),可以理解為Tomcat
# -w WORKERS:指定線程數(shù)
# --timeout:worker進(jìn)程超時(shí)時(shí)間,超過會(huì)自動(dòng)重啟
# -b BIND:綁定Superset訪問地址
# --daemon:后臺(tái)運(yùn)行

# 在能訪問10.218.10.290:9089的服務(wù)器上打開瀏覽器,輸入剛剛登錄的用戶名,密碼即可。


# 如果沒開啟后臺(tái)停止,直接ctrl+c關(guān)停
# 后臺(tái)進(jìn)程停止gunicorn
ps -ef | awk '/gunicorn/ && !/awk/{print $2}' | xargs kill -9


4.3 安裝注意及排錯(cuò)

??pip install superset步驟時(shí)出現(xiàn)關(guān)鍵字眼Successfully installed證明正確安裝,如圖4.3.0;
Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖4.3.0 成功安裝的提示

??superset fab create-admin配置用戶名時(shí)提示如圖4.3.1。

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖4.3.1 配置用戶名時(shí)提示

??每個(gè)人的服務(wù)器環(huán)境,可能導(dǎo)致缺少的 依賴不同,途中如果遇到bug,可自己百度解決,基本都是python依賴包之類的問題,要耐心。

# 報(bào)錯(cuò)
ModuleNotFoundError: No module named 'dataclasses'

# 解決
 pip install dataclasses

# 報(bào)錯(cuò)
 No PIL installation found
# 解決
pip install pillow

??一切解決后,網(wǎng)頁登錄如圖4.3.2;

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖4.3.2 登錄首頁

4.4 啟動(dòng)與關(guān)閉

??官網(wǎng)提供的直接啟動(dòng)的方法不是很好,博主推薦一個(gè)采用gunicorn的方法,先關(guān)停superset


#安裝好superset后會(huì)在venv生成很多文件,切換到venv
cd /usr/local/tools/superset/venv/



#新建日志文件夾
mkdir log

#切換到log目錄,新權(quán)限 日志,錯(cuò)誤日志和啟動(dòng)pid文件
cd log
touch gunicorn_access.log
touch gunicorn_error.log
touch pidfile
chmod 755 ./*  #修改權(quán)限

#切換到/usr/local/tools/superset/venv/bin,寫一個(gè)gunicorn配置文件,python語言
cd ./usr/local/tools/superset/venv/bin


vim gunicorn_config.py  # 內(nèi)容如下

#內(nèi)容開始
import multiprocessing


bind = '10.218.10.290:9089'      #綁定ip和端口號(hào)
backlog = 512                #監(jiān)聽隊(duì)列
timeout = 30   #超時(shí)
worker_class = 'gevent'
workers = 5
worker_connections = 1000
threads = 2 #指定每個(gè)進(jìn)程開啟的線程數(shù)
loglevel = 'info'  # 日志級(jí)別
access_log_format = '%(t)s %(p)s %(h)s "%(r)s" %(s)s %(L)s %(b)s %(f)s" "%(a)s"'    #設(shè)置gunicorn訪問日志格式,錯(cuò)誤日志無法設(shè)置



pidfile = '/usr/local/tools/superset/venv/log/pidfile'
errorlog = '/usr/local/tools/superset/venv/log/gunicorn_error.log'
accesslog = '/usr/local/tools/superset/venv/log/gunicorn_access.log'

print("IP and PORT:"+bind)
print("pid_file:"+pidfile)
print("error_log:"+errorlog)
print("access_log:"+accesslog)

#內(nèi)容結(jié)束

#然后 wq! 保存退出

# gunicorn 啟動(dòng) -c 配置文件啟動(dòng);--daemon后臺(tái)啟動(dòng),日志可以去配置文件指定的路徑查看
gunicorn -c ./gunicorn_config.py "superset.app:create_app()" --daemon

# 后臺(tái)進(jìn)程查看
ps -ef | grep gunicorn

# 或者通過端口查看
netstata -tunlp | grep 9089
# 或
ss -anp | grep 9089

# 如果沒開啟后臺(tái)停止,直接ctrl+c關(guān)停
# 后臺(tái)進(jìn)程停止gunicorn
ps -ef | awk '/gunicorn/ && !/awk/{print $2}' | xargs kill -9

5. 用戶手冊(cè)(重點(diǎn))

5.1 新建Databases(數(shù)據(jù)庫)

??新建數(shù)據(jù)庫之前,需要先安裝該數(shù)據(jù)庫的python驅(qū)動(dòng)包,具體語句可以參考官網(wǎng)Database Drivers,如圖5.1.0,一般就是pip install XXX,安裝好驅(qū)動(dòng)后,記得重啟下Superset服務(wù);

??新建數(shù)據(jù)庫連接的作用是為數(shù)據(jù)集Datasets和SQL實(shí)驗(yàn)室SQL Lab提供數(shù)據(jù)庫、表的選擇,就是提供數(shù)據(jù)源,當(dāng)然Data下還有個(gè)Upload CSV(最新版本也支持Upload Excel)也可以直接將本地的CSV文件作為數(shù)據(jù)源上傳到Superset站點(diǎn),直接進(jìn)行數(shù)據(jù)探索分析。

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖5.1.0 數(shù)據(jù)庫驅(qū)動(dòng)以及連接字符串

??登錄進(jìn)Apache Superset后,點(diǎn)擊Data,下來選擇Databases,然后跳轉(zhuǎn)到圖圖5.1.1,點(diǎn)擊右上側(cè)的+號(hào)就可以跳轉(zhuǎn)圖5.1.2的數(shù)據(jù)新增配置界面。

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖5.1.1 新建數(shù)據(jù)庫連接

??圖5.1.2,Database是指的新建這個(gè)數(shù)據(jù)庫的顯示名稱,這個(gè)隨便取,合理即可,SQLAlchemy URI 這個(gè)地方就是之前圖5.1.0上的數(shù)據(jù)庫連接字符串,確保和你選擇的數(shù)據(jù)庫類型一致。
然后點(diǎn)擊TEST CONECTION,連接成功后會(huì)跳出Seems OK!的彈出框,記得滑到最下面,點(diǎn)擊保存,如果連接不成功,請(qǐng)檢查數(shù)據(jù)庫的實(shí)例,端口,用戶名,密碼以及自己部署的Apache Superset的服務(wù)器訪問數(shù)據(jù)庫的端口網(wǎng)絡(luò)時(shí)是否能通,當(dāng)然也不要忘記SQLAlchemy URI 填寫規(guī)范,保存后的數(shù)據(jù)庫連接就會(huì)列舉在圖5.1.1上。
Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖5.1.2 新建數(shù)據(jù)庫連接配置信息

5.2 新建Datasets(數(shù)據(jù)集,老版本也叫Tables)

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖5.2.0 新建數(shù)據(jù)集

??如圖5.2.0,點(diǎn)擊圖中的Data下的Datasets,然后點(diǎn)擊+號(hào),跳轉(zhuǎn)到圖5.2.1,將配置好的數(shù)據(jù)庫名下拉選出,寫一個(gè)該連接實(shí)例下的數(shù)據(jù)庫,然后選擇一張表,點(diǎn)擊保存即可,保存好的數(shù)據(jù)集會(huì)列舉在圖5.2.0中,這些知道為啥老板叫Tabels了吧;
??數(shù)據(jù)集的作用是為后續(xù)的Charts(圖表)數(shù)據(jù)可視化作為數(shù)據(jù)源頭。

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖5.2.1 新建數(shù)據(jù)集配置信息

5.3 SQL Lab(SQL實(shí)驗(yàn)室)

??SQL Lab其實(shí)就是一個(gè)數(shù)據(jù)庫查詢客戶端,利用SQL語句對(duì)數(shù)據(jù)庫的表,字段模型進(jìn)行查詢探索,同時(shí)支持智能補(bǔ)全,當(dāng)然SQL Lab的查詢結(jié)果也可以直接EXPLORECharts(圖表),作為數(shù)據(jù)可視化的數(shù)據(jù)源。
??如圖5.3.0,SQL Lab有三個(gè)選項(xiàng),三個(gè)選項(xiàng)的功能如下:

  • SQL Editor:進(jìn)行SQL查詢探索
  • Saved Queries:保存的通用查詢SQL
  • Query Search:查詢的歷史記錄

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖5.3.0 主界面進(jìn)入SQL Lab

??點(diǎn)擊SQL Editor進(jìn)入圖5.3.1的SQL查詢探索,左側(cè)上方是配置好的數(shù)據(jù)庫連接名和選擇的數(shù)據(jù)庫,左側(cè)下方是將要用到的表及字段模型;右側(cè)上方是寫SQL語句的地方,支持RUN(查詢),RUN SELECTION(查詢鼠標(biāo)選擇局部語句)SAVE(保存),SHARE(分享)等,右下方是數(shù)據(jù)結(jié)果,支持EXPLORECharts(圖表)可視化,.CSV下載,CLIPBOARD(復(fù)制到剪貼板)。

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖5.3.1 SQL Lab使用

5.4 創(chuàng)建Charts(圖表)

??圖表的作用是數(shù)據(jù)可視化,利不同的圖表滿足不同的業(yè)務(wù)需求,圖表同時(shí)也作為儀表盤的展示的一部分,一個(gè)儀表盤內(nèi)可以展示一個(gè)或多個(gè)圖表。
??創(chuàng)建圖表的方式有兩種:

  • 如圖5.4.0,點(diǎn)擊Charts,點(diǎn)擊+創(chuàng)建新的圖表,跳轉(zhuǎn)圖5.4.1
  • SQL LabSQL語句探索查詢的結(jié)果直接EXPLORECharts(圖表)可視化

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖5.4.0 創(chuàng)建圖表

??如圖5.4.1,選擇合適需求的數(shù)據(jù)圖表(如圖5.4.2,支持的圖表類型非常豐富,號(hào)稱最漂亮的可視化圖表展示),選擇合適的指標(biāo),度量值,點(diǎn)擊上方的RUN就可以得到結(jié)果,非常的方便,可以直接點(diǎn)擊上方的SAVE保存圖表;
Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖5.4.1 圖表可視化配置

??號(hào)稱最美可視化展示,支持可視化的圖表類型確實(shí)豐富多彩,應(yīng)對(duì)各種可視化需求。
Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖5.4.2 支持的圖表類型

5.5 創(chuàng)建Dashboards(儀表盤)

??儀表盤就是最后的數(shù)據(jù)總體呈現(xiàn),即報(bào)表展示。

??如圖5.5.0,點(diǎn)擊Dashboards,然后點(diǎn)擊+新建儀表盤,跳轉(zhuǎn)圖5.5.1。

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖5.5.0 創(chuàng)建儀表盤

??點(diǎn)擊圖5.5.1右上角的編輯儀表盤,之前做好的Charts(圖表)拖拽到儀表盤上,注意:第一次拖拽的時(shí)候盡量網(wǎng)上拖拽,知道出現(xiàn)這個(gè)條藍(lán)色的分解線,否則 無法拖拽過去

??同時(shí)也支持一些通用的組件,圖表旁的Components下,有Header、Tabs、Row、Column、Markdown、Divider;
??編輯完后后記得點(diǎn)保存。

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖5.5.1 編輯儀表盤

??保存后的儀表盤支持分享,下載等功能,同時(shí)也會(huì)根據(jù)圖表內(nèi)的數(shù)據(jù)源刷新來獲取新的數(shù)據(jù);
Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖5.5.2 儀表盤功能

??分享給別人看到的儀表盤如圖5.5.3。

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖5.5.3 分享后他人視角的儀表盤

6. 設(shè)置

??設(shè)置包含在菜單欄Settings下,主要設(shè)計(jì)權(quán)限和操作日志等模塊,接下來分別講解。
Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖6.0.0 通用設(shè)置

6.1 角色列表及權(quán)限

??Apache Superset中的安全性由Flask AppBuilder(FAB)處理,F(xiàn)AB是一個(gè)構(gòu)建在Flask之上的應(yīng)用程序開發(fā)框架。FAB提供身份驗(yàn)證、用戶管理、權(quán)限和角色,可以查看其相關(guān)文檔。
??Apache Superset默認(rèn)提供了不同的角色,每種角色擁有的權(quán)限不同,在運(yùn)行superset init命令時(shí),與每個(gè)角色關(guān)聯(lián)的權(quán)限將重新同步到其原始值,不建議更改與每個(gè)角色關(guān)聯(lián)的權(quán)限(例如,通過刪除或添加權(quán)限),支持admin再自建角色類型,指定想要的權(quán)限,默認(rèn)的角色及權(quán)限如下;

  • Admin:管理員擁有所有可能的權(quán)限,包括授予或撤銷其他用戶的權(quán)限,以及更改其他用戶的切片和儀表板;

  • Alpha:Alpha用戶可以訪問所有數(shù)據(jù)源,但不能授予或撤消其他用戶的訪問權(quán)限。它們也僅限于改變它們所擁有的對(duì)象。Alpha用戶可以添加和更改數(shù)據(jù)源。

  • Gamma:Gamma用戶的訪問權(quán)限有限。他們只能使用來自通過另一個(gè)補(bǔ)充角色訪問的數(shù)據(jù)源的數(shù)據(jù)。他們只能查看由他們可以訪問的數(shù)據(jù)源制作的切片和儀表板。目前Gamma用戶無法更改或添加數(shù)據(jù)源。我們假設(shè)他們主要是內(nèi)容消費(fèi)者,盡管他們可以創(chuàng)建切片和儀表盤。另請(qǐng)注意,當(dāng)Gamma用戶查看儀表板和切片列表視圖時(shí),他們將只看到他們有權(quán)訪問的對(duì)象。

  • sql_lab:sql_lab角色授予對(duì)sql lab的訪問權(quán)限。請(qǐng)注意,雖然管理員用戶在默認(rèn)情況下可以訪問所有數(shù)據(jù)庫,但Alpha和Gamma用戶都需要在每個(gè)數(shù)據(jù)庫的基礎(chǔ)上獲得訪問權(quán)限。

  • public:要允許注銷的用戶訪問某些超集功能,需要自己配置權(quán)限,并將其分配給另一個(gè)角色,您希望將其權(quán)限傳遞給該角色。

??更多的角色權(quán)限可以查看官網(wǎng)Apache Superset Security,或者點(diǎn)開圖6.1.0的編輯角色查看,盡量別改默認(rèn)角色的權(quán)限。
Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖6.1.0 系統(tǒng)默認(rèn)角色

??同時(shí)Apache Superset也支持管理員自己新增角色,如圖6.1.1,新建角色并指定角色權(quán)限。
Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖6.1.1 新建角色

6.2 用戶列表

??新建、編輯用戶指定角色,用戶的權(quán)限是綁定在角色里面的,一個(gè)用戶可以有多個(gè)角色,配置信息如圖6.2.0。
Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖6.2.0 新建、編輯角色

6.3 操作日志

??操作日志記錄的是在你的Superset平臺(tái)上不同用戶的行為日志,如圖6.3.0。

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖6.3.0 行為日志查看

6.4 用戶信息、退出、版本信息

??菜單欄最右側(cè)的個(gè)人信息,主要是包含:

  • 用戶信息:修改用戶姓名,重置密碼;
  • 退出:回到登錄主界面;
  • 版本:目前您安裝的Superset版本信息。
    Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)
圖6.4.0 個(gè)人信息模塊

6.5 語言選擇

??作為Apache的頂級(jí)項(xiàng)目,自然是運(yùn)用于全球的,支持世界上一些通用的語言 ,選擇一款你最喜歡的即可。

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖6.5.0 語言選擇

6.6 管理設(shè)置

??針對(duì)儀表盤,圖表渲染加入自己想要的風(fēng)格和模板,實(shí)際運(yùn)用的用的不多。
Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖6.6.0 管理模塊

6.7 + NEW

??菜單欄的+ NEW其實(shí)就是給最通用的三個(gè)模塊SQL Query、圖表、看板(儀表盤)的一個(gè)快捷方式,此三者的用法就不在累贅了。

Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)

圖6.7.0 + NEW模塊

??以上就是關(guān)于Apache Superset這款開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)的基本介紹,更多更加刺激的內(nèi)容可以關(guān)注官網(wǎng)及官方文檔Apache Superset Documention。文章來源地址http://www.zghlxwxcb.cn/news/detail-442277.html

到了這里,關(guān)于Apache Superset——開源的大數(shù)據(jù)探索分析、可視化報(bào)表平臺(tái)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 基于招聘網(wǎng)站的大數(shù)據(jù)專業(yè)相關(guān)招聘信息建模與可視化分析

    基于招聘網(wǎng)站的大數(shù)據(jù)專業(yè)相關(guān)招聘信息建模與可視化分析

    需要本項(xiàng)目的可以私信博主?。?! 在大數(shù)據(jù)時(shí)代背景下,數(shù)據(jù)積累導(dǎo)致大數(shù)據(jù)行業(yè)的人才需求快速上升,大量的招聘信息被發(fā)布在招聘平臺(tái)上。深入研究這些信息能幫助相關(guān)人士更好地理解行業(yè)動(dòng)態(tài),并對(duì)其未來發(fā)展進(jìn)行預(yù)測(cè)。本文主要通過分析51job網(wǎng)站上的大數(shù)據(jù)職位招聘

    2024年02月09日
    瀏覽(24)
  • 探索在云原生環(huán)境中構(gòu)建的大數(shù)據(jù)驅(qū)動(dòng)的智能應(yīng)用程序的成功案例,并分析它們的關(guān)鍵要素。

    探索在云原生環(huán)境中構(gòu)建的大數(shù)據(jù)驅(qū)動(dòng)的智能應(yīng)用程序的成功案例,并分析它們的關(guān)鍵要素。

    ??個(gè)人主頁:程序員 小侯 ??CSDN新晉作者 ??歡迎 ??點(diǎn)贊?評(píng)論?收藏 ?收錄專欄:云計(jì)算 ?文章內(nèi)容:云原生 ??希望作者的文章能對(duì)你有所幫助,有不足的地方請(qǐng)?jiān)谠u(píng)論區(qū)留言指正,大家一起學(xué)習(xí)交流!?? 在云原生環(huán)境中構(gòu)建大數(shù)據(jù)驅(qū)動(dòng)的智能應(yīng)用程序已經(jīng)成為許多

    2024年02月10日
    瀏覽(30)
  • 探索無限可能:APITable免費(fèi)開源多維表格與可視化數(shù)據(jù)庫遠(yuǎn)程訪問的魅力

    探索無限可能:APITable免費(fèi)開源多維表格與可視化數(shù)據(jù)庫遠(yuǎn)程訪問的魅力

    vika維格表作為新一代數(shù)據(jù)生產(chǎn)力平臺(tái),是一款面向 API 的智能多維表格。它將復(fù)雜的可視化數(shù)據(jù)庫、電子表格、實(shí)時(shí)在線協(xié)同、低代碼開發(fā)技術(shù)四合為一,就連一行代碼都不懂的普通職員都能輕松上手獲得 IT 能力,從而極大降低企業(yè)數(shù)字化成本。如果你正在尋找快捷可定制的

    2024年02月06日
    瀏覽(26)
  • 數(shù)據(jù)分析:麥當(dāng)勞食品營養(yǎng)數(shù)據(jù)探索并可視化

    數(shù)據(jù)分析:麥當(dāng)勞食品營養(yǎng)數(shù)據(jù)探索并可視化

    作者:i阿極 作者簡介:Python領(lǐng)域新星作者、多項(xiàng)比賽獲獎(jiǎng)?wù)撸翰┲鱾€(gè)人首頁 ??????如果覺得文章不錯(cuò)或能幫助到你學(xué)習(xí),可以點(diǎn)贊??收藏??評(píng)論??+關(guān)注哦!?????? ??????如果有小伙伴需要數(shù)據(jù)集和學(xué)習(xí)交流,文章下方有交流學(xué)習(xí)區(qū)!一起學(xué)習(xí)進(jìn)步!?? 專欄案例:

    2023年04月10日
    瀏覽(27)
  • 開源項(xiàng)目-數(shù)據(jù)可視化分析平臺(tái)

    開源項(xiàng)目-數(shù)據(jù)可視化分析平臺(tái)

    哈嘍,大家好,今天給大家?guī)硪粋€(gè)開源項(xiàng)目-數(shù)據(jù)可視化分析平臺(tái)。項(xiàng)目通過SpringBoot實(shí)現(xiàn) 數(shù)據(jù)可視化分析平臺(tái)主要有數(shù)據(jù)源管理,項(xiàng)目管理,數(shù)據(jù)集管理,圖表管理,看板管理等功能 數(shù)據(jù)源管理功能可以添加MySQL,Oracle,PostgreSQL等類型的數(shù)據(jù)源信息 項(xiàng)目管理可以對(duì)項(xiàng)目名

    2024年02月10日
    瀏覽(31)
  • 如何使用Docker部署Apache+Superset數(shù)據(jù)平臺(tái)并遠(yuǎn)程訪問?

    Superset是一款由中國知名科技公司開源的“現(xiàn)代化的企業(yè)級(jí)BI(商業(yè)智能)Web應(yīng)用程序”,其通過創(chuàng)建和分享dashboard,為數(shù)據(jù)分析提供了輕量級(jí)的數(shù)據(jù)查詢和可視化方案。Superset在數(shù)據(jù)處理和可視化方面具有強(qiáng)大的功能,能夠滿足企業(yè)級(jí)的數(shù)據(jù)分析需求,并為用戶提供直觀、靈

    2024年02月04日
    瀏覽(17)
  • 【大數(shù)據(jù)】可視化儀表板 - Superset的安裝和使用

    【大數(shù)據(jù)】可視化儀表板 - Superset的安裝和使用

    寫在前面:博主是一只經(jīng)過實(shí)戰(zhàn)開發(fā)歷練后投身培訓(xùn)事業(yè)的“小山豬”,昵稱取自動(dòng)畫片《獅子王》中的“彭彭”,總是以樂觀、積極的心態(tài)對(duì)待周邊的事物。本人的技術(shù)路線從Java全棧工程師一路奔向大數(shù)據(jù)開發(fā)、數(shù)據(jù)挖掘領(lǐng)域,如今終有小成,愿將昔日所獲與大家交流一二

    2024年02月03日
    瀏覽(31)
  • 人人可用的開源數(shù)據(jù)可視化分析工具

    DataEase 人人可用的開源數(shù)據(jù)可視化分析工具。 DataEase 是開源的數(shù)據(jù)可視化分析工具,幫助用戶快速分析數(shù)據(jù)并洞察業(yè)務(wù)趨勢(shì),從而實(shí)現(xiàn)業(yè)務(wù)的改進(jìn)與優(yōu)化。DataEase 支持豐富的數(shù)據(jù)源連接,能夠通過拖拉拽方式快速制作圖表,并可以方便的與他人分享。 DataEase 的功能包括: 圖

    2024年02月10日
    瀏覽(24)
  • 畢設(shè)開源 大數(shù)據(jù)電影數(shù)據(jù)分析與可視化系統(tǒng)

    畢設(shè)開源 大數(shù)據(jù)電影數(shù)據(jù)分析與可視化系統(tǒng)

    今天學(xué)長向大家介紹一個(gè)機(jī)器視覺的畢設(shè)項(xiàng)目 ??基于大數(shù)據(jù)的電影數(shù)據(jù)分析與可視化系統(tǒng) 項(xiàng)目運(yùn)行效果(視頻): 畢業(yè)設(shè)計(jì) 大數(shù)據(jù)電影評(píng)論情感分析 項(xiàng)目獲?。?https://gitee.com/assistant-a/project-sharing 研究中國用戶電影數(shù)據(jù),有助于窺探中國電影市場發(fā)展背后的規(guī)律,理解其來龍去

    2024年03月18日
    瀏覽(23)
  • Linux系統(tǒng)Docker部署Apache Superset并實(shí)現(xiàn)公網(wǎng)實(shí)時(shí)訪問本地?cái)?shù)據(jù)

    Linux系統(tǒng)Docker部署Apache Superset并實(shí)現(xiàn)公網(wǎng)實(shí)時(shí)訪問本地?cái)?shù)據(jù)

    Superset是一款由中國知名科技公司開源的“現(xiàn)代化的企業(yè)級(jí)BI(商業(yè)智能)Web應(yīng)用程序”,其通過創(chuàng)建和分享dashboard,為數(shù)據(jù)分析提供了輕量級(jí)的數(shù)據(jù)查詢和可視化方案。Superset在數(shù)據(jù)處理和可視化方面具有強(qiáng)大的功能,能夠滿足企業(yè)級(jí)的數(shù)據(jù)分析需求,并為用戶提供直觀、靈

    2024年04月09日
    瀏覽(25)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包