国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

助力工業(yè)物聯(lián)網(wǎng),工業(yè)大數(shù)據(jù)之?dāng)?shù)倉(cāng)維度層DWS層構(gòu)建【十二】

這篇具有很好參考價(jià)值的文章主要介紹了助力工業(yè)物聯(lián)網(wǎng),工業(yè)大數(shù)據(jù)之?dāng)?shù)倉(cāng)維度層DWS層構(gòu)建【十二】。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

數(shù)倉(cāng)維度層DWS層構(gòu)建

01:項(xiàng)目回顧

  1. ODS層與DWD層的功能與區(qū)別是什么?

    • ODS:原始數(shù)據(jù)層
      • 存儲(chǔ)格式:AVRO
      • 數(shù)據(jù)內(nèi)容:基本與原始數(shù)據(jù)是一致的
    • DWD:明細(xì)數(shù)據(jù)層
      • 存儲(chǔ)格式:Orc
      • 數(shù)據(jù)內(nèi)容:基于與ODS層是一致的
  2. ODS層的需求是什么?

    • 自動(dòng)化建庫(kù)建表

    • 建表

      create table one_make_ods.表名
      tableproperties(schema文件)
      
      • 表名
      • 表的注釋
      • 表對(duì)應(yīng)的HDFS地址
      • Schema文件的地址
  3. DWD層的需求是什么?

    • 自動(dòng)化建庫(kù)建表

    • 建表

      create table one_make_dwd.表名(
      	字段信息
      )
      location
      
      • 表名
      • 表的注釋
      • 表對(duì)應(yīng)的HDFS地址
      • 字段信息
  4. 怎么獲取表的Schema信息?

    • 表的注釋、Schema信息
    • ODS:Oracle中獲取表的注釋、Schema文件從Sqoop生成的
    • DWD:Oracle中獲取表的信息
      • TableMeta:表名,表的注釋,列的信息:List
      • ColumnMeta:列名、列的注釋、列的類型、長(zhǎng)度、精度
  5. 如何使用Python構(gòu)建Oracle和Hive的連接?

    • Oracle:cx_Oracle
      • conn(host,port,user,passwd,sid)
    • Hive/SparkSQL:pyHive
      • SparkSQL用法
      • 編程方式:python文件 | jar包
        • 流程
          • step1:SparkSession
          • step2:讀取數(shù)據(jù)源
          • step3:處理
            • 注冊(cè)視圖
            • spark.sql(“”)
        • spark-submit
        • 優(yōu)點(diǎn):靈活
        • 場(chǎng)景:DSL
      • 提交SQL:ThriftServer
        • 場(chǎng)景:SQL,調(diào)度開發(fā)
        • 流程
          • JDBC | PyHive | Beeline:代碼中開發(fā)
          • spark-sql -f xxxx.sql:SQL文件的運(yùn)行
  6. 如果實(shí)現(xiàn)SQL語(yǔ)句的執(zhí)行?

    • step1: 先構(gòu)建服務(wù)端的遠(yuǎn)程連接

      • 服務(wù)端地址:主機(jī)名 + 端口
      • 用戶名和密碼
    • step2:基于這個(gè)連接構(gòu)建一個(gè)游標(biāo)

    • step3:通過游標(biāo)來執(zhí)行SQL語(yǔ)句:execute(String:SQL)

    • step4:釋放資源

  7. 集中問題

    • 連接構(gòu)建不上
      • 映射不對(duì):spark.bigdata.cn:Can not Connect[46.xxx.xxxx.xx,10001]
        • 修改host文件
        • 修改config.txt:node1
      • 服務(wù)端問題:spark.bigdata.cn:Can not Connect[192.168.88.100,10001]
        • Spark的TriftServer沒有啟動(dòng)
          • 啟動(dòng)完成先用dg或者beeline先測(cè)試一下
        • ThriftServer:依賴于MetaStore + YARN
          • 檢查YARN:本質(zhì)就是一個(gè)Spark程序:實(shí)時(shí)程序,不停止的
      • Oracle:cx_Oracle + 本地客戶端:D:\instantclient_12_2
    • 安裝
      • Python版本:Python 3.7.4
      • 命令sasl

02:項(xiàng)目目標(biāo)

  1. 回顧維度建模
    • 建模流程:劃分主題域和主題
    • 維度設(shè)計(jì):構(gòu)建維度矩陣
    • 維度模型:雪花模型、星型模式
  2. 項(xiàng)目中的建模流程和維度設(shè)計(jì)
    • 劃分了哪些主題域,每個(gè)主題域有哪些主題?
    • 每個(gè)主題基于哪些維度進(jìn)行分析?
  3. 維度層構(gòu)建
    • 時(shí)間維度
    • 地區(qū)維度
    • 油站維度
    • 服務(wù)網(wǎng)點(diǎn)維度
    • 組織機(jī)構(gòu)維度
    • 倉(cāng)庫(kù)維度
    • 物流維度

03:維度建模回顧:建模流程

  • 目標(biāo)掌握維度建模的建模流程

  • 實(shí)施

    • step1-需求調(diào)研:業(yè)務(wù)調(diào)研和數(shù)據(jù)調(diào)研

      • 了解整個(gè)業(yè)務(wù)實(shí)現(xiàn)的過程
      • 收集所有數(shù)據(jù)使用人員對(duì)于數(shù)據(jù)的需求
      • 整理所有數(shù)據(jù)來源
    • step2-劃分主題域:面向業(yè)務(wù)將業(yè)務(wù)劃分主題域及主題

      • 用戶域、店鋪域
      • 商品域、交易域、
      • 客服域、信用風(fēng)控域、采購(gòu)分銷域
    • step3-構(gòu)建維度總線矩陣:明確每個(gè)業(yè)務(wù)主題對(duì)應(yīng)的維度關(guān)系

    • step4-明確指標(biāo)統(tǒng)計(jì):明確所有原生指標(biāo)與衍生指標(biāo)

      • 原生指標(biāo):基于某一業(yè)務(wù)事件行為下的度量,是業(yè)務(wù)定義中不可再拆分的指標(biāo),如支付總金額

      • 衍生指標(biāo):基于原子指標(biāo)添加了維度:近7天的支付總金額等

    • step5-定義事實(shí)與維度規(guī)范

      • 命名規(guī)范、類型規(guī)范、設(shè)計(jì)規(guī)范等
    • step6-代碼開發(fā)

      • 實(shí)現(xiàn)具體的代碼開發(fā)

      • 只要知道指標(biāo)的計(jì)算方式,基于維度分組計(jì)算指標(biāo)

  • 小結(jié)文章來源地址http://www.zghlxwxcb.cn/news/detail-478100.html

    • 掌握維度建模的建模流程

04:維度建?;仡櫍壕S度設(shè)計(jì)

  • 目標(biāo)掌握維度建模中維度的設(shè)計(jì)

  • 實(shí)施

    • 功能:基于組合維度來更加細(xì)化我們的指標(biāo),來更加精確的發(fā)現(xiàn)問題
      • 指標(biāo)如果不基于組合維度進(jìn)行分析得到,指標(biāo)的結(jié)果是沒有意義的
    • 實(shí)現(xiàn):開發(fā)中維度就是指標(biāo)聚合時(shí)的分組字段
    • 特點(diǎn)
      • 數(shù)據(jù)量小
      • 很少發(fā)生變化
    • 采集方式:全量
    • 常見維度
      • 時(shí)間維度:年、季度、月、周、天、小時(shí)
      • 地區(qū)維度:國(guó)家、省份、城市
      • 平臺(tái)維度:網(wǎng)站、APP、小程序、H5
      • 操作系統(tǒng)維度:Windows、Mac OS、Android、Linux、IOS
      • ……
  • 小結(jié)

    • 掌握維度建模中維度的設(shè)計(jì)

05:維度建?;仡櫍壕S度模型

  • 目標(biāo)掌握維度設(shè)計(jì)的常用模型

  • 路徑

    • step1:雪花模型
    • step2:星型模型
    • step3:星座模型
  • 實(shí)施

    • 雪花模型

      • 設(shè)計(jì):部分維度通過其他維度間接關(guān)聯(lián)事實(shí)表
      • 優(yōu)點(diǎn):避免數(shù)據(jù)的冗余
      • 缺點(diǎn):關(guān)聯(lián)層次比較多,數(shù)據(jù)大的情況下,底層層層Join,查詢數(shù)據(jù)性能降低

      助力工業(yè)物聯(lián)網(wǎng),工業(yè)大數(shù)據(jù)之?dāng)?shù)倉(cāng)維度層DWS層構(gòu)建【十二】

    • 星型模型

      • 設(shè)計(jì):所有維度表直接關(guān)聯(lián)事實(shí)表
      • 優(yōu)點(diǎn):每次查詢時(shí)候,直接獲取對(duì)應(yīng)的數(shù)據(jù)結(jié)果,不用關(guān)聯(lián)其他的維度子表,可以提高性能
      • 缺點(diǎn):數(shù)據(jù)冗余度相比雪花模型較高

      助力工業(yè)物聯(lián)網(wǎng),工業(yè)大數(shù)據(jù)之?dāng)?shù)倉(cāng)維度層DWS層構(gòu)建【十二】

    • 星座模型

      • 星座模型:基于星型模型的演變,多個(gè)事實(shí)共同使用一個(gè)維度表

        助力工業(yè)物聯(lián)網(wǎng),工業(yè)大數(shù)據(jù)之?dāng)?shù)倉(cāng)維度層DWS層構(gòu)建【十二】

  • 小結(jié)

    • 掌握維度設(shè)計(jì)的常用模型

到了這里,關(guān)于助力工業(yè)物聯(lián)網(wǎng),工業(yè)大數(shù)據(jù)之?dāng)?shù)倉(cāng)維度層DWS層構(gòu)建【十二】的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • GaussDB(DWS)基于Flink的實(shí)時(shí)數(shù)倉(cāng)構(gòu)建

    本文分享自華為云社區(qū)《GaussDB(DWS)基于Flink的實(shí)時(shí)數(shù)倉(cāng)構(gòu)建》,作者:胡辣湯。 大數(shù)據(jù)時(shí)代,廠商對(duì)實(shí)時(shí)數(shù)據(jù)分析的訴求越來越強(qiáng)烈,數(shù)據(jù)分析時(shí)效從T+1時(shí)效趨向于T+0時(shí)效,為了給客戶提供極速分析查詢能力,華為云數(shù)倉(cāng)GaussDB(DWS)基于流處理框架Flink實(shí)現(xiàn)了實(shí)時(shí)數(shù)倉(cāng)構(gòu)建。在

    2024年04月22日
    瀏覽(37)
  • 數(shù)據(jù)倉(cāng)庫(kù)從0到1之?dāng)?shù)倉(cāng)建模理論

    數(shù)據(jù)倉(cāng)庫(kù)從0到1之?dāng)?shù)倉(cāng)建模理論

    從ODS層到ADS層,數(shù)據(jù)是越來越少的,數(shù)據(jù)分析都是以大量的數(shù)據(jù)為基礎(chǔ),對(duì)數(shù)據(jù)進(jìn)行匯總聚合運(yùn)算,抽絲剝繭,越往后數(shù)據(jù)的匯總層度越高,最后得到匯總的指標(biāo)。 數(shù)倉(cāng)分層原因 將復(fù)雜問題簡(jiǎn)化,將復(fù)雜的任務(wù)分解成多層來完成,每一層只處理簡(jiǎn)單的任務(wù),方便定位問題;

    2024年01月20日
    瀏覽(21)
  • 助力工業(yè)物聯(lián)網(wǎng),工業(yè)大數(shù)據(jù)之一站制造業(yè)務(wù)主題劃分【十三】

    助力工業(yè)物聯(lián)網(wǎng),工業(yè)大數(shù)據(jù)之一站制造業(yè)務(wù)主題劃分【十三】

    目標(biāo) : 掌握一站制造的主題域及主題的劃分 實(shí)施 來源 主題域劃分:業(yè)務(wù)或者部門劃分 業(yè)務(wù):客戶域、廣告域、運(yùn)營(yíng)域…… 部門:運(yùn)維域、財(cái)務(wù)域、銷售域…… 數(shù)據(jù)需求來劃分主題 運(yùn)營(yíng)域:訪問分析報(bào)表、轉(zhuǎn)化分析報(bào)表、用戶屬性分析報(bào)表、訂單分析報(bào)表 服務(wù)域 安裝主

    2024年02月10日
    瀏覽(57)
  • 助力工業(yè)物聯(lián)網(wǎng),工業(yè)大數(shù)據(jù)之ODS層及DWD層建表語(yǔ)法【七】

    助力工業(yè)物聯(lián)網(wǎng),工業(yè)大數(shù)據(jù)之ODS層及DWD層建表語(yǔ)法【七】

    一站制造項(xiàng)目的數(shù)倉(cāng)設(shè)計(jì)為幾層以及每一層的功能是什么? ODS:原始數(shù)據(jù)層:存放從Oracle中同步采集的所有原始數(shù)據(jù) DW:數(shù)據(jù)倉(cāng)庫(kù)層 DWD:明細(xì)數(shù)據(jù)層:存儲(chǔ)ODS層進(jìn)行ETL以后的數(shù)據(jù) DWB:輕度匯總層:對(duì)DWD層的數(shù)據(jù)進(jìn)行輕度聚合:關(guān)聯(lián)和聚合 基于每個(gè)主題構(gòu)建主題事務(wù)事實(shí)表

    2023年04月26日
    瀏覽(29)
  • 助力工業(yè)物聯(lián)網(wǎng),工業(yè)大數(shù)據(jù)之服務(wù)域:node_exporter插件【三十七】_node_expoter 電源(1)

    助力工業(yè)物聯(lián)網(wǎng),工業(yè)大數(shù)據(jù)之服務(wù)域:node_exporter插件【三十七】_node_expoter 電源(1)

    小結(jié) 實(shí)現(xiàn)node_exporter插件的安裝監(jiān)控Linux指標(biāo) 07:mysqld_exportor插件 目標(biāo) : 實(shí)現(xiàn)mysqld_exportor插件的安裝監(jiān)控MySQL指標(biāo) 實(shí)施 上傳安裝 配置MySQL用戶授權(quán) 注冊(cè)服務(wù) 啟動(dòng)服務(wù) 配置Prometheus 自我介紹一下,小編13年上海交大畢業(yè),曾經(jīng)在小公司待過,也去過華為、OPPO等大廠,18年進(jìn)入

    2024年04月15日
    瀏覽(25)
  • GaussDB(DWS)云原生數(shù)倉(cāng)技術(shù)解析:湖倉(cāng)一體,體驗(yàn)與大數(shù)據(jù)互聯(lián)互通

    GaussDB(DWS)云原生數(shù)倉(cāng)技術(shù)解析:湖倉(cāng)一體,體驗(yàn)與大數(shù)據(jù)互聯(lián)互通

    云計(jì)算時(shí)代,數(shù)倉(cāng)能為我們帶來哪些便利?GaussDB(DWS)即將發(fā)布的云原生數(shù)倉(cāng)如何構(gòu)筑新一代數(shù)據(jù)倉(cāng)庫(kù)的技術(shù)底座,在云原生數(shù)倉(cāng)的地基之上,數(shù)據(jù)時(shí)代的產(chǎn)業(yè)又將如何擴(kuò)張、拓展?在本文中我們將帶您解密華為云新一代云數(shù)倉(cāng) GaussDB(DWS) 3.0 的核心技術(shù)與劃時(shí)代意義。 聲

    2024年02月07日
    瀏覽(19)
  • 大數(shù)據(jù)數(shù)倉(cāng)建?;A(chǔ)理論【維度表、事實(shí)表、數(shù)倉(cāng)分層及示例】

    數(shù)據(jù)倉(cāng)庫(kù)建模(Data Warehouse Modeling)是指在數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse)中組織和設(shè)計(jì)數(shù)據(jù)的過程,以便支持?jǐn)?shù)據(jù)分析、報(bào)告和決策制定。 數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)集成的、主題導(dǎo)向的數(shù)據(jù)存儲(chǔ),用于存儲(chǔ)來自不同來源的數(shù)據(jù),經(jīng)過清洗、轉(zhuǎn)換和集成,以支持業(yè)務(wù)分析和決策。主要目標(biāo)是

    2024年01月20日
    瀏覽(26)
  • 一百八十六、大數(shù)據(jù)離線數(shù)倉(cāng)完整流程——步驟五、在Hive的DWS層建動(dòng)態(tài)分區(qū)表并動(dòng)態(tài)加載數(shù)據(jù)

    一百八十六、大數(shù)據(jù)離線數(shù)倉(cāng)完整流程——步驟五、在Hive的DWS層建動(dòng)態(tài)分區(qū)表并動(dòng)態(tài)加載數(shù)據(jù)

    經(jīng)過6個(gè)月的奮斗,項(xiàng)目的離線數(shù)倉(cāng)部分終于可以上線了,因此整理一下離線數(shù)倉(cāng)的整個(gè)流程,既是大家提供一個(gè)案例經(jīng)驗(yàn),也是對(duì)自己近半年的工作進(jìn)行一個(gè)總結(jié)。 1、Hive的DWS層建庫(kù)建表語(yǔ)句 --如果不存在則創(chuàng)建hurys_dc_dws數(shù)據(jù)庫(kù) create database if not exists hurys_dc_dws; --使用hurys_

    2024年02月07日
    瀏覽(20)
  • 探工業(yè)互聯(lián)網(wǎng)的下一站!騰訊云助力智造升級(jí)

    探工業(yè)互聯(lián)網(wǎng)的下一站!騰訊云助力智造升級(jí)

    數(shù)字化浪潮正深刻影響著傳統(tǒng)工業(yè)形態(tài)。作為第四次工業(yè)革命的重要基石,工業(yè)互聯(lián)網(wǎng)憑借其獨(dú)特的價(jià)值快速崛起,引領(lǐng)和推動(dòng)著產(chǎn)業(yè)變革方向。面對(duì)數(shù)字化時(shí)代給產(chǎn)業(yè)帶來的機(jī)遇與挑戰(zhàn),如何推動(dòng)工業(yè)互聯(lián)網(wǎng)的規(guī)模化落地,加速數(shù)字經(jīng)濟(jì)與實(shí)體經(jīng)濟(jì)的深度融合,已成為全行

    2024年02月11日
    瀏覽(29)
  • Ruff物聯(lián)網(wǎng)數(shù)采網(wǎng)關(guān)助力工業(yè)企業(yè)數(shù)字化轉(zhuǎn)型,降本增效

    Ruff物聯(lián)網(wǎng)數(shù)采網(wǎng)關(guān)助力工業(yè)企業(yè)數(shù)字化轉(zhuǎn)型,降本增效

    如今,隨著工廠數(shù)字化轉(zhuǎn)型進(jìn)程的加速,越來越多的企業(yè)對(duì)于設(shè)備數(shù)據(jù)感知層及傳輸層的應(yīng)用越來越重視,因此工業(yè)數(shù)采網(wǎng)關(guān)也走進(jìn)了很多人的視野,在工廠數(shù)字化轉(zhuǎn)型中扮演著關(guān)鍵角色。 物聯(lián)網(wǎng)數(shù)據(jù)采集網(wǎng)關(guān)能將各種傳感器、執(zhí)行器等設(shè)備連接在一起,通過收集、處理和傳

    2024年02月03日
    瀏覽(24)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包