国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

數(shù)據(jù)倉庫的ELT/ETL

這篇具有很好參考價值的文章主要介紹了數(shù)據(jù)倉庫的ELT/ETL。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

ETL 和 ELT 有很多共同點,從本質(zhì)上講,每種集成方法都可以將數(shù)據(jù)從源端抽取到數(shù)據(jù)倉庫中,兩者的區(qū)別在于數(shù)據(jù)在哪里進(jìn)行轉(zhuǎn)換。

01 ETL

ETL – 抽取、轉(zhuǎn)換、加載

從不同的數(shù)據(jù)源抽取信息,將其轉(zhuǎn)換為根據(jù)業(yè)務(wù)定義的格式,然后將其加載到其他數(shù)據(jù)庫或數(shù)據(jù)倉庫中。另一種 ETL 集成方法是反向 ETL,它將結(jié)構(gòu)化數(shù)據(jù)從數(shù)據(jù)倉庫中加載到業(yè)務(wù)數(shù)據(jù)庫中,如我們常用數(shù)據(jù)倉庫加工好的報表,推送到報表系統(tǒng)的數(shù)據(jù)庫中。

數(shù)據(jù)倉庫的ELT/ETL,必知必會,數(shù)據(jù)倉庫,etl

02 ELT

ELT – 抽取、加載、轉(zhuǎn)換

同樣的從一個或多個數(shù)據(jù)源中抽取數(shù)據(jù),然后將其加載到目標(biāo)數(shù)據(jù)倉庫中,此時不需要進(jìn)行數(shù)據(jù)格式的轉(zhuǎn)換。在 ELT 過程中,數(shù)據(jù)的轉(zhuǎn)換發(fā)生在目標(biāo)數(shù)據(jù)倉庫中。ELT 對遠(yuǎn)程資源的要求較少,只需要它們的原始數(shù)據(jù)即可。

數(shù)據(jù)倉庫的ELT/ETL,必知必會,數(shù)據(jù)倉庫,etl

03 ELT的演變

ELT 已經(jīng)存在了一段時間,但 Hadoop 等大數(shù)據(jù)技術(shù)出現(xiàn)后,更加活躍了。像以前轉(zhuǎn)換 PB 級原始數(shù)據(jù)這樣的大型任務(wù)無法處理,現(xiàn)在可以被分成小作業(yè),進(jìn)行處理,然后再加載到目標(biāo)數(shù)據(jù)庫中。同時,處理能力也提高了,尤其是以私有云集群的方式,把處理、加工數(shù)據(jù)可以在一個數(shù)據(jù)倉庫中完成了。

04 ELT的工作原理

與 ETL 不同,ELT是從多個數(shù)據(jù)源收集信息,將其加載到數(shù)據(jù)倉庫(或者數(shù)據(jù)湖)中,然后將其轉(zhuǎn)換為可操作的商業(yè)智能的過程。

抽取——在ELT和ETL兩種數(shù)據(jù)管理方法中的原理相似。一般我們會采用增量抽取,對于一些維表數(shù)據(jù)量比較小的也會采用全量抽取。

加載——這是 ELT 和 ETL 開始不同的地方了。ELT 不是在抽取大量原始數(shù)據(jù)的過程中將其轉(zhuǎn)換,而是將所有數(shù)據(jù)都加在到湖倉中,然后統(tǒng)一進(jìn)行轉(zhuǎn)換,這樣做加快了抽取的效率,但也意味著數(shù)據(jù)變得有用之前還有很多工作要做。

轉(zhuǎn)換——數(shù)據(jù)湖或數(shù)據(jù)倉庫對數(shù)據(jù)進(jìn)行規(guī)范化,將部分或全部數(shù)據(jù)保留在湖倉中,并可用于定制報告。存儲海量數(shù)據(jù)的開銷更高,但也是為了后續(xù)能夠更加快速的進(jìn)行數(shù)據(jù)挖掘和報表展現(xiàn),也就是我們常說的用空間換時間。

05 什么時候我們選擇ELT

這取決于公司現(xiàn)有的網(wǎng)絡(luò)和技術(shù)架構(gòu)、預(yù)算以及它已經(jīng)利用云和大數(shù)據(jù)技術(shù)的程度。如果是有下面三個需求場景時,那么ELT就是正確的選擇~

1.當(dāng)抽取速度是第一選擇時

因為 ELT 不必等待數(shù)據(jù)在抽取過程中進(jìn)行轉(zhuǎn)換后再加載,那么抽取過程要快得多。

2.當(dāng)需要隨時訪問原始數(shù)據(jù)時

有很多場景,我們需要保留所有歷史數(shù)據(jù),分析師可以根據(jù)時間、銷售模式、季節(jié)性趨勢或任何對業(yè)務(wù)變得重要的新興指標(biāo)進(jìn)行挖掘。由于數(shù)據(jù)在加載之前未進(jìn)行轉(zhuǎn)換,因此您可以訪問所有原始數(shù)據(jù)。比如,數(shù)據(jù)倉庫一般都有一個原始數(shù)據(jù)層,很多數(shù)據(jù)科學(xué)家更喜歡訪問原始數(shù)據(jù),而業(yè)務(wù)用戶更喜歡使用分析后的應(yīng)用層或者模型層數(shù)據(jù)。

3.當(dāng)需要隨時可擴(kuò)展數(shù)據(jù)湖倉時

當(dāng)您使用 Hadoop 或云數(shù)據(jù)倉庫等數(shù)據(jù)處理引擎時,ELT 可以利用本機(jī)處理能力實現(xiàn)更高的可擴(kuò)展性。

06 數(shù)據(jù)湖是不是很好的ELT落腳點

首先,我們思考一下數(shù)倉為什么會出現(xiàn)?其實是數(shù)據(jù)量的飛速增長,以至于當(dāng)時的數(shù)據(jù)存儲計算引擎,不能很好的滿足分析需求;于是數(shù)倉概念和經(jīng)典的理論出現(xiàn)了,很好的解決了當(dāng)時的問題,用“規(guī)范+存儲”來解決了當(dāng)時的問題。

那么現(xiàn)在大數(shù)據(jù)時代,隨著技術(shù)的不斷發(fā)展,很多新技術(shù)出現(xiàn)了,大批量的存儲和計算不再是那么難了,那么我們放棄數(shù)倉那一套是否可行呢?從一哥現(xiàn)在處理的業(yè)務(wù)看,如果你的業(yè)務(wù)系統(tǒng)相對較單一,沒有幾十個業(yè)務(wù)系統(tǒng)每天往數(shù)倉里灌數(shù)據(jù),那么數(shù)據(jù)湖可以滿足你的需求,并且對于“數(shù)據(jù)驅(qū)動”更“敏捷”。如果一線的業(yè)務(wù)系統(tǒng)較復(fù)雜,那么現(xiàn)在使用數(shù)據(jù)湖也會一不小心會變成“數(shù)據(jù)沼澤”。

數(shù)據(jù)湖治理策略沒有明確前,還不要急著就上數(shù)據(jù)湖,并不是適用于每個公司的業(yè)務(wù)場景的!

07 結(jié)語

ELT和ETL都有各自的應(yīng)用場景,可以說現(xiàn)在大數(shù)據(jù)環(huán)境下,很多已經(jīng)是ELT架構(gòu)了,所以這也是我近幾年一直不看好很多廠商在推“拖拉拽”的ETL工具或者平臺,未來肯定是需要一種通用語言來實現(xiàn)所有的ELT過程。

參考

你真的了解數(shù)據(jù)倉庫的ELT和ETL嗎?文章來源地址http://www.zghlxwxcb.cn/news/detail-852837.html

到了這里,關(guān)于數(shù)據(jù)倉庫的ELT/ETL的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 【SQL 必知必會】- 第九課 匯總數(shù)據(jù)

    【SQL 必知必會】- 第九課 匯總數(shù)據(jù)

    目錄 聚集函數(shù) ?????????AVG()函數(shù) ????????只用于單個列 ????????COUNT()函數(shù) ? ? ? ? COUNT()函數(shù)有兩種使用方式: ????????MAX()函數(shù) ????????對非數(shù)值數(shù)據(jù)使用MAX() ????????MIN()函數(shù) ????????對非數(shù)值數(shù)據(jù)使用MIN() ????????SUM()函數(shù) ????????在多

    2023年04月09日
    瀏覽(30)
  • 數(shù)據(jù)倉庫與ETL:數(shù)據(jù)倉庫設(shè)計和ETL流程

    數(shù)據(jù)倉庫與ETL:數(shù)據(jù)倉庫設(shè)計和ETL流程 數(shù)據(jù)倉庫是一種用于存儲、管理和分析大量歷史數(shù)據(jù)的系統(tǒng)。它通常用于企業(yè)、組織和政府等機(jī)構(gòu),以支持決策過程。數(shù)據(jù)倉庫的核心是ETL(Extract、Transform、Load)流程,它包括數(shù)據(jù)提取、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)加載三個階段。本文將深入探討數(shù)

    2024年03月08日
    瀏覽(19)
  • 【SQL 必知必會】- 第八課 使用函數(shù)處理數(shù)據(jù)

    【SQL 必知必會】- 第八課 使用函數(shù)處理數(shù)據(jù)

    目錄 函數(shù) ????????函數(shù)帶來的問題 ????????可移植(portable) ????????是否應(yīng)該使用函數(shù)? 使用函數(shù) ????????文本處理函數(shù) ????????SOUNDEX 支持 ????????日期和時間處理函數(shù) ????????數(shù)值處理函數(shù) ????????函數(shù)帶來的問題 ????????與幾乎所有

    2023年04月10日
    瀏覽(24)
  • 架構(gòu)師必知必會系列:物聯(lián)網(wǎng)數(shù)據(jù)處理與分析

    作者:禪與計算機(jī)程序設(shè)計藝術(shù) 物聯(lián)網(wǎng)(IoT)已經(jīng)成為一個全新的互聯(lián)網(wǎng)發(fā)展模式,它將物理世界、信息網(wǎng)絡(luò)和人工智能等多種技術(shù)融合在一起。隨著物聯(lián)網(wǎng)的廣泛應(yīng)用,傳感器、節(jié)點設(shè)備、云計算平臺和應(yīng)用軟件日益壯大。因此,對物聯(lián)網(wǎng)數(shù)據(jù)的采集、存儲、分析、處理、

    2024年02月06日
    瀏覽(36)
  • 大數(shù)據(jù)掃盲(1): 數(shù)據(jù)倉庫與ETL的關(guān)系及ETL工具推薦

    大數(shù)據(jù)掃盲(1): 數(shù)據(jù)倉庫與ETL的關(guān)系及ETL工具推薦

    在數(shù)字化時代,數(shù)據(jù)成為了企業(yè)決策的關(guān)鍵支持。然而,隨著數(shù)據(jù)不斷增長,有效地管理和利用這些數(shù)據(jù)變得至關(guān)重要。數(shù)據(jù)倉庫和ETL工具作為數(shù)據(jù)管理和分析的核心,將幫助企業(yè)從龐雜的數(shù)據(jù)中提取有價值信息。 ETL代表“Extract, Transform, Load”,是一種用于數(shù)據(jù)集成和轉(zhuǎn)換的

    2024年02月13日
    瀏覽(27)
  • ETL詳解--數(shù)據(jù)倉庫技術(shù)

    ? 一、ETL簡介 ETL ,是英文Extract-Transform-Load的縮寫,用來描述將數(shù)據(jù)從來源端經(jīng)過抽?。╡xtract)、轉(zhuǎn)換(transform)、加載(load)至目的端的過程,是數(shù)據(jù)倉庫的生命線。它是一種數(shù)據(jù)處理過程,用于從不同的數(shù)據(jù)源中提取數(shù)據(jù)、對數(shù)據(jù)進(jìn)行轉(zhuǎn)換和清洗,并將處理后的數(shù)據(jù)加

    2024年02月02日
    瀏覽(18)
  • 數(shù)據(jù)倉庫—ETL工具與技術(shù):數(shù)據(jù)倉庫的堅實基石

    作為一名長期從事數(shù)據(jù)倉庫領(lǐng)域的專業(yè)人士,我深知ETL(Extract, Transform, Load)工具和技術(shù)在構(gòu)建和維護(hù)數(shù)據(jù)倉庫中的核心作用。ETL不僅是數(shù)據(jù)流動的橋梁,更是確保數(shù)據(jù)質(zhì)量和支持業(yè)務(wù)智能決策的關(guān)鍵環(huán)節(jié)。在這篇文章中,我將分享對ETL工具和技術(shù)的深入理解,以及它們在實

    2024年04月13日
    瀏覽(14)
  • ETL數(shù)據(jù)集成和數(shù)據(jù)倉庫的關(guān)鍵步驟

    在當(dāng)今數(shù)據(jù)驅(qū)動的世界中,ETL(提取、轉(zhuǎn)換和加載)過程在構(gòu)建可靠和高效的數(shù)據(jù)倉庫中扮演著關(guān)鍵角色。ETL數(shù)據(jù)集成和數(shù)據(jù)倉庫的關(guān)鍵步驟對于數(shù)據(jù)質(zhì)量和決策支持至關(guān)重要。本文將介紹ETL數(shù)據(jù)集成和數(shù)據(jù)倉庫構(gòu)建的關(guān)鍵步驟,以幫助讀者了解構(gòu)建一個可靠數(shù)據(jù)倉庫所需的

    2024年02月12日
    瀏覽(31)
  • 六、數(shù)據(jù)倉庫詳細(xì)介紹(ETL)經(jīng)驗篇

    六、數(shù)據(jù)倉庫詳細(xì)介紹(ETL)經(jīng)驗篇

    ????????日常工作中大多數(shù)時候都是在做數(shù)據(jù)開發(fā),ETL 無處不在。雖然最近兩年主要做的大數(shù)據(jù)開發(fā),但感覺日常干的這些還是 ETL 那點事兒,區(qū)別只是技術(shù)組件全換了、數(shù)據(jù)量大了很多。 前幾年數(shù)倉勢微,是因為傳統(tǒng)的那些工具數(shù)據(jù)庫等無法解決數(shù)據(jù)量進(jìn)一步膨脹帶來

    2024年02月15日
    瀏覽(58)
  • 六、數(shù)據(jù)倉庫詳細(xì)介紹(ETL)方法篇

    六、數(shù)據(jù)倉庫詳細(xì)介紹(ETL)方法篇

    上文我們把數(shù)據(jù)倉庫類比我們?nèi)祟愖陨?,?shù)據(jù)倉庫“吃”進(jìn)去的是原材料(原始數(shù)據(jù)),經(jīng)過 ETL 集成進(jìn)入數(shù)據(jù)倉庫,然后從 ODS 開始逐層流轉(zhuǎn)最終供給到數(shù)據(jù)應(yīng)用,整個數(shù)據(jù)流動過程中,在一些關(guān)鍵節(jié)點數(shù)據(jù)會被存儲存儲下來落入數(shù)倉模型。在數(shù)倉這個自運轉(zhuǎn)的大生態(tài)系統(tǒng)中

    2024年02月16日
    瀏覽(23)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包