国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

# Apache SeaTunnel 究竟是什么?

這篇具有很好參考價值的文章主要介紹了# Apache SeaTunnel 究竟是什么?。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

作者 | Shawn Gordon

翻譯 | Debra Chen

原文鏈接 | What the Heck is Apache SeaTunnel?

我在2023年初開始注意到Apache SeaTunnel的相關(guān)討論,一直低調(diào)地關(guān)注著。該項目始于2017年,最初名為Waterdrop,在Apache DolphinScheduler的創(chuàng)建者的貢獻下發(fā)展起來,后者支持SeaTunnel作為任務(wù)插件。

我最初對于SeaTunnel是什么以及為什么我會關(guān)心它感到困惑。這意味著我將在至少能回答我的這些問題的層面上,對Apache SeaTunnel有一個深度的介紹。那么,讓我們開始吧。

什么是SeaTunnel?

Apache SeaTunnel的項目介紹是“一個高性能的、分布式的、大規(guī)模數(shù)據(jù)集成工具,提供了異構(gòu)數(shù)據(jù)集成和數(shù)據(jù)同步的一體化解決方案?!彼ㄈ齻€主要組件:

  • 源連接器
  • 轉(zhuǎn)換連接器
  • 目標(biāo)連接器

許多源連接器(Connector)可供選擇;在版本2.3.3中,可用的連接器如鏈接所示。它支持包括關(guān)系型、NoSQL和圖形等格式,以及分布式文件系統(tǒng)(如HDFS)和對象存儲(如S3)等。

如果源和目標(biāo)之間的格式不同,則轉(zhuǎn)換連接器(Transform Tonnector)會發(fā)揮作用,實質(zhì)上它就是對數(shù)據(jù)進行映射。

目標(biāo)連接器(Sink)是源的另一側(cè),但現(xiàn)在你是在寫入數(shù)據(jù)而不是讀取。截至本文撰寫時,SeaTunnel聲明已支持超過100個連接器。

有了這些組件,SeaTunnel可以解決數(shù)據(jù)集成和同步中常見的問題。因此,它提供了實時和批處理數(shù)據(jù)的高性能數(shù)據(jù)同步。文章稱它可以“實時同步數(shù)十億數(shù)據(jù)量”。雖然我不確定是什么意思,但考慮到像阿里巴巴這樣的公司在使用它,它的速度可能非??臁?/p>

SeaTunnel的特性

我對系統(tǒng)中的連接器API功能印象深刻。正如前面所述,Apache SeaTunnel已有超過100個預(yù)先構(gòu)建的連接器,但如果需要其他連接器,你可以創(chuàng)建自己的連接器。這些連接器不與特定的執(zhí)行引擎綁定,而可以使用Flink、Spark或本地的SeaTunnel引擎。連接器的插件架構(gòu)讓我想起了Trino的生態(tài)系統(tǒng)。

數(shù)據(jù)可以以批處理或?qū)崟r方式同步,并提供了各種同步選項。SeaTunnel一個很棒的特性是它可以與JDBC已配合工作,支持多表或整個數(shù)據(jù)庫的同步。這就解決了CDC多表同步方案的需求。

SeaTunnel的運行時流程如下所示:

  • 配置作業(yè)信息并選擇執(zhí)行引擎。
  • 源連接器并行讀取數(shù)據(jù),并將其傳遞到轉(zhuǎn)換器、目標(biāo)連接器或直接傳遞到目標(biāo)。

請記住,SeaTunnel是一個EL(T)集成平臺,因此它只能自行進行基本的數(shù)據(jù)轉(zhuǎn)換:

  • 更改列中的數(shù)據(jù)大小寫
  • 更改列名
  • 將一列拆分為多列

SeaTunnel job

SeaTunnel job,或配置文件可能由四個部分組成:env、source、transform和sink。如果不執(zhí)行轉(zhuǎn)換,則可以忽略transform部分。配置文件可以采用hocon或json格式編寫。從SeaTunnel文檔中借鑒,以下是hocon格式的簡單示例:

Copy code
env {
 job.mode = "BATCH"
}
source {
 FakeSource {
 result_table_name = "fake"
 row.num = 100
 schema = {
 fields {
 name = "string"
 age = "int"
 card = "int"
 }
 }
 }
}
transform {
 Filter {
 source_table_name = "fake"
 result_table_name = "fake1"
 fields = [name, card]
 }
}
sink {
 Clickhouse {
 host = "clickhouse:8123"
 database = "default"
 table = "seatunnel_console"
 fields = ["name", "card"]
 username = "default"
 password = ""
 source_table_name = "fake1"
 }
}

雖然格式非常易于閱讀和理解,但我可以看出,對于大型表格,它可能會變得相當(dāng)復(fù)雜。我要在此評論一下,就像許多開源項目一樣,SeaTunnel的文檔相當(dāng)缺乏,但據(jù)我觀察的時間,該項目似乎有一個相當(dāng)活躍的Slack頻道。

SeaTunnel使用要求

它是一個Java系統(tǒng),支持Java 8或Java 11版本,但應(yīng)該與較舊的系統(tǒng)兼容。如果你已經(jīng)安裝了Java,則只需從其網(wǎng)站獲取所需的插件(或編寫自己的插件),并在配置文件中進行設(shè)置。之后,按照上文所述創(chuàng)建用于管理作業(yè)的配置文件。只要你有訪問源和目標(biāo)數(shù)據(jù)存儲庫的憑據(jù),控制臺就會提供反饋信息。

Apache SeaTunnel還提供了Web界面,供那些想要替代CLI的用戶選擇。這將是我個人使用這個系統(tǒng)的首選方式,因為它的可視性更好,但安裝和使用也需要更多的步驟。

總結(jié)

SeaTunnel顯然適用于某些場景,就我目前所看到的情況而言,在處理各種數(shù)據(jù)源和目標(biāo)的大量數(shù)據(jù)時,它才會發(fā)揮作用。我完全可以預(yù)見,SeaTunnel還將在很多場景中讓事情變得更簡單,所以我會把這個項目放在我的工具箱里。SeaTunnel團隊提供了一個很好的快速入門指南,幫助用戶可以輕松地自行嘗試,看看它是否能解決你的問題吧!

本文由 白鯨開源 提供發(fā)布支持!文章來源地址http://www.zghlxwxcb.cn/news/detail-844309.html

到了這里,關(guān)于# Apache SeaTunnel 究竟是什么?的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 海豚調(diào)度任務(wù)類型Apache SeaTunnel部署指南

    Apache DolphinScheduler已支持Apache SeaTunnel任務(wù)類型,本文介紹了SeaTunnel任務(wù)類型如何創(chuàng)建,任務(wù)參數(shù),以及任務(wù)樣例。 SeaTunnel 任務(wù)類型,用于創(chuàng)建并執(zhí)行 SeaTunnel 類型任務(wù)。worker 執(zhí)行該任務(wù)的時候,會通過 start-seatunnel-spark.sh 、 start-seatunnel-flink.sh 和 seatunnel.sh 命令解析 config 文件

    2024年04月08日
    瀏覽(49)
  • Apache Seatunnel本地源碼構(gòu)建編譯運行調(diào)試

    Apache Seatunnel本地源碼構(gòu)建編譯運行調(diào)試

    Apache Seatunnel本地源碼構(gòu)建編譯運行調(diào)試 ??本文使用的是windows10-64位專業(yè)版的電腦,需要安裝環(huán)境如下 ??jdk=1.8 - 64 位的jdk、 ??使用的是idea自帶的maven,最好是安裝一個方便源碼編譯構(gòu)建,使用idea自帶的maven無法執(zhí)行mvnw,但是可以復(fù)制mvnw后面的在idea的maven中的run mave

    2024年01月16日
    瀏覽(36)
  • 【安裝部署】Apache SeaTunnel 和 Web快速安裝詳解

    由于作者目前接觸當(dāng)前最新版本為2.3.4 但是官方提供的web版本未1.0.0,不兼容2.3.4,因此這里仍然使用2.3.3版本。 可以自定義兼容處理,官方提供了文檔:https://mp.weixin.qq.com/s/Al1VmBoOKu2P02sBOTB6DQ 因為大部分用戶使用SeaTunnel Web都是基于SeaTunnel-2.3.3 版本做的適配,而最新發(fā)布的Sea

    2024年04月16日
    瀏覽(17)
  • Apache SeaTunnel 及 Web 功能部署指南(小白版)

    在大數(shù)據(jù)處理領(lǐng)域,Apache SeaTunnel 已成為一款備受青睞的開源數(shù)據(jù)集成平臺,它不僅可以基于Apache Spark和Flink,而且還有社區(qū)單獨開發(fā)專屬數(shù)據(jù)集成的Zeta引擎,提供了強大的數(shù)據(jù)處理能力。隨著SeaTunnel Web的推出,用戶界面(UI)操作變得更加友好,項目部署和管理更加便捷。 本

    2024年03月09日
    瀏覽(17)
  • 解讀重要功能特性:新手入門 Apache SeaTunnel CDC

    解讀重要功能特性:新手入門 Apache SeaTunnel CDC

    點亮 ?? Star · 照亮開源之路 https://github.com/apache/incubator-seatunnel 為什么說 CDC 是SeaTunnel平臺中的一個重要功能特性?今天這篇文章跟大家分享一下 CDC 是什么?目前市面上的 CDC 工具現(xiàn)有的痛點有哪些?SeaTunnel面對這些痛點設(shè)計的架構(gòu)目標(biāo)是什么?另外包括社區(qū)的展望和目前

    2024年02月09日
    瀏覽(19)
  • 教程 | 使用 Apache SeaTunnel 同步本地文件到阿里云 OSS

    教程 | 使用 Apache SeaTunnel 同步本地文件到阿里云 OSS

    一直以來,大數(shù)據(jù)量一直是爆炸性增長,每天幾十 TB 的數(shù)據(jù)增量已經(jīng)非常常見,但云存儲相對來說還是不便宜的。眾多云上的大數(shù)據(jù)用戶特別希望可以非常簡單快速的將文件移動到更實惠的 S3、OSS 上進行保存,這篇文章就來介紹如何使用 SeaTunnel 來進行到 OSS 的數(shù)據(jù)同步。

    2024年02月08日
    瀏覽(18)
  • Apache DolphinScheduler 3.1.8 版本發(fā)布,修復(fù) SeaTunnel 相關(guān) Bug

    Apache DolphinScheduler 3.1.8 版本發(fā)布,修復(fù) SeaTunnel 相關(guān) Bug

    近日,Apache DolphinScheduler 發(fā)布了 3.1.8 版本。此版本主要基于 3.1.7 版本進行了 bug 修復(fù),共計修復(fù) 16 個 bug, 1 個 doc, 2 個 chore。 其中修復(fù)了以下幾個較為重要的問題: 修復(fù)在構(gòu)建 SeaTunnel 任務(wù)節(jié)點的參數(shù)時錯誤的判斷條件 修復(fù) SeaTunnel 任務(wù)運行模式默認為運行,無法選擇空值的

    2024年02月13日
    瀏覽(20)
  • 使用 Apache SeaTunnel 實現(xiàn) Kafka Source 解析復(fù)雜Json 案例

    使用 Apache SeaTunnel 實現(xiàn) Kafka Source 解析復(fù)雜Json 案例

    版本說明: SeaTunnel:apache-seatunnel-2.3.2-SNAPHOT 引擎說明: Flink:1.16.2 Zeta:官方自帶 近些時間,我們正好接手一個數(shù)據(jù)集成項目,數(shù)據(jù)上游方是給我們投遞到Kafka,我們一開始的技術(shù)選型是SpringBoot+Flink對上游數(shù)據(jù)進行加工處理(下文簡稱:方案一),由于測試不到位,后來到

    2024年02月17日
    瀏覽(20)
  • 曝光!Apache SeaTunnel Catalog 功能設(shè)計為何能大大簡化用戶啟用步驟?

    曝光!Apache SeaTunnel Catalog 功能設(shè)計為何能大大簡化用戶啟用步驟?

    Catalog(目錄)提供了關(guān)于數(shù)據(jù)庫、表格和訪問數(shù)據(jù)所需的信息的元數(shù)據(jù),以及統(tǒng)一的 API 來管理元數(shù)據(jù),驗證連接,讓元數(shù)據(jù)對 Sources(數(shù)據(jù)源)、Sinks(數(shù)據(jù)匯)和 Web 可訪問。 Catalog 讓用戶能夠引用其數(shù)據(jù)系統(tǒng)中的現(xiàn)有元數(shù)據(jù),并自動映射到 SeaTunnel 的對應(yīng)元數(shù)據(jù)??傊?,

    2024年02月09日
    瀏覽(14)
  • 恭喜又一白鯨開源成員成為 Apache SeaTunnel PMC Member

    恭喜又一白鯨開源成員成為 Apache SeaTunnel PMC Member

    王海林 白鯨開源研發(fā)工程師 GitHub ID:hailin0 做過性能監(jiān)控、數(shù)據(jù)開發(fā)平臺等,目前聚焦在數(shù)據(jù)集成同步及其周邊生態(tài)的研發(fā) 問:作為白鯨開源的一員,您為社區(qū)做出過哪些貢獻?具體方案(代碼類)和貢獻事跡有哪些? 最開始參與到社區(qū),主要是貢獻一些連接器插件以及修

    2024年02月13日
    瀏覽(22)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包