国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

DataX實現(xiàn)Mysql與ElasticSearch(ES)數(shù)據(jù)同步

這篇具有很好參考價值的文章主要介紹了DataX實現(xiàn)Mysql與ElasticSearch(ES)數(shù)據(jù)同步。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

一、Linux環(huán)境要求

jdk1.8及以上
python2

二、準備工作

2.1 Linux安裝jdk

 yum install -y java-1.8.0-openjdk.x86_64

查看是否安裝成功

java -version

2.2 linux安裝python

 yum install -y python

查看python版本號,判斷是否安裝成功

python --version

2.3 下載DataX:

三、DataX壓縮包導入,解壓縮

tar -zxvf datax.tar.gz 

四、編寫同步Job

在datax/job下,json格式,具體內(nèi)容及主要配置含義如下

mysqlreader為讀取mysql數(shù)據(jù)部分,配置mysql相關(guān)信息
username,password為數(shù)據(jù)庫賬號密碼
querySql:需要查詢數(shù)據(jù)的sql,也可通過colums指定需要查找的字段(querySql優(yōu)先級高)
elasticsearchwriter部分為數(shù)據(jù)寫入ES部分,配置ES相關(guān)信息,
endpoint為ES地址,index為索引,columns為需要寫入列的信息,其余配置選填

坑!:若運行時提示mysql連接失敗,且賬號密碼,ip,端口號都沒問題的情況下,需要像文中一樣在jdbcUrl的內(nèi)容后面加上useSSL=false"

vim /opt/software/datax/job/job.json

將內(nèi)容換成以下內(nèi)容

{
    "job": {
      "setting": { 
          "speed": {
              "channel": 1
          },
          "errorLimit": {
              "percentage": 0
          }
      },
      "content": [
          {
            "reader": {
                "name": "mysqlreader",
                "parameter": {
                    "username": "root",
                    "password": "123456",
                    "connection": [{
                        "querySql": ["select * from user_t"],
                        "jdbcUrl": ["jdbc:mysql://數(shù)據(jù)庫地址:3306/mysql?useSSL=false"]
                    }]
                }
            },
              "writer": {
                  "name": "elasticsearchwriter",
                  "parameter": {
                      "endpoint":"http://ES地址:9200",
                       "accessId":"",
                      "accessKey":"",
                      "index": "user-demo",
                      "cleanup": false,
                      "discovery":false,
                      "column": [
                          {
                            "name": "id",
                            "type": "id"
                          },
                        {
                            "name": "userName",
                            "type": "text"
                        },
                                                 {
                            "name": "address",
                            "type": "text"
                        }

                      ]
                  }
              }
            }
        ]
        }
    }

五、執(zhí)行Job

配置好之后執(zhí)行命令:

 python /opt/software/datax/bin/datax.py /opt/software/datax/job/job.json 

注意換成自己的datax路徑

正常情況下輸出一大堆之后會是這樣,由于我在mysql表中插了三條測試數(shù)據(jù),,所以讀出記錄總數(shù)為3
datax 同步es,后端,mysql,elasticsearch,數(shù)據(jù)庫完成操作

六、定時更新

6.1 創(chuàng)建定時任務

vim crondatax
內(nèi)容:
5 13 * * * python /opt/software/datax/bin/datax.py /opt/software/datax/job/job.json

/opt/software/datax/log.date +\%Y\%m\%d\%H\%M\%S 2>&1
含義為每天13:05執(zhí)行python /opt/software/datax/bin/datax.py /opt/software/datax/job/job.json 命令,日志輸出地址為/opt/software/datax,命名為“l(fā)og.時間”
crontab格式可參考下圖:

6.2 提交定時任務

crontab crondatax

/sbin/service crond restart

6.3 查看定時任務

crontab -l

七、增量更新思路

數(shù)據(jù)庫表設計時加入最后操作時間字段,新增,修改數(shù)據(jù)都會記錄最新時間
Datax的json中,mysql查詢語句中按照定時任務規(guī)律,查詢此字段時間大于定時任務時間間隔之前的時間的數(shù)據(jù)。文章來源地址http://www.zghlxwxcb.cn/news/detail-745132.html

到了這里,關(guān)于DataX實現(xiàn)Mysql與ElasticSearch(ES)數(shù)據(jù)同步的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務器費用

相關(guān)文章

  • 【ElasticSearch】ES與MySQL數(shù)據(jù)同步方案及Java實現(xiàn)

    【ElasticSearch】ES與MySQL數(shù)據(jù)同步方案及Java實現(xiàn)

    elasticsearch中的酒店數(shù)據(jù)來自于mysql數(shù)據(jù)庫,當mysql中的數(shù)據(jù)發(fā)生改變時,es中的數(shù)據(jù)也要跟著改變,即es與mysql之間的數(shù)據(jù)同步。 操作mysql的微服務hotel-admin不能直接更新es的索引庫,那就由操作es索引庫的微服務hotel-demo來暴露一個更新索引庫的接口給hotel-admin調(diào)用 同步調(diào)用方式

    2024年02月15日
    瀏覽(26)
  • 【大數(shù)據(jù)進階第三階段之Datax學習筆記】使用阿里云開源離線同步工具DataX 實現(xiàn)數(shù)據(jù)同步

    【大數(shù)據(jù)進階第三階段之Datax學習筆記】使用阿里云開源離線同步工具DataX 實現(xiàn)數(shù)據(jù)同步

    【大數(shù)據(jù)進階第三階段之Datax學習筆記】阿里云開源離線同步工具Datax概述? 【大數(shù)據(jù)進階第三階段之Datax學習筆記】阿里云開源離線同步工具Datax快速入門? ?【大數(shù)據(jù)進階第三階段之Datax學習筆記】阿里云開源離線同步工具Datax類圖 【大數(shù)據(jù)進階第三階段之Datax學習筆記】使

    2024年01月24日
    瀏覽(31)
  • 阿里巴巴開源DataX全量同步多個MySQL數(shù)據(jù)庫

    阿里巴巴開源DataX全量同步多個MySQL數(shù)據(jù)庫

    上次 寫了阿里巴巴高效的離線數(shù)據(jù)同步工具DataX: https://mp.weixin.qq.com/s/_ZXqA3H__Kwk-9O-9dKyOQ 安裝DataX這個開源工具,并且同步備份了幾張數(shù)據(jù)表。但是發(fā)現(xiàn)一個問題,就是每張表都需要單獨寫一個 job。如果數(shù)據(jù)表有幾百張是不是要寫幾百個,這個不太現(xiàn)實了。 正當一籌莫展之際

    2024年02月02日
    瀏覽(40)
  • Datax hive 寫 es

    Datax hive 寫 es

    https://github.com/alibaba/datax/tree/master 發(fā)現(xiàn)有 寫es的案例 進入 case案例,查看 json DataX/elasticsearchwriter.md at master · alibaba/DataX · GitHub 注意下: ? ? ? ? 有些參數(shù)不是必選的,可以不填 ???????? 測試過程中,有個身份驗證的錯誤注意下,在我的另一篇博客中。 datax hive 寫 es 報

    2024年02月09日
    瀏覽(14)
  • DataX將MySQL數(shù)據(jù)同步到HDFS中時,空值不處理可以嗎

    DataX將MySQL數(shù)據(jù)同步到HDFS中時,空值不處理可以嗎

    DataX將MySQL數(shù)據(jù)同步到HDFS中時,空值(NULL)存到HDFS中時,默認是存儲為空字符串(‘’)。 HFDS Writer并未提供nullFormat參數(shù):也就是用戶并不能自定義null值寫到HFDS文件中的存儲格式。默認情況下,HFDS Writer會將null值存儲為空字符串(‘’),而Hive默認的null值存儲格式為N。所以

    2024年02月12日
    瀏覽(29)
  • ElasticSearch - 在 微服務項目 中基于 RabbitMQ 實現(xiàn) ES 和 MySQL 數(shù)據(jù)異步同步(考點)

    ElasticSearch - 在 微服務項目 中基于 RabbitMQ 實現(xiàn) ES 和 MySQL 數(shù)據(jù)異步同步(考點)

    目錄 一、數(shù)據(jù)同步 1.1、什么是數(shù)據(jù)同步 1.2、解決數(shù)據(jù)同步面臨的問題 1.3、解決辦法 1.3.1、同步調(diào)用 1.3.2、異步通知(推薦) 1.3.3、監(jiān)聽 binlog 1.3、基于 RabbitMQ 實現(xiàn)數(shù)據(jù)同步 1.3.1、需求 1.3.2、在“酒店搜索服務”中 聲明 exchange、queue、routingKey,同時開啟監(jiān)聽 1.3.3、在“酒店

    2024年02月08日
    瀏覽(31)
  • Doris-05-集成Spark、Flink、Datax,以及數(shù)據(jù)湖分析(JDBC、ODBC、ES、Hive、多源數(shù)據(jù)目錄Catalog)

    Doris-05-集成Spark、Flink、Datax,以及數(shù)據(jù)湖分析(JDBC、ODBC、ES、Hive、多源數(shù)據(jù)目錄Catalog)

    準備表和數(shù)據(jù): Spark 讀寫 Doris Spark Doris Connector 可以支持通過 Spark 讀取 Doris 中存儲的數(shù)據(jù),也支持通過Spark寫入數(shù)據(jù)到Doris。 代碼庫地址:https://github.com/apache/incubator-doris-spark-connector 支持從 Doris 中讀取數(shù)據(jù) 支持 Spark DataFrame 批量/流式 寫入 Doris 可以將 Doris 表映射為 DataFra

    2024年02月06日
    瀏覽(49)
  • DataX mysql同步到mysql

    DataX mysql同步到mysql

    創(chuàng)建數(shù)據(jù)源 配置數(shù)據(jù)庫相關(guān)信息 創(chuàng)建執(zhí)行器 配置執(zhí)行器執(zhí)行地址相關(guān)信息 1.1 SQL語句 (querySql) 在json文件中此部分配置就是 querySql 在有些業(yè)務場景下,where這一配置項不足以描述所篩選的條件,用戶可以通過該配置型來自定義篩選SQL。當用戶配置了這一項之后,DataX系統(tǒng)就

    2024年02月09日
    瀏覽(18)
  • 使用DataX實現(xiàn)mysql與hive數(shù)據(jù)互相導入導出

    使用DataX實現(xiàn)mysql與hive數(shù)據(jù)互相導入導出

    ???????? DataX 是 阿里巴巴開源 的一個異構(gòu)數(shù)據(jù)源離線同步工具,致力于實現(xiàn)包括關(guān)系型數(shù)據(jù)庫(MySQL、Oracle 等)、HDFS、Hive、ODPS、HBase、FTP 等 各種異構(gòu)數(shù)據(jù)源之間穩(wěn)定高效的數(shù)據(jù)同步 功能。 ???????? 為了解決異構(gòu)數(shù)據(jù)源同步問題,DataX 將復雜的 網(wǎng)狀 的同步鏈路變成了

    2024年02月08日
    瀏覽(30)
  • 數(shù)據(jù)同步工具—DataX—Web部署使用

    數(shù)據(jù)同步工具—DataX—Web部署使用

    以前了解datax,感覺對易用性不大好,目前發(fā)現(xiàn)已經(jīng)圖形配置工具。簡單整理一下。 Datax 的使用過程中,我們會發(fā)現(xiàn),不管是利用 java 調(diào)用以及 python 命令啟動的方式,我們都無法進行任務的管理,并且每次執(zhí)行任務前,我們 都需要編輯 Json 配置文件,這是比較繁瑣的,隨著業(yè)

    2024年02月05日
    瀏覽(23)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包