国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Flink|checkpoint 超時報錯問題處理(FlinkRuntimeException)

這篇具有很好參考價值的文章主要介紹了Flink|checkpoint 超時報錯問題處理(FlinkRuntimeException)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

問題出現(xiàn)場景

為了評估一個 Flink 程序的處理效果,我使用本地模式啟動了 Flink 程序,并在上游表中一次性插入了大量數(shù)據(jù)(大概相當于線上單個并發(fā) 4 - 5 分鐘的最大處理量),以觸發(fā)計算。

但是,在本地計算中,一直無法計算完成,觀察后發(fā)現(xiàn)任務在被重復計算,進而發(fā)現(xiàn) Flink 在不斷從 checkpoint 恢復。在日志中搜索 checkpoint,發(fā)現(xiàn)如下報錯信息:

org.apache.flink.util.FlinkRuntimeException: Exceeded checkpoint tolerable failure threshold.
	at org.apache.flink.runtime.checkpoint.CheckpointFailureManager.handleCheckpointException(CheckpointFailureManager.java:98) ~[flink-runtime_2.11-1.13.5.jar:1.13.5]
	at org.apache.flink.runtime.checkpoint.CheckpointFailureManager.handleJobLevelCheckpointException(CheckpointFailureManager.java:67) ~[flink-runtime_2.11-1.13.5.jar:1.13.5]
	at org.apache.flink.runtime.checkpoint.CheckpointCoordinator.abortPendingCheckpoint(CheckpointCoordinator.java:1934) ~[flink-runtime_2.11-1.13.5.jar:1.13.5]
	at org.apache.flink.runtime.checkpoint.CheckpointCoordinator.abortPendingCheckpoint(CheckpointCoordinator.java:1906) ~[flink-runtime_2.11-1.13.5.jar:1.13.5]
	at org.apache.flink.runtime.checkpoint.CheckpointCoordinator.access$600(CheckpointCoordinator.java:96) ~[flink-runtime_2.11-1.13.5.jar:1.13.5]
	at org.apache.flink.runtime.checkpoint.CheckpointCoordinator$CheckpointCanceller.run(CheckpointCoordinator.java:1990) ~[flink-runtime_2.11-1.13.5.jar:1.13.5]
	at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511) ~[?:1.8.0_391]
	at java.util.concurrent.FutureTask.run(FutureTask.java:266) ~[?:1.8.0_391]
	at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.access$201(ScheduledThreadPoolExecutor.java:180) ~[?:1.8.0_391]
	at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:293) ~[?:1.8.0_391]
	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149) ~[?:1.8.0_391]
	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) ~[?:1.8.0_391]
	at java.lang.Thread.run(Thread.java:750) ~[?:1.8.0_391]

該報錯大概每 10 分鐘左右出現(xiàn)一次,具體如下:

  • 11:30:44 - 啟動 Flink 程序
  • 11:41:17 - 第一次報錯(在啟動后 10 分鐘 33 秒)
  • 11:51:48 - 第二次報錯(在上次報錯后 10 分鐘 31 秒)
  • 12:02:19 - 第三次報錯(在上次報錯后 10 分鐘 31 秒)
  • ……

問題原因

通過定位,發(fā)現(xiàn)是 checkpoint 超時報錯。Flink 的 checkpoint 的超時時間時 600 秒,但是這個任務需要 11 分鐘才能完成。本地之所以比線上慢,一方面是因為本地增加了一部分新的邏輯;另一方面也可能是因為線上運行時,對 MySQL 請求時走的是內網(wǎng)請求,而本地運行走的是外網(wǎng)請求。

Flink 的 checkpoint 超時時間默認值的源碼位置如下:

// org.apache.flink.streaming.api.environment.CheckpointConfig

public class CheckpointConfig implements Serializable {
 public CheckpointConfig() {
     this.checkpointingMode = DEFAULT_MODE;
     this.checkpointInterval = -1L;
     this.checkpointTimeout = 600000L;
     this.minPauseBetweenCheckpoints = 0L;
     this.maxConcurrentCheckpoints = 1;
     this.alignmentTimeout = (Duration)ExecutionCheckpointingOptions.ALIGNMENT_TIMEOUT.defaultValue();
     this.failOnCheckpointingErrors = true;
     this.preferCheckpointForRecovery = false;
     this.tolerableCheckpointFailureNumber = -1;
 }

解決方法

在本地測試時,如需較大數(shù)據(jù)量測試,顯式地設置 checkpoint 超時時間即可:文章來源地址http://www.zghlxwxcb.cn/news/detail-860868.html

env.getCheckpointConfig().setCheckpointTimeout(1200000);

到了這里,關于Flink|checkpoint 超時報錯問題處理(FlinkRuntimeException)的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉載,請注明出處: 如若內容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • flink1.15 savepoint 超時報錯 java.util.concurrent.TimeoutException
  • 【Flink】FlinkRuntimeException: Cannot read the binlog filename and position via ‘SHOW MASTER STATUS‘

    錯誤明細: Access denied; you need (at least one of) the SUPER, REPLICATION CLIENT privilege(s) for this operation 訪問被拒絕;此操作需要(至少一個)SUPER、REPLICATION CLIENT權限 權限不夠唄: 查看官網(wǎng)文檔:?https://ververica.github.io/flink-cdc-connectors/master/content/about.html 創(chuàng)建 MySQL 用戶: 向用戶授予所

    2024年02月02日
    瀏覽(19)
  • Flink非對齊checkpoint原理(Flink Unaligned Checkpoint)

    Flink非對齊checkpoint原理(Flink Unaligned Checkpoint)

    為什么提出Unaligned Checkpoint(UC)? 因為反壓嚴重時會導致Checkpoint失敗,可能導致如下問題 恢復時間長-服務效率低 非冪等和非事務會導致數(shù)據(jù)重復 持續(xù)反壓導致任務加入死循環(huán)(可能導致數(shù)據(jù)丟失,例如超過kafka的過期時間無法重置offset) UC的原理 UC有兩個階段(UC主要是

    2024年02月14日
    瀏覽(29)
  • 【flink】Checkpoint expired before completing.
使用flink同步數(shù)據(jù)出現(xiàn)錯誤Checkpoint expired before completing.

    【flink】Checkpoint expired before completing. 使用flink同步數(shù)據(jù)出現(xiàn)錯誤Checkpoint expired before completing.

    任務超時了: 重新把任務配置參數(shù),配置如下: 或者修改 flink的 配置文件flink-conf.yaml?

    2024年02月12日
    瀏覽(36)
  • Flink本地checkpoint測試

    Flink本地checkpoint測試

    在本地IDEA測試中,使用本地文件存儲系統(tǒng),作為checkpoint的存儲系統(tǒng),將備份數(shù)據(jù)存儲到本地文件中,作業(yè)停止后,從本地備份數(shù)據(jù)啟動Flink程序。 主要分為兩步: 1)備份數(shù)據(jù) 2)從備份數(shù)據(jù)啟動 備份數(shù)據(jù)的配置,和使用HDFS文件體統(tǒng)類似,只不過路徑填寫成本地文件系統(tǒng)的

    2024年02月15日
    瀏覽(18)
  • Flink: checkPoint

    依據(jù)1.17.1 最新版本的內容研究下期運作原理,總的來說其實就是設置一些參數(shù),這些參數(shù)就會影響到如何存儲checkpoint的問題.用起來沒什么難的,參數(shù)配置的組合到是挺多cuiyaonan2000@163.com 參考資料: Checkpointing | Apache Flink State Backends | Apache Flink Flink 中的每個方法或算子都能夠是 有

    2024年02月12日
    瀏覽(23)
  • 【Flink入門修煉】2-3 Flink Checkpoint 原理機制

    【Flink入門修煉】2-3 Flink Checkpoint 原理機制

    如果讓你來做一個有狀態(tài)流式應用的故障恢復,你會如何來做呢? 單機和多機會遇到什么不同的問題? Flink Checkpoint 是做什么用的?原理是什么? Checkpoint 是對當前運行狀態(tài)的完整記錄。程序重啟后能從 Checkpoint 中恢復出輸入數(shù)據(jù)讀取到哪了,各個算子原來的狀態(tài)是什么,并

    2024年04月25日
    瀏覽(25)
  • Flink 學習八 Flink 容錯機制 & checkpoint & savepoint

    Flink 學習八 Flink 容錯機制 & checkpoint & savepoint

    https://nightlies.apache.org/flink/flink-docs-release-1.14/docs/concepts/stateful-stream-processing/ 上一節(jié)講述 狀態(tài)后端 ;Flink是一個 帶狀態(tài)stateful 的數(shù)據(jù)處理系統(tǒng),在處理數(shù)據(jù)的過程中,各個算子的記錄的狀態(tài)會隨著算子處理的狀態(tài)而改變 ; 狀態(tài)后端 負責將狀態(tài)保存在內存或外部持久化存儲中 (內存

    2024年02月09日
    瀏覽(22)
  • Flink源碼之Checkpoint執(zhí)行流程

    Flink源碼之Checkpoint執(zhí)行流程

    Checkpoint完整流程如上圖所示: JobMaster的CheckpointCoordinator向所有SourceTask發(fā)送RPC觸發(fā)一次CheckPoint SourceTask向下游廣播CheckpointBarrier SouceTask完成狀態(tài)快照后向JobMaster發(fā)送快照結果 非SouceTask在Barrier對齊后完成狀態(tài)快照向JobMaster發(fā)送快照結果 JobMaster保存SubTask快照結果 JobMaster收到所

    2024年02月11日
    瀏覽(44)
  • 9、Flink四大基石之Checkpoint容錯機制詳解及示例(checkpoint配置、重啟策略、手動恢復checkpoint和savepoint)

    一、Flink 專欄 Flink 專欄系統(tǒng)介紹某一知識點,并輔以具體的示例進行說明。 1、Flink 部署系列 本部分介紹Flink的部署、配置相關基礎內容。 2、Flink基礎系列 本部分介紹Flink 的基礎部分,比如術語、架構、編程模型、編程指南、基本的datastream api用法、四大基石等內容。 3、

    2024年02月04日
    瀏覽(25)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包