国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<address id="xmxep"><tr id="xmxep"></tr></address>

Kafka-消費者-Consumer Group Rebalance設(shè)計

2年前作者：Andy技術(shù)支援分類：Toy博客閱讀(28)違法舉報

這篇具有很好參考價值的文章主要介紹了Kafka-消費者-Consumer Group Rebalance設(shè)計。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

在同一個Consumer Group中，同一個Topic的不同分區(qū)會分配給不同的消費者進行消費，那么為消費者分配分區(qū)的操作是在Kafka服務(wù)端完成的嗎?分區(qū)是如何進行分配呢?下面來分析Rebalance操作的原理。

方案一

Kafka最開始的解決方案是通過ZooKeeper的Watcher實現(xiàn)的。

每個Consumer Group在ZooKeeper下都維護了一個“/consumers/[group_id]/ids”路徑，在此路徑下使用臨時節(jié)點記錄屬于此Consumer Group的消費者的Id,由Consumer啟動時創(chuàng)建。

還有兩個與ids節(jié)點同級的節(jié)點，它們分別是：
owners節(jié)點，記錄了分區(qū)與消費者的對應(yīng)關(guān)系；
offsets節(jié)點，記錄了此Consumer Group在某個分區(qū)上的消費位置。

每個Broker、Topic以及分區(qū)在ZooKeeper中也都對應(yīng)一個路徑，如下所示。

/brokers/ids/broker_id:記錄了host、port以及分配在此Broker上的Topic的分區(qū)列表。
/brokers/topics/[topic_name]:記錄了每個Partition的Leader、ISR等信息。
/brokers/topics/[topic_name]/partitions/[partition_num]/state:記錄了當前Leader、選舉epoch等信息
路徑圖如圖所示。

Kafka-消費者-Consumer Group Rebalance設(shè)計,隊列,kafka,分布式
每個Consumer都分別在“/consumers/[group_id]/ids”和“brokers/ids”路徑上注冊一個Watcher。

當“/consumers/[group_id]/ids”路徑的子節(jié)點發(fā)生變化時，表示ConsumerGroup中的消費者出現(xiàn)了變化；

當“/brokers/ids”路徑的子節(jié)點發(fā)生變化時，表示Broker出現(xiàn)了增減。
這樣，通過Watcher,每個消費者就可以監(jiān)控Consumer Group和Kafka集群的狀態(tài)了。

這個方案看上去不錯，但是嚴重依賴于ZooKeeper集群，有兩個比較嚴重的問題：

羊群效應(yīng)(Herd Effect):先解釋一下什么是“羊群效應(yīng)”,一個被Watch的ZooKeeper節(jié)點變化，導致大量的Watcher通知需要被發(fā)送給客戶端，這將導致在通知期間其他操作延遲。

一般出現(xiàn)這種情況的主要原因就是沒有找到客戶端真正的關(guān)注點，也算是濫用Watcher的一種場景。
繼續(xù)前面的分析，任何Broker或Consumer加入或退出，都會向其余所有的Consumer發(fā)送Watcher通知觸發(fā)Rebalance,就出現(xiàn)了“羊群效應(yīng)”。
腦裂(Split Brain):每個Consumer都是通過ZooKeeper中保存的這些元數(shù)據(jù)判斷Consumer Group狀態(tài)、Broker的狀態(tài)以及Rebalance結(jié)果的，由于ZooKeeper只保證“最終一致性”,不保證“Simultaneously Consistent Cross-Client Views”,不同Consumer在同一時刻可能連接到ZooKeeper集群中不同的服務(wù)器，看到的元數(shù)據(jù)就可能不一樣，這就會造成不正確的Rebalance嘗試。

方案二

由于上述兩個原因，Kafka的后續(xù)版本對Rebalance操作進行了改進，也對消費者進行了重新設(shè)計。

其核心設(shè)計思想是：將全部的Consumer Group分成多個子集，每個Consumer Group子集在服務(wù)端對應(yīng)一個GroupCoordinator對其進行管理，GroupCoordinator是KafkaServer中用于管理Consumer Group的組件，消費者不再依賴ZooKeeper,而只有GroupCoordinator在ZooKeeper上添加Watcher。

消費者在加入或退出Consumer Group時會修改ZooKeeper中保存的元數(shù)據(jù)，這點與上文描述的方案一類似，此時會觸發(fā)GroupCoordinator設(shè)置的Watcher,通知GroupCoordinator開始Rebalance操作。

下面簡述這個過程：

當前消費者準備加入某Consumer Group或是GroupCoordinator發(fā)生故障轉(zhuǎn)移時，消費者并不知道GroupCoordinator的網(wǎng)絡(luò)位置，消費者會向Kafka集群中的任一Broker發(fā)送ConsumerMetadataRequest,此請求中包含了其Consumer Group的Groupld,收到請求的Broker會返回ConsumerMetadataResponse作為響應(yīng)，其中包含了管理此ConsumerGroup的GroupCoordinator的相關(guān)信息。
消費者根據(jù)ConsumerMetadataResponse中的GroupCoordinator信息，連接到GroupCoordinator并周期性地發(fā)送HeartbeatRequest,HeartbeatRequest的具體格式在后面會詳細介紹。

發(fā)送HeartbeatRequest的主要作用是為了告訴GroupCoordinator此消費者正常在線，GroupCoordinator會認為長時間未發(fā)送HeartbeatRequest的消費者已經(jīng)下線，觸發(fā)新一輪的Rebalance操作。
如果HeartbeatResponse中帶有IllegalGeneration異常，說明GroupCoordinator發(fā)起了Rebalance操作，此時消費者發(fā)送JoinGroupRequest(具體格式在后面介紹)給GroupCoordinator,JoinGroupRequest的主要目的是為了通知GroupCoordinator,當前消費者要加入指定的Consumer Group。

之后，GroupCoordinator會根據(jù)收到的JoinGroupRequest和ZooKeeper中的元數(shù)據(jù)完成對此Consumer Group的分區(qū)分配。
GroupCoordinator會在分配完成后，將分配結(jié)果寫入ZooKeeper保存，并通過JoinGroupResponse返回給消費者。消費者就可以根據(jù)JoinGroupResponse中分配的分區(qū)開始消費數(shù)據(jù)。
消費者成功成為Consumer Group的成員后，會周期性發(fā)送HeartbeatRequest。如果HeartbeatResponse包含IlegalGeneration異常，則執(zhí)行步驟3。如果找不到對應(yīng)的GroupCoordinator(HeartbeatResponse包含NotCoordinatorForGroup異常),則周期性地執(zhí)行步驟1,直至成功。

這里只是簡略地描述此方案的步驟，整個方案還是有點復(fù)雜的，其中比較嚴謹?shù)孛枋隽讼M者和GroupCoordinator的狀態(tài)圖和各個階段可能發(fā)生的故障以及故障轉(zhuǎn)移處理，本文重點關(guān)注Consumer Group Rebalance方面。

上面這種方案雖然解決了“羊群效應(yīng)”、“腦裂”問題，但是還是有兩個問題：

分區(qū)分配的操作是在服務(wù)端的GroupCoordinator中完成的，這就要求服務(wù)端實現(xiàn)Partition的分配策略。當要使用新的Partition分配策略時，就必須修改服務(wù)端的代碼或配置，之后重啟服務(wù)，這就顯得比較麻煩。
不同的Rebalance策略有不同的驗證需求。當需要自定義分區(qū)分配策略和驗證需求時，就會很麻煩。

方案三

為了解決上述問題，Kafka進行了重新設(shè)計，將分區(qū)分配的工作放到了消費者這一端進行處理，而Consumer Group管理的工作則依然由GroupCoordinator處理。

這就讓不同的模塊關(guān)注不同的業(yè)務(wù)，實現(xiàn)了業(yè)務(wù)的切分和解耦，這種思想在設(shè)計時很重要。

重新設(shè)計后的協(xié)議在上一版本的協(xié)議上進行了修改，將JoinGroupRequest的處理過程拆分成了兩個階段，分別是Join Group階段和Synchronizing Group State階段。

當消費者查找到管理當前Consumer Group的GroupCoordinator后，就會進入Join Group階段，Consumer首先向GroupCoordinator發(fā)送JoinGroupRequest請求，其中包含消費者的相關(guān)信息；

服務(wù)端的GroupCoordinator收到JoinGroupRequest后會暫存消息，收集到全部消費者之后，根據(jù)JoinGroupRequest中的信息來確定Consumer Group中可用的消費者，從中選取一個消費者成為Group Leader,還會選取使用的分區(qū)分配策略，最后將這些信息封裝成JoinGroupResponse返回給消費者。

雖然每個消費者都會收到JoinGroupResponse,但是只有Group Leader收到的JoinGroupResponse中封裝了所有消費者的信息。

當消費者確定自己是Group Leader后，會根據(jù)消費者的信息以及選定的分區(qū)分配策略進行分區(qū)分配。

在Synchronizing Group State階段，每個消費者會發(fā)送SyncGroupRequest到GroupCoordinator,但是只有Group Leader的SyncGroupRequest請求包含了分區(qū)的分配結(jié)果，GroupCoordinator根據(jù)Group Leader的分區(qū)分配結(jié)果，形成SyncGroupResponse返回給所有Consumer。

消費者收到SyncGroupResponse后進行解析，即可獲取分配給自身的分區(qū)。

最后，我們來了解消費者的狀態(tài)轉(zhuǎn)移與各請求之間的關(guān)系，如圖所示。

Kafka-消費者-Consumer Group Rebalance設(shè)計,隊列,kafka,分布式文章來源地址http://www.zghlxwxcb.cn/news/detail-802914.html

到了這里，關(guān)于Kafka-消費者-Consumer Group Rebalance設(shè)計的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔相關(guān)法律責任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

【工作中問題解決實踐十一】Kafka消費者消費堆積且頻繁rebalance
最近有點不走運，老是遇到基礎(chǔ)服務(wù)的問題，還是記著點兒解決方法，以后再遇到快速解決吧，今天遇到這個問題倒不算緊急，但也能通過這個問題熟悉一下Kafka的配置。正在開會的時候突然收到一連串的報警，趕忙看看是為啥沒過一會兒基礎(chǔ)服務(wù)報警也來了 Kafka 自身的異
2024年02月13日
瀏覽(27)
flink kafka消費者如何處理kafka主題的rebalance
我們?nèi)粘Ｊ褂胟afka客戶端消費kafka主題的消息時，當消費者退出/加入消費者組，kafka主題分區(qū)數(shù)有變等事件發(fā)生時，都會導致rebalance的發(fā)生，此時一般情況下，如果我們不自己處理offset，我們不需要理會這個rebalance的，當rebalance完成后，每個消費者會從__consumer_offsets中獲取每個
2024年02月14日
瀏覽(27)
分布式 - 消息隊列Kafka：Kafka消費者分區(qū)再均衡(Rebalance)
01. Kafka 消費者分區(qū)再均衡是什么？消費者群組里的消費者共享主題分區(qū)的所有權(quán)。當一個新消費者加入群組時，它將開始讀取一部分原本由其他消費者讀取的消息。當一個消費者被關(guān)閉或發(fā)生崩潰時，它將離開群組，原本由它讀取的分區(qū)將由群組里的其他消費者讀取。分區(qū)
2024年02月12日
瀏覽(31)
kafka-consumer-消費者代碼實例
目錄 1 消費一個主題 2 消費一個分區(qū) 3 消費者組案例消費topic為first的消息。應(yīng)用場景：當生產(chǎn)者將所有消息發(fā)往特定的某個主題分區(qū)。消費first主題0號分區(qū)代碼：測試同一個主題的分區(qū)數(shù)據(jù)，只能由一個消費者組中的一個消費者進行消費。創(chuàng)建三個消費者對某一分區(qū)進行
2024年02月11日
瀏覽(20)
保障效率與可用，分析Kafka的消費者組與Rebalance機制
上手第一關(guān)，手把手教你安裝kafka與可視化工具kafka-eagle Kafka是什么，以及如何使用SpringBoot對接Kafka 架構(gòu)必備能力——kafka的選型對比及應(yīng)用場景 Kafka存取原理與實現(xiàn)分析，打破面試難關(guān) 防止消息丟失與消息重復(fù)——Kafka可靠性分析及優(yōu)化實踐我們上一期從可靠性分析了消息
2024年02月06日
瀏覽(18)
kafka-consumer-groups.sh消費者組管理
??先調(diào)用 MetadataRequest 拿到所有在線Broker列表再給每個Broker發(fā)送 ListGroupsRequest 請求獲取消費者組數(shù)據(jù)。查看指定消費組詳情 --group 查看所有消費組詳情 --all-groups 查詢消費者成員信息 --members 查詢消費者狀態(tài)信息 --state 刪除指定消費組 --group 刪除所有消費組 --all-groups 想要
2024年02月03日
瀏覽(39)
Kafka 架構(gòu)深度解析：生產(chǎn)者（Producer）和消費者（Consumer）
Apache Kafka 作為分布式流處理平臺，其架構(gòu)中的生產(chǎn)者和消費者是核心組件，負責實現(xiàn)高效的消息生產(chǎn)和消費。本文將深入剖析 Kafka 架構(gòu)中生產(chǎn)者和消費者的工作原理、核心概念以及高級功能。 1 發(fā)送消息到 Kafka Kafka 生產(chǎn)者負責將消息發(fā)布到指定的主題。以下是一個簡單的生
2024年02月03日
瀏覽(50)
kafka消費者的group id從哪里獲取
今天跑了一下kafka的示例demo，突然意識到一個問題。消費者拉取broker的消息時需要指定group id，而生產(chǎn)者將消息發(fā)送到broker的時候并不會指定group id，那么消費者的group id從哪里獲取呢？查閱我的這篇文章?kafka消費者?的3.1小節(jié)，如果不配置該參數(shù)，則會拋出異常。為此，筆
2024年02月11日
瀏覽(16)
Kafka 消費者“group_name”組正在永遠重新平衡
前些天發(fā)現(xiàn)了一個巨牛的人工智能學習網(wǎng)站，通俗易懂，風趣幽默，忍不住分享一下給大家。點擊跳轉(zhuǎn)到網(wǎng)站。卡夫卡：2.11-1.0.1。主題：并發(fā)度為 5 且分區(qū)為 5 。當應(yīng)用程序重新啟動并且在分區(qū)分配之前在主題上發(fā)布消息時，主題的 5 個消費者找到組協(xié)調(diào)器并向組協(xié)調(diào)器發(fā)
2024年02月11日
瀏覽(14)
kafka Consumer 消費者使用多線程并發(fā)執(zhí)行，并保證順序消費，第一種使用純線程方式、第二種使用Executors線程池
網(wǎng)上搜索kafka消費者通過多線程進行順序消費的內(nèi)容都不太理想，或者太過復(fù)雜，所以自己寫了幾個demo，供大家參考指正。 ????????單個消費者，每秒需要處理1000條數(shù)據(jù)，每條數(shù)據(jù)的處理時間為500ms，相同accNum（客戶賬號）的數(shù)據(jù)需要保證消費的順序。 1、如果1秒鐘生產(chǎn)
2024年02月15日
瀏覽(22)

<kbd id="mazvk"><sup id="mazvk"></sup></kbd>

<kbd id="mazvk"></kbd>

<address id="mazvk"><input id="mazvk"></input></address>

<thead id="mazvk"></thead>