- 實時數(shù)倉中,為什么沒有零點漂移問題?
- 因為flink直接取的事件時間
- 用kafka是為了速度快,并且數(shù)據(jù)不丟,那為什么既用了kafkachannel,也用了kafka,而不只用kafkachannel呢?
- 因為需要削峰填谷
- 離線數(shù)倉中,為什么用兩個flume,一個kafka,直接用taildirsource,kafkachannel,hdfssink不行嗎?
- 不行
- kafka可以削峰填谷
- 如果用kafkachannel,那么數(shù)據(jù)寫到kafka,只剩event,沒有header,無法解決零點漂移問題,而多加一個flume,可以在kafkasource中添加攔截器。
文章來源地址http://www.zghlxwxcb.cn/news/detail-622910.html
文章來源:http://www.zghlxwxcb.cn/news/detail-622910.html
到了這里,關(guān)于離線數(shù)倉中,為什么用兩個flume,一個kafka的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!