Flume會(huì)不會(huì)發(fā)生數(shù)據(jù)重復(fù),解釋說(shuō)明?
會(huì),我們?cè)讷@取Channel批次數(shù)據(jù)的時(shí)候,每個(gè)批次是基于一個(gè)事務(wù)性的,一旦發(fā)生宕機(jī)或者Flume進(jìn)行掛掉,那么就會(huì)回滾,數(shù)據(jù)寫(xiě)入失敗,下次再重啟寫(xiě)入時(shí)候數(shù)據(jù)就重復(fù)
千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)
千鋒學(xué)習(xí)站 | 隨時(shí)隨地免費(fèi)學(xué)
掃一掃進(jìn)入千鋒手機(jī)站
關(guān)注千鋒學(xué)習(xí)站小程序
隨時(shí)隨地免費(fèi)學(xué)習(xí)課程
Flume會(huì)不會(huì)發(fā)生數(shù)據(jù)重復(fù),解釋說(shuō)明?
會(huì),我們?cè)讷@取Channel批次數(shù)據(jù)的時(shí)候,每個(gè)批次是基于一個(gè)事務(wù)性的,一旦發(fā)生宕機(jī)或者Flume進(jìn)行掛掉,那么就會(huì)回滾,數(shù)據(jù)寫(xiě)入失敗,下次再重啟寫(xiě)入時(shí)候數(shù)據(jù)就重復(fù)
hive外部表是使用external關(guān)鍵字并指定一個(gè)hdfs目錄創(chuàng)建的表。hive內(nèi)部表在創(chuàng)建時(shí)會(huì)在對(duì)應(yīng)hive目錄下創(chuàng)建相應(yīng)的文件夾,外部表則以指定文件夾為...詳情>>
2022-09-02 17:21:00Checkpoint是為runtime準(zhǔn)備的,Savepoint 是為用戶(hù)準(zhǔn)備的。Checkpoint 機(jī)制的目標(biāo)在于保證Flink作業(yè)意外崩潰重啟不影響exactly once 準(zhǔn)確性,通...詳情>>
2022-09-02 16:59:22State:指一個(gè)具體的Task/Operator的狀態(tài)。State可以被記錄,在失敗的情況下數(shù)據(jù)還可以恢復(fù),F(xiàn)link中有兩種基本類(lèi)型的State: Keyed State, Op...詳情>>
2022-09-02 16:59:19Flink 內(nèi)部是基于producer-consumer模型來(lái)進(jìn)行消息傳遞的,F(xiàn)link的反壓設(shè)計(jì)也是基于這個(gè)模型。Flink 使用了高效有界的分布式阻塞隊(duì)列,就像 Jav...詳情>>
2022-09-02 16:59:16雖說(shuō)水位線(Watermark)表明早于它的事件不應(yīng)該再出現(xiàn),但是接收到水位線以前的的消息是不可避免的,這就是所謂的遲到事件。實(shí)際上遲到事件是亂...詳情>>
2022-09-02 16:59:00大數(shù)據(jù)kafka常見(jiàn)面試題——如何搭建kafka?
沸大數(shù)據(jù)kafka常見(jiàn)面試題——kafka中如何避免重復(fù)消費(fèi)
熱大數(shù)據(jù)面試題之多種方法創(chuàng)建dataframe
熱大數(shù)據(jù)Hadoop面試題——Hadoop干什么用的?
新大數(shù)據(jù)行業(yè)2年工作經(jīng)驗(yàn)的面試題有哪些?
大數(shù)據(jù)kafka面試題——kafka和flume的區(qū)別是什么?
大數(shù)據(jù)部署Kafka面試題解析:實(shí)時(shí)同步Kafka
大數(shù)據(jù)部署Kafka面試題:Kafka的部署與管理
大數(shù)據(jù)面試中關(guān)于kafka原理的面試題
揭秘大數(shù)據(jù)面試必考面試題:快速掌握關(guān)鍵知識(shí)!