MVCC(Multi Version Consistency Control),簡單地說,是一種通過數據的多版本來解決讀寫一致性問題的解決方案。我們知道 HBase 是會保留多版本的數據的,每次寫入都會產生一個新版本的數據,每次讀取都會默認讀最新版本的數據,那么 HBase 是在并發(fā)請求的場景下是怎么控制這些多版本的呢?下面是對HBase的MVCC多版本并發(fā)機制的具體介紹。
如圖所示,LinkedList 每個元素里面有兩個屬性:
writeNumber:即 Region 級別的事務 ID,每個客戶端請求都會分配一個事務 ID。
completed: 數據寫入是否完成,初始狀態(tài)為 Flase,數據寫入成功后會更新為 True。
客戶端寫入事務請求到達 Region,先寫入到 LinkedList 中,10 是當前事務的 ID,False 表示當前事務還在進行中,數據還不可讀。
Client 將數據寫入 memstore 和 WAL ,寫入完成即可結束事務。
將 completed 更新為 true,表示事務結束。
同時,Client 會按順序遍歷 LinkedList 里的元素,若 completed:true 則將 readPoint 更新到這個位置,說明此處的數據是可讀的,遍歷到 completed:false 則停止。
此時數據寫入還不會返回成功,即事務 10 還是不可讀的狀態(tài),因為需要保證時序,client2 和 3 還在寫事務 7 和 9 沒有完成,當前可讀的數據只到事務 6 的位置。等到 client2 和 3 完成事務并將 readPoint 更新到 10,則事務 10 返回寫入成功,數據可讀。
更多關于大數據培訓的問題,歡迎咨詢千鋒教育在線名師,如果想要了解我們的師資、課程、項目實操的話可以點擊咨詢課程顧問,獲取試聽資格來試聽我們的課程,在線零距離接觸千鋒教育大咖名師,讓你輕松從入門到精通。
注:本文部分文字和圖片來源于網絡,如有侵權,請聯系刪除。版權歸原作者所有!