今天就跟大家聊聊有關Bitcask模型是什么,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。
Bitcask是一個日志型的基于hash表結構和key-value存儲模型,但是其簡潔有效的設計。下面創新互聯網站建設公司,小編來講解下Bitcask模型是什么?
Bitcask模型是什么
1.日志型的數據文件
何謂日志型?就是appendonly,所有寫操作只追加而不修改老的數據,就像我們的各種服務器日志一樣。在Bitcask模型中,數據文件以日志型只增不減的寫入文件,而文件有一定的大小限制,當文件大小增加到相應的限制時,就會產生一個新的文件,老的文件將只讀不寫。在任意時間點,只有一個文件是可寫的,在Bitcask模型中稱其為activedatafile,而其他的已經達到限制大小的文件,稱為olderdatafile,如下圖:
文件中的數據結構非常簡單,是一條一條的數據寫入操作,每一條數據的結構如下:
上面數據項分別為key,value,key的大小,value的大小,時間戳(應該是),以及對前面幾項做的crc校驗值。(數據刪除操作也不會刪除舊的條目,而是將value設定為一個特殊的值以作標示)
數據文件中就是連續一條條上面格式的數據,如下圖:
好了,上面是日志型的數據文件,如果數據文件這樣持續的存下去,肯定是會無限膨脹的,為了解決個問題,和其他日志型存儲系統一樣Bitcask也有一個定期的merge操作。
merge操作,即定期將所有olderdatafile中的數據掃描一遍并生成新的datafile(沒有包括activedatafile是因為它還在不停寫入),這里的merge其實就是將對同一個key的多個操作以只保留新一個的原則進行刪除。每次merge后,新生成的數據文件就不再有冗余數據了。
Bitcask模型是什么
2.基于hash表的索引數據
上面講到的是數據文件,日志類型的數據文件會讓我們的寫入操作非常快(日志型的優勢之一是將磁盤當作磁帶,進行順序讀寫的效率非常高,可以參見這里),而如果在這樣的日志型數據上進行key值查找,那將是一件非常低效的事情。于是我們需要使用一些方法來提高查找效率。
例如在Bigtable中,使用bloom-filter算法為每一個數據文件維護一個bloom-filter的數據塊,以此來判定一個值是否在某一個數據文件中。
而在Bitcask模型中,我們使用了另一種方法,使用了一個基于hash表的索引數據結構。
在Bitcask模型中,除了存儲在磁盤上的數據文件,還有另外一塊數據,那就是存儲在內存中的hash表,hash表的作用是通過key值快速的定位到value的位置。hash表的結構大致如下圖所示:
hash表對應的這個結構中包括了三個用于定位數據value的信息,分別是文件id號(file_id),value值在文件中的位置(value_pos),value值的大小(value_sz),于是我們通過讀取file_id對應文件的value_pos開始的value_sz個字節,就得到了我們需要的value值。整個過程如下圖所示:
由于多了一個hash表的存在,我們的寫操作就需要多更新一塊內容,即這個hash表的對應關系。于是一個寫操作就需要進行一次順序的磁盤寫入和一次內存操作。
3.有用的hintfile
至此,Bitcask模型基本上已經講述完成,而這一節講到的hintfile,則是一個有用的技巧,本人認為并不一定是Bitcask模型的必須特性。
從上面我們可以知道,我們稱其為索引的hash表,是存儲在內存中的,雖然在各自的實現中可以做一些持久化的保證,但是Bitcask模型中并不對在斷電或重啟后的hash表數據不丟失做出保證。
因此,如果我們不做額外的工作,那么我們啟動時重建hash表時,就需要整個掃描一遍我們的數據文件,如果數據文件很大,這將是一個非常耗時的過程。因此Bitcask模型中包含了一個稱作hintfile的部分,目的在于提高重建hash表的速度。
我們上面講到在olddatafile進行merge操作時,會產生新的datafile,而Bitcask模型實際還鼓勵生成一個hintfile,這個hintfile中每一項的數據結構,與datafile中的數據結構非常相似,不同的是他并不存儲具體的value值,而是存儲value的位置(像在hash表中的一樣),其結構如下圖:
這樣,在重建hash表時,就不需要再掃描所有datafile文件,而僅僅需要將hintfile中的數據一行行讀取并重建即可。大大提高了利用數據文件重啟數據庫的速度。
看完上述內容,你們對Bitcask模型是什么有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注創新互聯行業資訊頻道,感謝大家的支持。
本文題目:Bitcask模型是什么-創新互聯
轉載注明:http://newbst.com/article46/dipeeg.html
成都網站建設公司_創新互聯,為您提供手機網站建設、定制網站、域名注冊、網站收錄、移動網站建設、App設計
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯