免费观看又色又爽又黄的小说免费_美女福利视频国产片_亚洲欧美精品_美国一级大黄大色毛片

Bitcask模型是什么-創新互聯

今天就跟大家聊聊有關Bitcask模型是什么,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。

專注于為中小企業提供成都網站制作、成都做網站、外貿營銷網站建設服務,電腦端+手機端+微信端的三站合一,更高效的管理,為中小企業高州免費做網站提供優質的服務。我們立足成都,凝聚了一批互聯網行業人才,有力地推動了1000+企業的穩健成長,幫助中小企業通過網站建設實現規模擴充和轉變。

Bitcask是一個日志型的基于hash表結構和key-value存儲模型,但是其簡潔有效的設計。下面創新互聯網站建設公司,小編來講解下Bitcask模型是什么?

Bitcask模型是什么

1.日志型的數據文件

何謂日志型?就是appendonly,所有寫操作只追加而不修改老的數據,就像我們的各種服務器日志一樣。在Bitcask模型中,數據文件以日志型只增不減的寫入文件,而文件有一定的大小限制,當文件大小增加到相應的限制時,就會產生一個新的文件,老的文件將只讀不寫。在任意時間點,只有一個文件是可寫的,在Bitcask模型中稱其為activedatafile,而其他的已經達到限制大小的文件,稱為olderdatafile,如下圖:

文件中的數據結構非常簡單,是一條一條的數據寫入操作,每一條數據的結構如下:

上面數據項分別為key,value,key的大小,value的大小,時間戳(應該是),以及對前面幾項做的crc校驗值。(數據刪除操作也不會刪除舊的條目,而是將value設定為一個特殊的值以作標示)

數據文件中就是連續一條條上面格式的數據,如下圖:

好了,上面是日志型的數據文件,如果數據文件這樣持續的存下去,肯定是會無限膨脹的,為了解決個問題,和其他日志型存儲系統一樣Bitcask也有一個定期的merge操作。

merge操作,即定期將所有olderdatafile中的數據掃描一遍并生成新的datafile(沒有包括activedatafile是因為它還在不停寫入),這里的merge其實就是將對同一個key的多個操作以只保留新一個的原則進行刪除。每次merge后,新生成的數據文件就不再有冗余數據了。

Bitcask模型是什么

2.基于hash表的索引數據

上面講到的是數據文件,日志類型的數據文件會讓我們的寫入操作非常快(日志型的優勢之一是將磁盤當作磁帶,進行順序讀寫的效率非常高,可以參見這里),而如果在這樣的日志型數據上進行key值查找,那將是一件非常低效的事情。于是我們需要使用一些方法來提高查找效率。

例如在Bigtable中,使用bloom-filter算法為每一個數據文件維護一個bloom-filter的數據塊,以此來判定一個值是否在某一個數據文件中。

而在Bitcask模型中,我們使用了另一種方法,使用了一個基于hash表的索引數據結構。

在Bitcask模型中,除了存儲在磁盤上的數據文件,還有另外一塊數據,那就是存儲在內存中的hash表,hash表的作用是通過key值快速的定位到value的位置。hash表的結構大致如下圖所示:

hash表對應的這個結構中包括了三個用于定位數據value的信息,分別是文件id號(file_id),value值在文件中的位置(value_pos),value值的大小(value_sz),于是我們通過讀取file_id對應文件的value_pos開始的value_sz個字節,就得到了我們需要的value值。整個過程如下圖所示:

由于多了一個hash表的存在,我們的寫操作就需要多更新一塊內容,即這個hash表的對應關系。于是一個寫操作就需要進行一次順序的磁盤寫入和一次內存操作。

3.有用的hintfile

至此,Bitcask模型基本上已經講述完成,而這一節講到的hintfile,則是一個有用的技巧,本人認為并不一定是Bitcask模型的必須特性。

從上面我們可以知道,我們稱其為索引的hash表,是存儲在內存中的,雖然在各自的實現中可以做一些持久化的保證,但是Bitcask模型中并不對在斷電或重啟后的hash表數據不丟失做出保證。

因此,如果我們不做額外的工作,那么我們啟動時重建hash表時,就需要整個掃描一遍我們的數據文件,如果數據文件很大,這將是一個非常耗時的過程。因此Bitcask模型中包含了一個稱作hintfile的部分,目的在于提高重建hash表的速度。

我們上面講到在olddatafile進行merge操作時,會產生新的datafile,而Bitcask模型實際還鼓勵生成一個hintfile,這個hintfile中每一項的數據結構,與datafile中的數據結構非常相似,不同的是他并不存儲具體的value值,而是存儲value的位置(像在hash表中的一樣),其結構如下圖:

這樣,在重建hash表時,就不需要再掃描所有datafile文件,而僅僅需要將hintfile中的數據一行行讀取并重建即可。大大提高了利用數據文件重啟數據庫的速度。

看完上述內容,你們對Bitcask模型是什么有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注創新互聯行業資訊頻道,感謝大家的支持。

本文題目:Bitcask模型是什么-創新互聯
轉載注明:http://newbst.com/article46/dipeeg.html

成都網站建設公司_創新互聯,為您提供手機網站建設定制網站域名注冊網站收錄移動網站建設App設計

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

搜索引擎優化