2024-01-21 分類: 網站建設
我們目前主流的服務端系統都是分布式的架構。業務分布在不同的機器節點上產生數據,數據也存儲在不同的機器節點。為了方便標識數據,我們使用 唯一且有序 的ID來標識數據。即:
整個分布式系統中,新生成的ID永遠不會產生與之前已經生成的ID重復;
生成的所有ID可以根據生成的時間進行排序(生成時間晚的排序順序靠后)
我們來看一下市面上的幾種主流的ID生成方案。
一、Mysql 集群
由于我們的討論前提是分布式架構的系統,所以這里的 Mysql 我們默認是集群版。
眾所周知,Mysql 有自帶的唯一ID機制,即自增主鍵,可以保證在同一個數據庫中,表內生成的每一條記錄都是唯一且有序的。
但是如果放在分布式系統里面,我們用分庫/分表的架構存儲記錄,那就會導致在系統中產生重復的ID。
如下圖,表1 2 3都是存儲相同記錄的不同表(可以在同一個數據庫里,也可以在不同數據庫里),表1 2 3都會產生id相同的數據。
為了解決這個問題,mysql 官方支持數據庫 ID 生成時設置步長,可以保證不同數據庫中相同表的id唯一性。
如上圖,每個表都有 不同的起始id和相同的步長 ,這就能保證業務記錄Id的唯一性。
設置步長的方案雖然解決了id生成的唯一性,但是也有很大的缺點
不能保證ID的有序性和時間的強相關。(由于是分布式系統,不能保證id=4的數據一定在id=3的數據后面生成)
每次新增加一個節點,要重置所有節點的起始值和步長。
第二點只是數據庫管理會麻煩一些,但是第一點不能滿足我們對有序性的要求。
二、ID數據庫
這里泛指一套單獨維護的ID數據庫,目的是為了保證業務系統內所有的ID的唯一性和有序性。
舉幾個例子,比如Mysql維護一條表記錄,Redis 維護一個key,zookeeper 維護一個序列號。當所有業務都通過調用這些存儲服務來生成+獲取唯一ID的時候,就可以保證生成Id的唯一性和有序性。
缺點:
需要資源單獨維護一個服務
如果ID數據庫掛掉,整個業務就會停擺。如果ID數據庫出現數據錯亂,可能會影響到唯一性和有序性
總結一下就是,ID數據庫可以提供唯一有序的ID,但是有一定的維護成本且系統的風險很高。
三、雪花算法
SnowFlake是Twitter公司采用的一種算法,目的是在分布式系統中產生 全局唯一且整體遞增 的ID。
3.1 生成ID的結構
3.2 生成原理
我們先看一下雪花ID的生成過程:
生成毫秒級別的時間戳,填充到 41bit 的位置
序列號默認為 000000000000 。如果 新生成的時間戳上次生成的相等 ,序列號就會 + 1。將序列號填充到 12bit 位置
存儲當前生成的時間戳到內存中,以便下次生成時判斷
獲取到當前機器+進程的唯一標識,填充到 10bit 的位置
通過上述整個流程我們可以看到,雪花算法可以確保唯一性,單機內在同一毫秒生成的ID會有序列號的遞增,多機環境在同一毫秒生成的ID會有機器+進程的唯一標識。
但是無法保證強有序性,比如多個機器在同一毫秒內生成的ID,就無法按照時間規則進行排序
3.3 缺點
雪花算法除了無法實現嚴格按照時間的有序性之外,還有一個可能存在的風險點,就是 單機時鐘回撥 。
如果一個機器之前已經生成過ID,將機器的時間改為之前的時間,那么就有一定幾率會生成與之前相同的ID。
四、mongoDB 的唯一ID生成策略
mongo唯一ID生成策略——ObjectId,和雪花算法相似度極高。區別在于雪花算法要占用64個字節,而 ObjectId 只需要占用 12個字節,但是objectId只能存儲秒級別時間戳。
ObjectId如果用字符串表示則有24個字符,但實際上它是由一組十六進制的字符構成,每個字節兩位的十六進制數字,總共用了12字節的存儲空間。
比如:6331500a7cac81af7136236b 這個ID
秒級時間戳
機器碼
進程的pid
序號
mongoDB 的 ObjectId 和雪花算法一樣,無法實現嚴格按照時間的有序性,并且由于是秒級別的時間戳,所以不同機器生成的ID,不按照時間排序的可能性會大很多。而且如果單機時鐘回撥,也會產生與之前重復的ID。
總結
特性/方案 | Mysql 集群 | ID數據庫 | 雪花算法 | mongoDB ObjectId |
---|---|---|---|---|
唯一性 | :white_check_mark: | :white_check_mark: | :white_check_mark: | :white_check_mark: |
按照生成時間的有序性 | :x: | :white_check_mark: | :x: | :x: |
維護的難易程度 | 難 | 較難 | 易維護 | 易維護 |
在分布式系統中:
以上四種方案都可以保證生成ID的唯一性
如果并發量很小的系統,可以考慮 雪花算法/mongoDB ObjectId 方案來保證有序性
如果并發量很大,只能用ID數據庫來保證有序性,但是會比 雪花算法/mongoDB ObjectId 方案增加維護成本?
網站標題:mysql多條數據存到不同表id唯一分布式系統中的唯一ID生成
地址分享:http://newbst.com/news10/314710.html
成都網站建設公司_創新互聯,為您提供關鍵詞優化、軟件開發、網站設計公司、面包屑導航、網站排名、靜態網站
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯
猜你還喜歡下面的內容