ULID:Universally Unique Lexicographically Sortable Identifier(通用唯一詞典分類標(biāo)識符)
UUID:Universally Unique Identifier(通用唯一標(biāo)識符)
為什么不選擇UUID
UUID 目前有 5 個版本:
版本1:在許多環(huán)境中是不切實際的,因為它需要訪問唯一的,穩(wěn)定的MAC地址,容易被攻擊;
版本2:將版本 1 的時間戳前四位換為 POSIX 的 UID 或 GID,問題同上;
版本3:基于 MD5 哈希算法生成,生成隨機(jī)分布的ID需要唯一的種子,這可能導(dǎo)致許多數(shù)據(jù)結(jié)構(gòu)碎片化;
版本4:基于隨機(jī)數(shù)或偽隨機(jī)數(shù)生成,除了隨機(jī)性外沒有提供其他信息;
版本5:通過 SHA-1 哈希算法生成,生成隨機(jī)分布的ID需要唯一的種子,這可能導(dǎo)致許多數(shù)據(jù)結(jié)構(gòu)碎片化;
這里面常用的就是 UUID4 了,但是,即使是隨機(jī)的,但是也是存在沖突的風(fēng)險。
和 UUID 要么基于隨機(jī)數(shù),要么基于時間戳不同,ULID 是既基于時間戳又基于隨機(jī)數(shù),時間戳精確到毫秒,毫秒內(nèi)有1.21e + 24個隨機(jī)數(shù),不存在沖突的風(fēng)險,而且轉(zhuǎn)換成字符串比 UUID 更加友好。
ULID特性:
ulid()#01ARZ3NDEKTSV4RRFFQ69G5FAV
與UUID的128位兼容性
每毫秒1.21e + 24個唯一ULID
按字典順序(也就是字母順序)排序!
規(guī)范地編碼為26個字符串,而不是UUID的36個字符
使用Crockford的base32獲得更好的效率和可讀性(每個字符5位)
不區(qū)分大小寫
沒有特殊字符(URL安全)
單調(diào)排序順序(正確檢測并處理相同的毫秒)
ULID規(guī)范
以下是在python(ulid-py)中實現(xiàn)的ULID的當(dāng)前規(guī)范。二進(jìn)制格式已實現(xiàn)
01AN4Z07BY79KA1307SR9X4MV3 |----------||----------------| TimestampRandomness 10chars16chars 48bits80bits
組成
時間戳
48位整數(shù)
UNIX時間(以毫秒為單位)
直到公元10889年,空間都不會耗盡。
隨機(jī)性
80位隨機(jī)數(shù)
如果可能的話,采用加密技術(shù)保證隨機(jī)性
排序
最左邊的字符必須排在最前面,最右邊的字符必須排在最后(詞匯順序)。必須使用默認(rèn)的ASCII字符集。在同一毫秒內(nèi),不能保證排序順序
編碼方式
如圖所示,使用了Crockford的Base32。該字母表不包括字母I,L,O和U,以避免混淆和濫用。
0123456789ABCDEFGHJKMNPQRSTVWXYZ
二進(jìn)制布局和字節(jié)順序
組件被編碼為16個八位位組。每個組件都以最高有效字節(jié)在前(網(wǎng)絡(luò)字節(jié)順序)進(jìn)行編碼。
0123 01234567890123456789012345678901 +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |32_bit_uint_time_high| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |16_bit_uint_time_low|16_bit_uint_random| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |32_bit_uint_random| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |32_bit_uint_random| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
應(yīng)用場景
替換數(shù)據(jù)庫自增id,無需DB參與主鍵生成
分布式環(huán)境下,替換UUID,全局唯一且毫秒精度有序
比如要按日期對數(shù)據(jù)庫進(jìn)行分區(qū)分表,可以使用ULID中嵌入的時間戳來選擇正確的分區(qū)分表
如果毫秒精度是可以接受的(毫秒內(nèi)無序),可以按照ULID排序,而不是單獨(dú)的created_at字段
用法(python)
安裝
pipinstallulid-py
創(chuàng)建一個全新的ULID。
時間戳記值(48位)來自 time.time(),精度為毫秒。
隨機(jī)值(80位)來自 os.urandom()。
>>>importulid >>>ulid.new()
根據(jù)現(xiàn)有的128位值(例如UUID)創(chuàng)建新的ULID 。
支持ULID值類型有 int,bytes,str,和UUID。
>>>importulid,uuid >>>value=uuid.uuid4() >>>value UUID('0983d0a2-ff15-4d83-8f37-7dd945b5aa39') >>>ulid.from_uuid(value)
從現(xiàn)有時間戳值(例如datetime對象)創(chuàng)建新的ULID 。
支持時間戳值類型有int,float,str,bytes,bytearray,memoryview,datetime,Timestamp,和ULID
>>>importdatetime,ulid >>>ulid.from_timestamp(datetime.datetime(1999,1,1))
根據(jù)現(xiàn)有的隨機(jī)數(shù)創(chuàng)建一個新的ULID。
支持隨機(jī)值類型有int,float,str,bytes,bytearray,memoryview,Randomness,和ULID。
>>>importos,ulid >>>randomness=os.urandom(10) >>>ulid.from_randomness(randomness) >>>
一旦有了ULID對象,就有多種與之交互的方法。
timestamp()方法將為您提供ULID的前48位的時間戳快照,而randomness()方法將為您提供后80位的隨機(jī)數(shù)快照。
>>>importulid >>>u=ulid.new() >>>u>>>u.timestamp() >>>u.randomness()
審核編輯:劉清
-
二進(jìn)制
+關(guān)注
關(guān)注
2文章
786瀏覽量
41571 -
URL
+關(guān)注
關(guān)注
0文章
139瀏覽量
15299 -
字符串
+關(guān)注
關(guān)注
1文章
575瀏覽量
20471 -
python
+關(guān)注
關(guān)注
55文章
4774瀏覽量
84386 -
UUID
+關(guān)注
關(guān)注
0文章
22瀏覽量
8094
原文標(biāo)題:放棄使用UUID,ULID才是更好的選擇!
文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論