日本免费一区二区三区中文,最新免费大片av手机看片不卡,亚洲欧洲日产国码无码app

來源| OSCHINA 社區(qū)

作者 |京東云開發(fā)者-京東物流金越

UUID

UUID（通用唯一識別碼）是由 32 個十六進制數(shù)組成的無序字符串，通過一定的算法計算出來。為了保證其唯一性，UUID 規(guī)范定義了包括網(wǎng)卡 MAC 地址、時間戳、名字空間（Namespace）、隨機或偽隨機數(shù)、時序等元素，以及從這些元素生成 UUID 的算法。一般來說，算法可以保證任何地方產(chǎn)生的任意一個 UUID 都不會相同，但這個唯一性是有限的，只在特定的范圍內(nèi)才能得到保證。 UUID 的一個非常明顯的特點就是本身較長，格式是這樣的：

xxxxxxxx-xxxx-Mxxx-xxxx-xxxxxxxxxxxx
467e8542-2275-4163-95d6-7adc205580a9

其中 M 位置，代表版本號，由于 UUID 的標(biāo)準(zhǔn)實現(xiàn)有 5 個版本，所以只會是 1、2、3、4、5；

各版本介紹

UUID 現(xiàn)有的 5 種版本，是根據(jù)不同的使用場景劃分的，而不是根據(jù)精度，所以 Version5 并不會比 Version1 精度高，在精度上大家都能保證唯一性，重復(fù)的概率近乎于 0。總結(jié)：

使用 UUID，每個人都可以創(chuàng)建不與其它人沖突的唯一值，在所有空間和時間上都可以被視為唯一的標(biāo)識。

UUID 可單機自行生成，且生成速度快，QPS 高，各個語言都有對應(yīng)的生成供直接調(diào)用使用。

如果只是需要生成一個唯一 ID，可以使用 V1 或 V4。v1 基于時間戳和 Mac 地址，這些 ID 有一定的規(guī)律，而且會暴露你的 Mac 地址。v4 是完全隨機 (偽) 的。

如果對于相同的參數(shù)需要輸出相同的 UUID, 你可以使用 V3 或 V5。

Version1: 基于時間戳及 MAC 地址的實現(xiàn)

其中包括了 48 位的 MAC 地址和 60 位的時間戳。且 v1 為了保證唯一性，當(dāng)時間精度不夠時，會使用 13~14 位的 clock sequence 來擴展時間戳，比如：當(dāng) UUID 的生產(chǎn)成速率太快，超過了系統(tǒng)時間的精度。時間戳的低位部分會每增加一個 UUID 就 + 1 的操作來模擬更高精度的時間戳，換句話說，就是當(dāng)系統(tǒng)時間精度無會區(qū)分 2 個 UUID 的時間先后時，為了保證唯一性，會在其中一個 UUID 上 + 1。所以 UUID 重復(fù)的概率幾乎為 0，時間戳加擴展的 clock sequence 一共有 74bits,(2 的 74 次方，約為 1.8 后面加 22 個零), 即在每個節(jié)點下，每秒可產(chǎn)生 1630 億不重復(fù)的 UUID。但由于 v1 中最后的 12 位是網(wǎng)卡的 MAC 地址，會導(dǎo)致隱私問題以及安全問題，這是這個版本 UUID 受到批評的地方。

Version2: DCE 安全的 UUID

DCE（Distributed Computing Environment）安全的 UUID 和基于時間的 UUID 算法相同，但會把時間戳的前 4 位置換為 POSIX 的 UID 或 GID。這個版本的 UUID 在實際中較少用到。

Version3: 5 基于名稱空間和名字

v3 和 v5 都是通過計算 namespace 和名稱的哈希值生成的。不同的點在于 v3 使用的 hash 算法為 MD5，v5 使用 SHA-1。因為算法中沒有不確定的部分，所以當(dāng) namespace 與名稱確定時，得到的 UUID 都是確定唯一的。比如：

$ uuid -n 3 -v3 ns:URL www.jd.com
7e963853-8fce-3085-bb2c-8424745d73a2
7e963853-8fce-3085-bb2c-8424745d73a2
7e963853-8fce-3085-bb2c-8424745d73a2

算法實現(xiàn)中會將 namespace 和輸入?yún)?shù)拼接在一起，計算 hash 結(jié)果，再進行截斷格式化等操作來保證唯一性。

Version4: 基于隨機數(shù)

v4 的 UUID 中 4 位代表版本，2-3 位代表 variant。余下的 122-121 位都是全部隨機的。即有 2 的 122 次方 (5.3 后面 36 個 0) 個 UUID。一個標(biāo)準(zhǔn)實現(xiàn)的 UUID 庫在生成了 2.71 萬億個 UUID 會產(chǎn)生重復(fù) UUID 的可能性也只有 50% 的概率。這相當(dāng)于每秒產(chǎn)生 10 億的 UUID，持續(xù) 85 年，而把這些 UUID 都存入文件，每個 UUID 占 16bytes, 總需要 45EB (exabytes)，比目前最大的數(shù)據(jù)庫 (PB) 還要大很多倍。在 java 中使用 v4：

# java 1.5+ 
# java.util.UUID

for (int i = 0; i < 3; i++) {
String uuid = UUID.randomUUID().toString();
System.out.println(uuid);
}

生成的 UUID 如下：

8bca474b-214d-4ce8-8446-b99f30147f94
c38588cf-a1c4-4758-9d86-b2ee5552ae59
febf5a46-bd1b-43f8-89a8-d5606e5d1ce0

由于這個版本使用非常簡單，因此使用最為廣泛。

SnowFlake 算法

雪花算法，是 Twitter 開源的分布式 ID 生成算法。雪花算法中利用了時間戳，機器 ID，以及同毫秒內(nèi)的不同序列號來保證分布式生成 ID 的唯一性。雪花算法總結(jié) 1. 時間戳在高位，自增序列在低位的特征可以保證整個 ID 的趨勢是遞增有序的。 2. 但由于其依賴機器時鐘，如果機器時鐘回?fù)?，可能會?dǎo)致重復(fù) ID 生成。其在分布式環(huán)境下，每臺機器上的時鐘不可能完全同步，有時候會出現(xiàn)不是全局遞增的情況。 SnowFlake 算法生成 id 的結(jié)果是一個 64bit 大小的整數(shù)，它的結(jié)構(gòu)如下圖：

1bit，不用。二進制中最高位為 1 的都是負(fù)數(shù)，但是我們生成的 id 一般都使用整數(shù)，所以這個最高位固定是 0

41bit，用來記錄時間戳（毫秒）。41 位可以表示 2^{41}-1 個數(shù)字，如果只用來表示正整數(shù)（計算機中正數(shù)包含 0），可以表示的數(shù)值范圍是 0 至 2^{41}-1，也就是說 41 位可以表示 2^{41}-1 個毫秒的值，轉(zhuǎn)化成單位年則是 (2^{41} - 1) / (1000*60*60*24*365) = 69 年。

10bit，用來記錄工作機器 id。可以部署在 2^{10} = 1024 個節(jié)點，包括 5 位 datacenterId 和 5 位 workerId，5 位（bit）可以表示的最大正整數(shù)是 2^{5}-1 = 31，即可以用 0、1、2、3、....、31 這 32 個數(shù)字，來表示不同的 datecenterId 或 workerId。

12 位，序列號，用來記錄同毫秒內(nèi)產(chǎn)生的不同 ID；12bit 可以表示的最大正整數(shù)是 2^{12}-1 = 4095 ，即可以用 0、1、2、3、....4094 這 4095 個數(shù)字，來表示同一機器同一時間截（毫秒) 內(nèi)產(chǎn)生的 4095 個 ID 序號。

有序主鍵 or 隨機主鍵？

使用 UUID 這些隨機 ID 生成算法作為 MySQL 主鍵的生成方案呢？答案是：不可以！眾所周知，當(dāng) MySQL 數(shù)據(jù)表使用 InnoDB 作為存儲引擎時，每一個索引都對應(yīng)一個 B + 樹，若表定義了主鍵（沒有時，MySQL 則會自動生成不可見的自增主鍵），主鍵對應(yīng)的索引就是聚簇索引，表的所有數(shù)據(jù)都存儲在聚簇索引上。索引中鍵值的邏輯順序決定了表中相應(yīng)行的物理順序（索引中的數(shù)據(jù)物理存放地址和索引的順序是一致的）?？梢赃@么理解：只要是索引是連續(xù)的，那么數(shù)據(jù)在存儲介質(zhì)上的存儲位置也是連續(xù)的。基于以上特性，由于自增鍵的值是有序的，插入數(shù)據(jù)時，Innodb 會把每一條記錄都存儲在上一條記錄的后面。當(dāng)達到頁面的最大填充因子時候 (innodb 默認(rèn)的最大填充因子是頁大小的 15/16, 會留出 1/16 的空間留作以后的修改)，會進行如下操作：下一條記錄就會寫入新的頁中，一旦數(shù)據(jù)按照這種順序的方式加載，主鍵頁就會近乎于順序的記錄填滿，提升了頁面的最大填充率，不會有頁的浪費；且由于新插入的行一定會在原有的最大數(shù)據(jù)行下一行，mysql 定位和尋址很快，不會為計算新行的位置而做出額外的消耗。而 UUID 相對于有序的自增 ID，它的值是毫無規(guī)律可言的，新行的主鍵不一定要比之前數(shù)據(jù)主鍵的值大，所以 innodb 無法做到總是把新行插入到索引的最后，而是需要為新行尋找新的合適的位置從而來分配新的空間。這個過程需要做很多額外的操作，而且最終分布散亂的數(shù)據(jù)會導(dǎo)致以下問題：

寫入的目標(biāo)頁很可能已經(jīng)刷新到磁盤上并且從緩存上移除，或者還沒有被加載到緩存中，innodb 在插入之前不得不先找到并從磁盤讀取目標(biāo)頁到內(nèi)存中，這將導(dǎo)致大量的隨機 IO；

因為寫入是亂序的，innodb 不得不頻繁的做頁分裂操作，以便為新的行分配空間，頁分裂導(dǎo)致移動大量的數(shù)據(jù)，一次插入最少需要修改三個頁以上，且由于頻頁分裂，頁會變得稀疏并被不規(guī)則的填充，最終會導(dǎo)致數(shù)據(jù)會有碎片；

在把值載入到聚簇索引 (innodb 默認(rèn)的索引類型) 以后，有時候會需要做一次 OPTIMEIZE TABLE 來重建表并優(yōu)化頁的填充，這將又需要一定的時間消耗。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴