簡介
經(jīng)常聽到有人說磁盤很慢、網(wǎng)絡(luò)很卡,這都是站在人類的感知維度去表述的,比如拷貝一個(gè)文件到硬盤需要幾分鐘到幾十分鐘,夠我去吃個(gè)飯啦;而從網(wǎng)絡(luò)下載一部電影,有時(shí)候需要幾個(gè)小時(shí),我都可以睡一覺了。
最為我們熟知的關(guān)于計(jì)算機(jī)不同組件速度差異的圖表,是下面這種金字塔形式:越往上速度越快,容量越小,而價(jià)格越高。這張圖只是給了我們一個(gè)直觀地感覺,并沒有對(duì)各個(gè)速度和性能做出量化的說明和解釋。而實(shí)際上,不同層級(jí)之間的差異要比這張圖大的多。這篇文章就讓你站在 CPU 的角度看這個(gè)世界,說說到底它們有多慢。
希望你看到看完這篇文章能明白兩件事情:磁盤和網(wǎng)絡(luò)真的很慢,性能優(yōu)化是個(gè)復(fù)雜的系統(tǒng)性的活。
注:所有的數(shù)據(jù)都是來自這個(gè)地址。所有的數(shù)據(jù)會(huì)因?yàn)闄C(jī)器配置不同,或者硬件的更新而有出入,但是不影響我們直覺的感受。如果對(duì)這些數(shù)據(jù)比較感興趣,這個(gè)網(wǎng)址給出了不同年份一些指標(biāo)的數(shù)值。
數(shù)據(jù)
先來看看 CPU 的速度,就拿我的電腦來說,主頻是 2.6G,也就是說每秒可以執(zhí)行2.6*10^9個(gè)指令,每個(gè)指令只需要0.38ns(現(xiàn)在很多個(gè)人計(jì)算機(jī)的主頻要比這個(gè)高,配置比較高的能達(dá)到 3.0G+)。我們把這個(gè)時(shí)間當(dāng)做基本單位1s,因?yàn)?s大概是人類能感知的最小時(shí)間單位。
一級(jí)緩存讀取時(shí)間為0.5ns,換算成人類時(shí)間大約是1.3s,大約一次或者兩次心跳的時(shí)間。這里能看出緩存的重要性,因?yàn)樗乃俣瓤梢在s上 CPU,程序本身的 locality 特性加上指令層級(jí)上的優(yōu)化,cache 訪問的命中率很高,這最終能極大提高效率。
分支預(yù)測(cè)錯(cuò)誤需要耗時(shí)5ns,換算成人類時(shí)間大約是13s,這個(gè)就有點(diǎn)久了,所以你會(huì)看到很多文章分析如何優(yōu)化代碼來降低分支預(yù)測(cè)的幾率,比如這個(gè)得分非常高的 stackoverflow 問題。
二級(jí)緩存時(shí)間就比較久了,大約在7ns,換算成人類時(shí)間大約是18.2s,可以看到的是如果一級(jí)緩存沒有命中,然后去二級(jí)緩存讀取數(shù)據(jù),時(shí)間差了一個(gè)數(shù)量級(jí)。
小知識(shí):為什么需要多層的 CPU 緩存呢?這篇文章通過一個(gè)通俗易懂的例子給出了講解。
我們繼續(xù),互斥鎖的加鎖和解鎖時(shí)間需要25ns,換算成人類時(shí)間大約是65s,首次達(dá)到了一分鐘。并發(fā)編程中,我們經(jīng)常聽說鎖是一個(gè)很耗時(shí)的東西,因?yàn)樵?a target="_blank">微波爐里加熱一個(gè)東西需要一分鐘的話,你要在那傻傻地等蠻久了。
然后就到了內(nèi)存,每次內(nèi)存尋址需要100ns,換算成人類時(shí)間是260s,也就是4分多鐘,如果讀一些不需要太多思考的文章,這么久能讀完2-3千字(這個(gè)快閱讀的時(shí)代,很少人在手機(jī)上能靜心多這么字了)??雌饋磉€不算壞,不多要從內(nèi)存中讀取一段數(shù)據(jù)需要的時(shí)間會(huì)更多。到了內(nèi)存之后,時(shí)間就變了一個(gè)量級(jí),CPU 和內(nèi)存之間的速度瓶頸被稱為馮諾依曼瓶頸。
一次 CPU 上下文切換(系統(tǒng)調(diào)用)需要大約1500ns,也就是1.5us(這個(gè)數(shù)字參考了這篇文章,采用的是單核 CPU 線程平均時(shí)間),換算成人類時(shí)間大約是65分鐘,嗯,也就是一個(gè)小時(shí)。我們也知道上下文切換是很耗時(shí)的行為,畢竟每次浪費(fèi)一個(gè)小時(shí),也很讓人有罪惡感的。上下文切換更恐怖的事情在于,這段時(shí)間里 CPU 沒有做任何有用的計(jì)算,只是切換了兩個(gè)不同進(jìn)程的寄存器和內(nèi)存狀態(tài);而且這個(gè)過程還破壞了緩存,讓后續(xù)的計(jì)算更加耗時(shí)。
在 1Gbps 的網(wǎng)絡(luò)上傳輸 2K 的數(shù)據(jù)需要20us,換算成人類時(shí)間是14.4小時(shí),這么久都能把《星球大戰(zhàn)》六部曲看完了(甚至還加上吃飯撒尿的時(shí)間)!可以看到網(wǎng)絡(luò)上非常少數(shù)據(jù)傳輸對(duì)于 CPU 來說,已經(jīng)很漫長。而且這里的時(shí)間還是理論最大值,實(shí)際過程還要更慢一些。
SSD 隨機(jī)讀取耗時(shí)為150us,換算成人類時(shí)間大約是4.5天。換句話說,SSD 讀點(diǎn)數(shù)據(jù),CPU 都能休假,報(bào)團(tuán)參加周邊游了。雖然我們知道 SSD 要比機(jī)械硬盤快很多,但是這個(gè)速度對(duì)于 CPU 來說也是像烏龜一樣。I/O 設(shè)備從硬盤開始速度開始變得漫長,這個(gè)時(shí)候我們就想起內(nèi)存的好處了。盡量減少 IO 設(shè)備的讀寫,把最常用的數(shù)據(jù)放到內(nèi)存中作為緩存是所有程序的通識(shí)。像memcached和redis這樣的高速緩存系統(tǒng)近幾年的異軍突起,就是解決了這里的問題。
從內(nèi)存中讀取1MB的連續(xù)數(shù)據(jù),耗時(shí)大約為250us,換算成人類時(shí)間是7.5天,這次假期升級(jí)到國慶七天國外游了。
同一個(gè)數(shù)據(jù)中心網(wǎng)絡(luò)上跑一個(gè)來回需要0.5ms,換算成人類時(shí)間大約是15天,也就是半個(gè)月的時(shí)間。如果你的程序有段代碼需要和數(shù)據(jù)中心的其他服務(wù)器交互,在這段時(shí)間里 CPU 都已經(jīng)狂做了半個(gè)月的運(yùn)算。減少不同服務(wù)組件的網(wǎng)絡(luò)請(qǐng)求,是性能優(yōu)化的一大課題。
從 SSD 讀取 1MB 的順序數(shù)據(jù),大約需要1ms,換算成人類時(shí)間是1個(gè)月。也就是說 SSD 讀一個(gè)普通的文件,如果要等你做完,CPU 一個(gè)月時(shí)間就荒廢了。盡管如此,SSD已經(jīng)很快啦,不信你看下面機(jī)械磁盤的表現(xiàn)。
磁盤尋址時(shí)間為10ms,換算成人類時(shí)間是10個(gè)月,剛好夠人類創(chuàng)造一個(gè)新的生命了。如果 CPU 需要讓磁盤泡杯咖啡,在它眼里,磁盤去生了個(gè)孩子,回來告訴它你讓我泡的咖啡好了。機(jī)械硬盤使用RPM(Revolutions Per Minute/每分鐘轉(zhuǎn)速)來評(píng)估磁盤的性能:RPM 越大,平均尋址時(shí)間更短,磁盤性能越好。尋址只是把磁頭移動(dòng)到正確的磁道上,然后才能讀取指定扇區(qū)的內(nèi)容。換句話說,尋址雖然很浪費(fèi)時(shí)間,但其實(shí)它并沒有辦任何的正事(讀取磁盤內(nèi)容)。
從磁盤讀取 1MB 連續(xù)數(shù)據(jù)需要20ms,換算成人類時(shí)間是20個(gè)月。IO 設(shè)備是計(jì)算機(jī)系統(tǒng)的瓶頸,希望讀到這里你能更深切地理解這句話!如果還不理解,不妨想想你在網(wǎng)上買的東西,快遞送了將近兩年,你的心情是怎么樣的。
而從世界上不同城市網(wǎng)絡(luò)上走一個(gè)來回,平均需要150ms(參考世界各地 ping 報(bào)文的時(shí)間),換算成人類時(shí)間是12.5年。不難理解,所有的程序和架構(gòu)都會(huì)盡量避免不同城市甚至是跨國家的網(wǎng)絡(luò)訪問,CDN就是這個(gè)問題的一個(gè)解決方案:讓用戶和最接近自己的服務(wù)器交互,從而減少網(wǎng)絡(luò)上報(bào)文的傳輸時(shí)間。
虛擬機(jī)重啟一次大約要4s時(shí)間,換算成人類的時(shí)間是3百多年。對(duì)于此,我想到了喬布斯要死命優(yōu)化 Mac 系統(tǒng)開機(jī)啟動(dòng)時(shí)間的故事。如果機(jī)器能少重啟而且每次啟動(dòng)能快一點(diǎn),不僅能救人命,也能救 CPU 的命。
物理服務(wù)器重啟一次需要5min,換算成人類時(shí)間是2萬5千年,快趕上人類的文明史了。5 分鐘人類都要等一會(huì)了,更別提 CPU 了,所以沒事不要亂重啟服務(wù)器啊,分分鐘終結(jié)一個(gè)文明的節(jié)奏。
-
硬盤
+關(guān)注
關(guān)注
3文章
1284瀏覽量
57199 -
網(wǎng)絡(luò)
+關(guān)注
關(guān)注
14文章
7486瀏覽量
88544
原文標(biāo)題:讓 CPU 告訴來你硬盤和網(wǎng)絡(luò)到底有多慢!
文章出處:【微信號(hào):mcuworld,微信公眾號(hào):嵌入式資訊精選】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論