亚洲欧洲自拍拍偷10p,大屁股喷浆无码

單核環(huán)境y也是0：其中一位非常細(xì)心的讀者針對(duì)這個(gè)多核競爭造成問題的結(jié)論進(jìn)行了驗(yàn)證，親身在單核的環(huán)境ECS上實(shí)驗(yàn)，結(jié)果發(fā)現(xiàn)結(jié)果照樣y=0。

后發(fā)先至：另外一位讀者則給出了一個(gè)更奇怪的現(xiàn)象，兩個(gè)變量中后執(zhí)行的代碼看起來卻先被調(diào)用了。

加個(gè)if問題竟然解了：最后一個(gè)反饋留言最令人崩潰，在代碼中隨便加上個(gè)判斷語句，不但解決了y=0的問題，性能還非常好。

1難道這就是傳說中的亂序執(zhí)行？

先來看以下讀者回復(fù)的代碼：

package main import （“fmt”“sync/atomic”“time”） func main（） {var x int32var y int32 go func（） {for { x = atomic.AddInt32（&x， 1） y = atomic.AddInt32（&y， 1） } }（） time.Sleep（time.Second） fmt.Println（“x=”， x） fmt.Println（“y=”， y）}

在這部分內(nèi)容中，兩個(gè)變量x和y都是由原子操作Automic.Add來保證并發(fā)安全的，但是結(jié)果輸出出來我們可以發(fā)現(xiàn)y竟然比x還大？而且每次運(yùn)行的情況基本都是y更大，只是大多少有所區(qū)別。

x= 49418397y= 49425282成功：進(jìn)程退出代碼 0.

看到這個(gè)輸出結(jié)果，我第一反應(yīng)感覺這是亂序執(zhí)行的衍生現(xiàn)象，因?yàn)閤和y的加1操作彼此是獨(dú)立的，雖然編譯器不會(huì)優(yōu)化執(zhí)行順序，但是在CPU的執(zhí)行層面有可能會(huì)對(duì)于前后無依賴的操作打亂順序執(zhí)行。這樣一來就的確有可能出現(xiàn)后面的操作先執(zhí)行的情況。

但是仔細(xì)一想這樣的說法應(yīng)該并不合理，如果是亂序執(zhí)行的原因，那么上面這段代碼的執(zhí)行結(jié)果肯定不會(huì)每次結(jié)果都是y更大一些，每次執(zhí)行都是y比x更大只能說明代碼是按照一定順序執(zhí)行的，而且目前的CPU指令流水線的預(yù)測功能肯定還沒有牛到能夠完全知曉x與y的值不按照順序提交是沒有作何影響的地步。

2仔細(xì)一看還是多并發(fā)競爭問題

再來看以下代碼，

package main import （“fmt”“sync/atomic”“time”） func main（） {var x int32var y int32 go func（） {for { x = atomic.AddInt32（&x， 1） y = atomic.AddInt32（&y， 1） } }（） time.Sleep（time.Second） x1 ：= x y1 ：= y fmt.Println（“x=”， x1） fmt.Println（“y=”， y1）}

只要把fmt.println之前先把x和y的值拷貝出來到x1與y1，再打印x1與y1的值就基本沒有這個(gè)誤差了。

x= 51061072y= 51061071成功：進(jìn)程退出代碼 0.

這也就是說，fmt.println在執(zhí)行中間，go func中的子gorouine又被調(diào)度了。所以y比x的值大，本質(zhì)又是一個(gè)多并發(fā)的競爭問題。而不是亂序執(zhí)行的原因，只是這個(gè)問題在Go的開發(fā)模式下也是非常隱蔽。

3崩潰了，單核怎么也是0

再說第二個(gè)令人崩潰的讀者反饋，他在單核的云ECS嘗試運(yùn)行以下代碼，

package main import （“fmt”//“sync/atomic”“time”） func main（） {var x int32var y int32 go func（） {for { x++ y++ } }（） time.Sleep（time.Second） fmt.Println（“x=”， x） fmt.Println（“y=”， y）}

結(jié)果也是0。剛開始我覺得這個(gè)讀者反饋有誤，因此我也立刻在阿里云的X86集群與華為云的鯤鵬集群分別申請(qǐng)了一臺(tái)單核ECS，不過結(jié)果令人崩潰，無論是ARM還是X86單核平臺(tái)運(yùn)行上述代表的結(jié)果也還是0，不過這還沒完。

4更崩潰了，隨隨便便加個(gè)if竟然殺瘋了…。

接下來是最令人崩潰的時(shí)刻，我們來看以下代碼：

package main import （“fmt”//“sync/atomic”“time”） func main（） {var x int32var y int32 z ：= 0 go func（） {for { x++//一些無需關(guān)注并發(fā)安全的計(jì)算問題 y++if z 》 0 { fmt.Println（“z is”， z）//這一行代碼不會(huì)執(zhí)行到 } } }（） time.Sleep（time.Second）//定時(shí)執(zhí)行，超過1秒鐘就停止了，無需關(guān)注并發(fā)安全 fmt.Println（“x=”， x） fmt.Println（“y=”， y）}

這段代碼在沒有作何鎖或者互斥體的基礎(chǔ)上竟然解決了y=0的問題，而且令人崩潰的是，這段代碼的執(zhí)行效率竟然還非常驚人，比之前Automic的方式至少快一個(gè)數(shù)量級(jí)，

如果是這樣的話那么這種代碼方案就非常適合于不需要并發(fā)控制，并且定時(shí)需要結(jié)束的計(jì)算場景，假如我一個(gè)計(jì)算任務(wù)只能給1秒鐘，能算得出來就算，算不出來就解下一題了，那么if的方案就非常適合了。

x= 407698730y= 407745938成功：進(jìn)程退出代碼 0.

在解釋if分支這個(gè)非主流的方案之前，我們再來看一下互斥體這種主流并發(fā)同步方案。

互斥體實(shí)現(xiàn)如下：

package main import （“fmt”“sync” //“sync/atomic”“time”） func main（） {var x int32var y int32var mutex sync.Mutex go func（） {for { mutex.Lock（） x++ y++ mutex.Unlock（） } }（） time.Sleep（time.Second） x1 ：= x y1 ：= y fmt.Println（“x=”， x1） fmt.Println（“y=”， y1）}

運(yùn)行結(jié)果如下：

x= 50889322y= 50889322成功：進(jìn)程退出代碼 0.

我們可以看到互斥、原子操作等方法最終運(yùn)行結(jié)果基本都在一個(gè)數(shù)量級(jí)以內(nèi)上下浮動(dòng)，幅度不超過10%，對(duì)比之下if的方案實(shí)在是殺瘋了，直接比上述這種安全的寫法性能好出一個(gè)數(shù)量級(jí)！隨便加入個(gè)if分支，竟然也能解決y=0，而且還是高效解決這到底是為什么？

5關(guān)鍵時(shí)刻匯編令人心安，大神一語道破

在我的知識(shí)儲(chǔ)備實(shí)在無法解釋以上現(xiàn)象的時(shí)候，我只能將希望訴諸objdump，將gobuild生成的可執(zhí)行文件來進(jìn)行反編譯，通過查看匯編語言代碼來尋找問題解釋的蛛絲馬跡。不看不知道一看還真是有驚喜，加了if語句和加鎖等方式一樣全部會(huì)加上內(nèi)存寫屏障writeBarrier。具體如下：

未加if的匯編結(jié)果

0000000000499400 《main.main.func1》：499400： eb 00 jmp 499402 《main.main.func1+0x2》499402： eb 00 jmp 499404 《main.main.func1+0x4》499404： eb 00 jmp 499406

《main.main.func1+0x6》499406： eb fa jmp 499402 《main.main.func1+0x2》499408： cc int3499409： cc int349940a： cc int3 49940b： cc int349940c： cc int349940d： cc int3.。。省略0000000000499420 《type..eq.［2］interface {}》：499420： 64 48 8b 0c 25 f8 ff mov %fs:0xfffffffffffffff8，%rcx499427： ff ff499429： 48 3b 61 10 cmp 0x10（%rcx），%rsp 49942d： 0f 86 cf 00 00 00 jbe 499502 《type..eq.［2］interface {}+0xe2》499433： 48 83 ec 50 sub $0x50，%rsp

加了if或者鎖的匯編結(jié)果

wirteBarrier有點(diǎn)類似于文件操作中flush的作用，會(huì)強(qiáng)制把數(shù)據(jù)由緩存同步到內(nèi)存當(dāng)中去，因此我前文中所說兩個(gè)變量其中一個(gè)加鎖，另一個(gè)結(jié)果也能不為0是因?yàn)樗麄冊谕痪彺嫘性蚪忉屢膊粚?duì)，x和y并不是因?yàn)樵谕粋€(gè)緩存行所以才被一起同步回內(nèi)存的，而是由于wirteBarrier這個(gè)屏障所引入的。我們來看下面的代碼。

package main import （“fmt”//“sync/atomic”“time”） func main（） {var x int32var y int32 slice ：= make（［］int， 10， 10） z ：= 0 go func（） {for { x++ y++for index， value ：= range slice { slice［index］ = value + 1 }if z 》 0 { fmt.Println（“z is”， z） } } }（） time.Sleep（time.Second） fmt.Println（“x=”， x） fmt.Println（“y=”， y） fmt.Println（“slice=”， slice）}

他的運(yùn)行結(jié)果是：

x= 86961625y= 86972610slice= ［86978588 86979075 86979101 86979417 86979435 86979452 86979464 86979771 86979793 86979807］成功：進(jìn)程退出代碼 0.

我造出來長度為10整形切片，緩存行一般只有64BYTE，那么這個(gè)切片上面的數(shù)據(jù)是不可能在同一緩存行上的，通過這段代碼的執(zhí)行結(jié)果可以看到所有切換的值全部被更新了，因此我們可以了解writeBarrier這個(gè)內(nèi)存寫屏障的功能是將之前所有的數(shù)據(jù)全部強(qiáng)制回寫到內(nèi)存當(dāng)中。

我對(duì)于單核ECS中運(yùn)行的結(jié)果也是y=0的結(jié)果有了一定的認(rèn)識(shí)，由于ECS虛擬機(jī)運(yùn)行的主體也是物理機(jī)，而物理機(jī)肯定不是單核的，因此不執(zhí)行writeBarrier這個(gè)寫屏障語句，數(shù)據(jù)也無法刷回內(nèi)存，雖然程序運(yùn)行在單核虛擬機(jī)上，而虛擬機(jī)并不會(huì)把匯編指令再做包裝，這也就造成實(shí)際的執(zhí)行與多核環(huán)境沒有什么差別。

6if為什么會(huì)被如此安排

實(shí)在中If不但實(shí)際達(dá)到了內(nèi)存同步的效果，而且還效率更高，看起來非常適合這種沒有強(qiáng)制同步需要的使用場景。不過我們不禁要問為什么編譯器要在出現(xiàn)if語句時(shí)顯式調(diào)用內(nèi)存屏障。個(gè)人猜測原因有兩個(gè)，

if判斷使用真實(shí)值是隱含的前提：首先在進(jìn)行判斷時(shí)，使用緩存中的數(shù)據(jù)可能會(huì)帶來顯而易見的問題：因?yàn)樵谧雠袛鄷r(shí)程序員一般是要求用目前變量的實(shí)際值而不是緩存值來進(jìn)行的，這是一個(gè)隱含的前提，可能編譯器在優(yōu)化時(shí)考慮到了這一點(diǎn)。

指令流水線的原因：我們知道CPU的每個(gè)動(dòng)作都需要用晶體震蕩而觸發(fā)，以加法ADD指令為例，想完成這個(gè)執(zhí)行指令需要取指、譯碼、取操作數(shù)、執(zhí)行以及取操作結(jié)果等若干步驟，而每個(gè)步驟都需要一次晶體震蕩才能推進(jìn)，因此在流水線技術(shù)出現(xiàn)之前執(zhí)行一條指令至少需要5到6次晶體震蕩周期才能完成。如下圖：

為了縮短指令執(zhí)行的晶體震蕩周期，芯片設(shè)計(jì)人員參考了工廠流水線機(jī)制的提出了指令流水線的想法，由于取指、譯碼這些模塊其實(shí)在芯片內(nèi)部都是獨(dú)立的，完成可以在同一時(shí)刻并發(fā)執(zhí)行，那么只要將多條指令的不同步驟放在同一時(shí)刻執(zhí)行，比如指令1取指，指令2譯碼，指令3取操作數(shù)等等，就可以大幅提高CPU執(zhí)行效率：

以上圖流水線為例，在T5時(shí)刻之前指令流水線以每周期一條的速度不斷建立，在T5時(shí)代以后每個(gè)震蕩周期，都可以有一條指令取結(jié)果，平均每條指令就只需要一個(gè)震蕩周期就可以完成。這種流水線設(shè)計(jì)也就大幅提升了CPU的運(yùn)算速度。

但是if分支會(huì)造成流水線的停頓，也就是說指令流水線系統(tǒng)無法確定在指令1執(zhí)行時(shí)確定指令7的具體情況。那么在if時(shí)加上writeBarrier這種耗時(shí)操作其實(shí)也就可以理解了，反正if也造拖慢執(zhí)行速度，那編譯器也就不在乎在此時(shí)加上另外的耗時(shí)操作了。

7Rust為什么令人羨慕

不過在看了一段時(shí)間的Rust后，我感覺Rust的優(yōu)勢是可以避免程序員犯很多錯(cuò)誤，而這其中所謂的錯(cuò)誤雖然看起來低級(jí)，但是如果他們被隱藏在千萬行代碼之中，那么排查起來真是相當(dāng)費(fèi)時(shí)費(fèi)力，由于已經(jīng)是所有權(quán)轉(zhuǎn)移了，因此變量的使用不太會(huì)出現(xiàn)像Go一樣的錯(cuò)誤情況，這點(diǎn)我們在上一篇文章中已經(jīng)有所論述了，而且我們來看以下代碼：

use std：：thread;use std：：mpsc;use std：：Duration; fn main（） {let （tx， rx） = mpsc：：channel（）;let tx1 = mpsc：：clone（&tx）; //增加一個(gè)發(fā)送者tx1，需要clonelet tx2 =

mpsc：：clone（&tx）; //增加一個(gè)發(fā)送者tx2，需要clone thread：：spawn（move || {let vals = vec?。跾tring：：from（“I‘m”），String：：from（“from”），String：：from（“the”），String：：from（“tx it self”），］; for val in vals { tx.send（val）.unwrap（）; }}）; thread：：spawn（move || {let vals = vec！

［String：：from（“I’m”），String：：from（“from”），String：：from（“the”），String：：from（“tx1”），］; for val in vals { tx1.send（val）.unwrap（）; }}）; thread：：spawn（move || {let vals = vec！［String：：from（“I‘m”），String：：from（“from”），String：：from（“the”），String：：from（“tx2”），］; for val in vals { tx2.send（val）.unwrap（）; }}）; for received in rx { //一個(gè)通道一個(gè)接收者，接收若干個(gè)發(fā)送者的信息 println！（“Got： {}”， received）;} }

可見Rust中連管道的多路并發(fā)的管理使用都要通過clone的方式來安全傳遞信息，個(gè)人根本想不到用Rust編程怎么能出現(xiàn)像上面例子中Go造成的Bug，因此Rust的學(xué)習(xí)曲線雖然陡峭，但是感覺Rust程序包往往只掌握原生的框架就可以做得很好了，而不像Python、Java除了原生語言知識(shí)以外，還需要學(xué)習(xí)熟練運(yùn)用各種第三方的包。

馬超，CSDN博客專家，阿里云MVP、華為云MVP，華為2020年技術(shù)社區(qū)開發(fā)者之星。

編輯：jq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

BUG

BUG

+關(guān)注

關(guān)注
0

文章
155

瀏覽量
15639

原文標(biāo)題：遠(yuǎn)看像亂序執(zhí)行，近看是內(nèi)存屏障的 BUG 是如何解決的？

文章出處：【微信號(hào)：coder_life，微信公眾號(hào)：程序人生】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

如何解決工字電感噪音大的問題

電子發(fā)燒友網(wǎng)站提供《如何解決工字電感噪音大的問題.docx》資料免費(fèi)下載

發(fā)表于 09-04 11:46 ?0次下載

如何解決電感的漏感問題

電子發(fā)燒友網(wǎng)站提供《如何解決電感的漏感問題.docx》資料免費(fèi)下載

發(fā)表于 09-02 14:48 ?0次下載

堆棧和內(nèi)存的基本知識(shí)

本文主要聊聊關(guān)于堆棧的內(nèi)容。包括堆棧和內(nèi)存的基本知識(shí)。常見和堆棧相關(guān)的 bug，如棧溢出，內(nèi)存泄漏，堆內(nèi)存分配失敗等。后面介紹軟件中堆棧統(tǒng)計(jì)的重要性，以及如何使用工具工具軟件中堆棧使用

發(fā)表于 08-29 14:10 ?361次閱讀

堆棧和<b class='flag-5'>內(nèi)存</b>的基本知識(shí)

ESP32C3藍(lán)牙m(xù)eshprovisioner出現(xiàn)內(nèi)存溢出問題如何解決？

E (226178673) BLE_MESH: bt_mesh_alloc_buf, Out of memory E (226178683) BLE_MESH: sdu_recv, Out of memory 藍(lán)牙m(xù)eshprovisioner 出現(xiàn)內(nèi)存溢出問題，該如何解

發(fā)表于 06-07 07:59

讀取0x1000003e處內(nèi)存失敗如何解決？

我試圖通過添加斷點(diǎn)來調(diào)試程序，結(jié)果遇到了這個(gè)錯(cuò)誤。這個(gè)錯(cuò)誤意味著什么，如何解決？ Info : SWD DPIDR 0x0bb11477 Info : kitprog3: acquiring

發(fā)表于 05-22 07:31

煤氣柜泄漏問題如何解決

電子發(fā)燒友網(wǎng)站提供《煤氣柜泄漏問題如何解決.docx》資料免費(fèi)下載

發(fā)表于 03-05 17:49 ?0次下載

Andes晶心科技正式推出AndesCore? AX65全新RISC-V亂序執(zhí)行、超純量、多核處理器

高效率、低功耗、32/64 位 RISC-V 處理器核的領(lǐng)先供貨商和 RISC-V 國際協(xié)會(huì)創(chuàng)始首席成員Andes晶心科技，宣布全面推出高性能AndesCore AX65--亂序執(zhí)行、超純量、多核處理器IP。

發(fā)表于 01-17 13:48 ?1179次閱讀

深入理解Linux RCU：從硬件說起之內(nèi)存屏障

上一篇文章我們談到了內(nèi)存Cache，并且描述了典型的Cache一致性協(xié)議MESI。Cache的根本目的，是解決內(nèi)存與CPU速度多達(dá)兩個(gè)數(shù)量級(jí)的性能差異。

發(fā)表于 12-25 13:42 ?758次閱讀

深入理解Linux RCU：從硬件說起之<b class='flag-5'>內(nèi)存</b><b class='flag-5'>屏障</b>

移植ADV7180驅(qū)動(dòng)時(shí)，在執(zhí)行探測函數(shù)adv7180_probe的kzalloc分配內(nèi)存時(shí)返回NULL，可確實(shí)還有內(nèi)存是怎么回事？

移植ADV7180驅(qū)動(dòng)時(shí)，在執(zhí)行探測函數(shù)adv7180_probe的kzalloc分配內(nèi)存時(shí)返回NULL，可確實(shí)還有內(nèi)存，這是怎么回事？

發(fā)表于 12-12 07:00

eclipse設(shè)置jvm內(nèi)存大小

內(nèi)存大小，并對(duì)其背后的原理進(jìn)行解釋。 JVM（Java虛擬機(jī)）是Java程序的運(yùn)行環(huán)境，它負(fù)責(zé)將Java字節(jié)碼翻譯成機(jī)器碼，以便在不同的平臺(tái)上執(zhí)行。JVM使用內(nèi)存來存儲(chǔ)運(yùn)行時(shí)對(duì)象和執(zhí)行

發(fā)表于 12-06 11:43 ?1788次閱讀

java虛擬機(jī)內(nèi)存包括遠(yuǎn)空間內(nèi)存嗎

Java虛擬機(jī)（JVM）內(nèi)存是Java程序執(zhí)行時(shí)所使用的內(nèi)存空間的總稱，包括了Java堆、方法區(qū)、本地方法棧、虛擬機(jī)棧和程序計(jì)數(shù)器等多個(gè)部分。在這些內(nèi)存空間中，并不包含“遠(yuǎn)空間

發(fā)表于 12-05 14:15 ?367次閱讀

jvm內(nèi)存模型和內(nèi)存結(jié)構(gòu)

JVM（Java虛擬機(jī)）是Java程序的運(yùn)行平臺(tái)，它負(fù)責(zé)將Java程序轉(zhuǎn)換成機(jī)器碼并在計(jì)算機(jī)上執(zhí)行。在JVM中，內(nèi)存模型和內(nèi)存結(jié)構(gòu)是兩個(gè)重要的概念，本文將詳細(xì)介紹它們。一、JVM內(nèi)存

發(fā)表于 12-05 11:08 ?877次閱讀

jvm內(nèi)存溢出該如何定位解決

在Java應(yīng)用程序中，JVM（Java虛擬機(jī)）內(nèi)存溢出是指Java應(yīng)用程序試圖分配的內(nèi)存超過了JVM所允許的最大內(nèi)存大小，導(dǎo)致程序無法正常執(zhí)行。內(nèi)存

發(fā)表于 12-05 11:05 ?1271次閱讀

jmap dump內(nèi)存的命令是

空間的詳細(xì)信息的文件。通過分析堆內(nèi)存快照，可以幫助我們進(jìn)行內(nèi)存泄漏和性能問題的定位和分析，以及優(yōu)化代碼和內(nèi)存使用。使用jmap dump命令生成堆內(nèi)存快照時(shí)，需要

發(fā)表于 12-05 10:38 ?3027次閱讀

iCoupler? 具有isoPower的產(chǎn)品?技術(shù)：隔離期間的信號(hào)和功率傳輸使用微型變壓器的屏障

電子發(fā)燒友網(wǎng)站提供《iCoupler? 具有isoPower的產(chǎn)品?技術(shù)：隔離期間的信號(hào)和功率傳輸使用微型變壓器的屏障.pdf》資料免費(fèi)下載

發(fā)表于 11-30 09:20 ?0次下載

搜索歷史

如何解決像亂序執(zhí)行又像內(nèi)存屏障的BUG