0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從CPU說(shuō)起多線程以及線程池

GReq_mcu168 ? 來(lái)源:玩轉(zhuǎn)單片機(jī) ? 作者:玩轉(zhuǎn)單片機(jī) ? 2021-03-02 13:48 ? 次閱讀

從這篇開(kāi)始將會(huì)開(kāi)啟高性能、高并發(fā)系列,本篇是該系列的開(kāi)篇,主要關(guān)注多線程以及線程池。

一切要從CPU說(shuō)起

你可能會(huì)有疑問(wèn),講多線程為什么要從CPU說(shuō)起呢?原因很簡(jiǎn)單,在這里沒(méi)有那些時(shí)髦的概念,你可以更加清晰的看清問(wèn)題的本質(zhì)。

CPU并不知道線程、進(jìn)程之類的概念。

CPU只知道兩件事:

1. 從內(nèi)存中取出指令

2. 執(zhí)行指令,然后回到1

你看,在這里CPU確實(shí)是不知道什么進(jìn)程、線程之類的概念。

接下來(lái)的問(wèn)題就是CPU從哪里取出指令呢?答案是來(lái)自一個(gè)被稱為Program Counter(簡(jiǎn)稱PC)的寄存器,也就是我們熟知的程序計(jì)數(shù)器,在這里大家不要把寄存器想的太神秘,你可以簡(jiǎn)單的把寄存器理解為內(nèi)存,只不過(guò)存取速度更快而已。

PC寄存器中存放的是什么呢?這里存放的是指令在內(nèi)存中的地址,什么指令呢?是CPU將要執(zhí)行的下一條指令。

那么是誰(shuí)來(lái)設(shè)置PC寄存器中的指令地址呢?

原來(lái)PC寄存器中的地址默認(rèn)是自動(dòng)加1的,這當(dāng)然是有道理的,因?yàn)榇蟛糠智闆r下CPU都是一條接一條順序執(zhí)行,當(dāng)遇到if、else時(shí),這種順序執(zhí)行就被打破了,CPU在執(zhí)行這類指令時(shí)會(huì)根據(jù)計(jì)算結(jié)果來(lái)動(dòng)態(tài)改變PC寄存器中的值,這樣CPU就可以正確的跳轉(zhuǎn)到需要執(zhí)行的指令了。

聰明的你一定會(huì)問(wèn),那么PC中的初始值是怎么被設(shè)置的呢?

在回答這個(gè)問(wèn)題之前我們需要知道CPU執(zhí)行的指令來(lái)自哪里?是來(lái)自內(nèi)存,廢話,內(nèi)存中的指令是從磁盤(pán)中保存的可執(zhí)行程序加載過(guò)來(lái)的,磁盤(pán)中可執(zhí)行程序是編譯器生成的,編譯器又是從哪里生成的機(jī)器指令呢?答案就是我們定義的函數(shù)。

注意是函數(shù),函數(shù)被編譯后才會(huì)形成CPU執(zhí)行的指令,那么很自然的,我們?cè)撊绾巫孋PU執(zhí)行一個(gè)函數(shù)呢?顯然我們只需要找到函數(shù)被編譯后形成的第一條指令就可以了,第一條指令就是函數(shù)入口。

現(xiàn)在你應(yīng)該知道了吧,我們想要CPU執(zhí)行一個(gè)函數(shù),那么只需要把該函數(shù)對(duì)應(yīng)的第一條機(jī)器指令的地址寫(xiě)入PC寄存器就可以了,這樣我們寫(xiě)的函數(shù)就開(kāi)始被CPU執(zhí)行起來(lái)啦。

你可能會(huì)有疑問(wèn),這和線程有什么關(guān)系呢?

從CPU到操作系統(tǒng)

上一小節(jié)中我們明白了CPU的工作原理,我們想讓CPU執(zhí)行某個(gè)函數(shù),那么只需要把函數(shù)對(duì)應(yīng)的第一條機(jī)器執(zhí)行裝入PC寄存器就可以了,這樣即使沒(méi)有操作系統(tǒng)我們也可以讓CPU執(zhí)行程序,雖然可行但這是一個(gè)非常繁瑣的過(guò)程,我們需要:

在內(nèi)存中找到一塊大小合適的區(qū)域裝入程序

找到函數(shù)入口,設(shè)置好PC寄存器讓CPU開(kāi)始執(zhí)行程序

這兩個(gè)步驟絕不是那么容易的事情,如果每次在執(zhí)行程序時(shí)程序員自己手動(dòng)實(shí)現(xiàn)上述兩個(gè)過(guò)程會(huì)瘋掉的,因此聰明的程序員就會(huì)想干脆直接寫(xiě)個(gè)程序來(lái)自動(dòng)完成上面兩個(gè)步驟吧。

機(jī)器指令需要加載到內(nèi)存中執(zhí)行,因此需要記錄下內(nèi)存的起始地址和長(zhǎng)度;同時(shí)要找到函數(shù)的入口地址并寫(xiě)到PC寄存器中,想一想這是不是需要一個(gè)數(shù)據(jù)結(jié)構(gòu)來(lái)記錄下這些信息

struct*** {void* start_addr;intlen;void* start_point;...};

接下來(lái)就是起名字時(shí)刻。

這個(gè)數(shù)據(jù)結(jié)構(gòu)總要有個(gè)名字吧,這個(gè)結(jié)構(gòu)體用來(lái)記錄什么信息呢?記錄的是程序在被加載到內(nèi)存中的運(yùn)行狀態(tài),程序從磁盤(pán)加載到內(nèi)存跑起來(lái)叫什么好呢?干脆就叫進(jìn)程(Process)好了,我們的指導(dǎo)原則就是一定要聽(tīng)上去比較神秘,總之大家都不容易弄懂就對(duì)了,我將其稱為“弄不懂原則”。

就這樣進(jìn)程誕生了。

CPU執(zhí)行的第一個(gè)函數(shù)也起個(gè)名字,第一個(gè)要被執(zhí)行的函數(shù)聽(tīng)起來(lái)比較重要,干脆就叫main函數(shù)吧。

完成上述兩個(gè)步驟的程序也要起個(gè)名字,根據(jù)“弄不懂原則”這個(gè)“簡(jiǎn)單”的程序就叫操作系統(tǒng)(Operating System)好啦。

就這樣操作系統(tǒng)誕生了,程序員要想運(yùn)行程序再也不用自己手動(dòng)加載一遍了。

現(xiàn)在進(jìn)程和操作系統(tǒng)都有了,一切看上去都很完美。

從單核到多核,如何充分利用多核

人類的一大特點(diǎn)就是生命不息折騰不止,從單核折騰到了多核。

這時(shí),假設(shè)我們想寫(xiě)一個(gè)程序并且要分利用多核該怎么辦呢?

有的同學(xué)可能會(huì)說(shuō)不是有進(jìn)程嗎,多開(kāi)幾個(gè)進(jìn)程不就可以了?聽(tīng)上去似乎很有道理,但是主要存在這樣幾個(gè)問(wèn)題:

進(jìn)程是需要占用內(nèi)存空間的(從上一節(jié)能看到這一點(diǎn)),如果多個(gè)進(jìn)程基于同一個(gè)可執(zhí)行程序,那么這些進(jìn)程其內(nèi)存區(qū)域中的內(nèi)容幾乎完全相同,這顯然會(huì)造成內(nèi)存的浪費(fèi)

計(jì)算機(jī)處理的任務(wù)可能是比較復(fù)雜的,這就涉及到了進(jìn)程間通信,由于各個(gè)進(jìn)程處于不同的內(nèi)存地址空間,進(jìn)程間通信天然需要借助操作系統(tǒng),這就在增大編程難度的同時(shí)也增加了系統(tǒng)開(kāi)銷

該怎么辦呢?

從進(jìn)程到線程

讓我再來(lái)仔細(xì)的想一想這個(gè)問(wèn)題,所謂進(jìn)程無(wú)非就是內(nèi)存中的一段區(qū)域,這段區(qū)域中保存了CPU執(zhí)行的機(jī)器指令以及函數(shù)運(yùn)行時(shí)的堆棧信息,要想讓進(jìn)程運(yùn)行,就把main函數(shù)的第一條機(jī)器指令地址寫(xiě)入PC寄存器,這樣進(jìn)程就運(yùn)行起來(lái)了。

進(jìn)程的缺點(diǎn)在于只有一個(gè)入口函數(shù),也就是main函數(shù),因此進(jìn)程中的機(jī)器指令只能被一個(gè)CPU執(zhí)行,那么有沒(méi)有辦法讓多個(gè)CPU來(lái)執(zhí)行同一個(gè)進(jìn)程中的機(jī)器指令呢?

聰明的你應(yīng)該能想到,既然我們可以把main函數(shù)的第一條指令地址寫(xiě)入PC寄存器,那么其它函數(shù)和main函數(shù)又有什么區(qū)別呢?

答案是沒(méi)什么區(qū)別,main函數(shù)的特殊之處無(wú)非就在于是CPU執(zhí)行的第一個(gè)函數(shù),除此之外再無(wú)特別之處,我們可以把PC寄存器指向main函數(shù),就可以把PC寄存器指向任何一個(gè)函數(shù)。

當(dāng)我們把PC寄存器指向非main函數(shù)時(shí),線程就誕生了。

至此我們解放了思想,一個(gè)進(jìn)程內(nèi)可以有多個(gè)入口函數(shù),也就是說(shuō)屬于同一個(gè)進(jìn)程中的機(jī)器指令可以被多個(gè)CPU同時(shí)執(zhí)行。

注意,這是一個(gè)和進(jìn)程不同的概念,創(chuàng)建進(jìn)程時(shí)我們需要在內(nèi)存中找到一塊合適的區(qū)域以裝入進(jìn)程,然后把CPU的PC寄存器指向main函數(shù),也就是說(shuō)進(jìn)程中只有一個(gè)執(zhí)行流。

但是現(xiàn)在不一樣了,多個(gè)CPU可以在同一個(gè)屋檐下(進(jìn)程占用的內(nèi)存區(qū)域)同時(shí)執(zhí)行屬于該進(jìn)程的多個(gè)入口函數(shù),也就是說(shuō)現(xiàn)在一個(gè)進(jìn)程內(nèi)可以有多個(gè)執(zhí)行流了。

總是叫執(zhí)行流好像有點(diǎn)太容易理解了,再次祭出”弄不懂原則“,起個(gè)不容易懂的名字,就叫線程吧。

這就是線程的由來(lái)。

操作系統(tǒng)為每個(gè)進(jìn)程維護(hù)了一堆信息,用來(lái)記錄進(jìn)程所處的內(nèi)存空間等,這堆信息記為數(shù)據(jù)集A。

同樣的,操作系統(tǒng)也需要為線程維護(hù)一堆信息,用來(lái)記錄線程的入口函數(shù)或者棧信息等,這堆數(shù)據(jù)記為數(shù)據(jù)集B。

顯然數(shù)據(jù)集B要比數(shù)據(jù)A的量要少,同時(shí)不像進(jìn)程,創(chuàng)建一個(gè)線程時(shí)無(wú)需去內(nèi)存中找一段內(nèi)存空間,因?yàn)榫€程是運(yùn)行在所處進(jìn)程的地址空間的,這塊地址空間在程序啟動(dòng)時(shí)已經(jīng)創(chuàng)建完畢,同時(shí)線程是程序在運(yùn)行期間創(chuàng)建的(進(jìn)程啟動(dòng)后),因此當(dāng)線程開(kāi)始運(yùn)行的時(shí)候這塊地址空間就已經(jīng)存在了,線程可以直接使用。這就是為什么各種教材上提的創(chuàng)建線程要比創(chuàng)建進(jìn)程快的原因(當(dāng)然還有其它原因)。

值得注意的是,有了線程這個(gè)概念后,我們只需要進(jìn)程開(kāi)啟后創(chuàng)建多個(gè)線程就可以讓所有CPU都忙起來(lái),這就是所謂高性能、高并發(fā)的根本所在。

很簡(jiǎn)單,只需要?jiǎng)?chuàng)建出數(shù)量合適的線程就可以了。

另外值得注意的一點(diǎn)是,由于各個(gè)線程共享進(jìn)程的內(nèi)存地址空間,因此線程之間的通信無(wú)需借助操作系統(tǒng),這給程序員帶來(lái)極大方便的同時(shí)也帶來(lái)了無(wú)盡的麻煩,多線程遇到的多數(shù)問(wèn)題都出自于線程間通信簡(jiǎn)直太方便了以至于非常容易出錯(cuò)。出錯(cuò)的根源在于CPU執(zhí)行指令時(shí)根本沒(méi)有線程的概念,多線程編程面臨的互斥與同步問(wèn)題需要程序員自己解決,關(guān)于互斥與同步問(wèn)題限于篇幅就不詳細(xì)展開(kāi)了,大部分的操作系統(tǒng)資料都有詳細(xì)講解。

最后需要提醒的是,雖然前面關(guān)于線程講解使用的圖中用了多個(gè)CPU,但不是說(shuō)一定要有多核才能使用多線程,在單核的情況下一樣可以創(chuàng)建出多個(gè)線程,原因在于線程是操作系統(tǒng)層面的實(shí)現(xiàn),和有多少個(gè)核心是沒(méi)有關(guān)系的,CPU在執(zhí)行機(jī)器指令時(shí)也意識(shí)不到執(zhí)行的機(jī)器指令屬于哪個(gè)線程。即使在只有一個(gè)CPU的情況下,操作系統(tǒng)也可以通過(guò)線程調(diào)度讓各個(gè)線程“同時(shí)”向前推進(jìn),方法就是將CPU的時(shí)間片在各個(gè)線程之間來(lái)回分配,這樣多個(gè)線程看起來(lái)就是“同時(shí)”運(yùn)行了,但實(shí)際上任意時(shí)刻還是只有一個(gè)線程在運(yùn)行。

線程與內(nèi)存

在前面的討論中我們知道了線程和CPU的關(guān)系,也就是把CPU的PC寄存器指向線程的入口函數(shù),這樣線程就可以運(yùn)行起來(lái)了,這就是為什么我們創(chuàng)建線程時(shí)必須指定一個(gè)入口函數(shù)的原因。無(wú)論使用任何編程語(yǔ)言,創(chuàng)建一個(gè)線程大體相同:

// 設(shè)置線程入口函數(shù)DoSomethingthread=CreateThread(DoSomething);// 讓線程運(yùn)行起來(lái)thread.Run();

那么線程和內(nèi)存又有什么關(guān)聯(lián)呢?

我們知道函數(shù)在被執(zhí)行的時(shí)產(chǎn)生的數(shù)據(jù)包括函數(shù)參數(shù)、局部變量、返回地址等信息,這些信息是保存在棧中的,線程這個(gè)概念還沒(méi)有出現(xiàn)時(shí)進(jìn)程中只有一個(gè)執(zhí)行流,因此只有一個(gè)棧,這個(gè)棧的棧底就是進(jìn)程的入口函數(shù),也就是main函數(shù),假設(shè)main函數(shù)調(diào)用了funA,funcA又調(diào)用了funcB,如圖所示:

那么有了線程以后了呢?

有了線程以后一個(gè)進(jìn)程中就存在多個(gè)執(zhí)行入口,即同時(shí)存在多個(gè)執(zhí)行流,那么只有一個(gè)執(zhí)行流的進(jìn)程需要一個(gè)棧來(lái)保存運(yùn)行時(shí)信息,那么很顯然有多個(gè)執(zhí)行流時(shí)就需要有多個(gè)棧來(lái)保存各個(gè)執(zhí)行流的信息,也就是說(shuō)操作系統(tǒng)要為每個(gè)線程在進(jìn)程的地址空間中分配一個(gè)棧,即每個(gè)線程都有獨(dú)屬于自己的棧,能意識(shí)到這一點(diǎn)是極其關(guān)鍵的。

同時(shí)我們也可以看到,創(chuàng)建線程是要消耗進(jìn)程內(nèi)存空間的,這一點(diǎn)也值得注意。

線程的使用

現(xiàn)在有了線程的概念,那么接下來(lái)作為程序員我們?cè)撊绾问褂镁€程呢?

從生命周期的角度講,線程要處理的任務(wù)有兩類:長(zhǎng)任務(wù)和短任務(wù)。

1,長(zhǎng)任務(wù),long-lived tasks

顧名思義,就是任務(wù)存活的時(shí)間很長(zhǎng),比如以我們常用的word為例,我們?cè)趙ord中編輯的文字需要保存在磁盤(pán)上,往磁盤(pán)上寫(xiě)數(shù)據(jù)就是一個(gè)任務(wù),那么這時(shí)一個(gè)比較好的方法就是專門(mén)創(chuàng)建一個(gè)寫(xiě)磁盤(pán)的線程,該寫(xiě)線程的生命周期和word進(jìn)程是一樣的,只要打開(kāi)word就要?jiǎng)?chuàng)建出該寫(xiě)線程,當(dāng)用戶關(guān)閉word時(shí)該線程才會(huì)被銷毀,這就是長(zhǎng)任務(wù)。

這種場(chǎng)景非常適合創(chuàng)建專用的線程來(lái)處理某些特定任務(wù),這種情況比較簡(jiǎn)單。

有長(zhǎng)任務(wù),相應(yīng)的就有短任務(wù)。

2,短任務(wù),short-lived tasks

這個(gè)概念也很簡(jiǎn)單,那就是任務(wù)的處理時(shí)間很短,比如一次網(wǎng)絡(luò)請(qǐng)求、一次數(shù)據(jù)庫(kù)查詢等,這種任務(wù)可以在短時(shí)間內(nèi)快速處理完成。因此短任務(wù)多見(jiàn)于各種Server,像web server、database server、file server、mail server等,這也是互聯(lián)網(wǎng)行業(yè)的同學(xué)最常見(jiàn)的場(chǎng)景,這種場(chǎng)景是我們要重點(diǎn)討論的。

這種場(chǎng)景有兩個(gè)特點(diǎn):一個(gè)是任務(wù)處理所需時(shí)間短;另一個(gè)是任務(wù)數(shù)量巨大。

如果讓你來(lái)處理這種類型的任務(wù)該怎么辦呢?

你可能會(huì)想,這很簡(jiǎn)單啊,當(dāng)server接收到一個(gè)請(qǐng)求后就創(chuàng)建一個(gè)線程來(lái)處理任務(wù),處理完成后銷毀該線程即可,So easy。

這種方法通常被稱為thread-per-request,也就是說(shuō)來(lái)一個(gè)請(qǐng)求就創(chuàng)建一個(gè)線程:

如果是長(zhǎng)任務(wù),那么這種方法可以工作的很好,但是對(duì)于大量的短任務(wù)這種方法雖然實(shí)現(xiàn)簡(jiǎn)單但是有這樣幾個(gè)缺點(diǎn):

1. 從前幾節(jié)我們能看到,線程是操作系統(tǒng)中的概念(這里不討論用戶態(tài)線程實(shí)現(xiàn)、協(xié)程之類),因此創(chuàng)建線程天然需要借助操作系統(tǒng)來(lái)完成,操作系統(tǒng)創(chuàng)建和銷毀線程是需要消耗時(shí)間的

2. 每個(gè)線程需要有自己獨(dú)立的棧,因此當(dāng)創(chuàng)建大量線程時(shí)會(huì)消耗過(guò)多的內(nèi)存等系統(tǒng)資源

這就好比你是一個(gè)工廠老板(想想都很開(kāi)心有沒(méi)有),手里有很多訂單,每來(lái)一批訂單就要招一批工人,生產(chǎn)的產(chǎn)品非常簡(jiǎn)單,工人們很快就能處理完,處理完這批訂單后就把這些千辛萬(wàn)苦招過(guò)來(lái)的工人辭退掉,當(dāng)有新的訂單時(shí)你再千辛萬(wàn)苦的招一遍工人,干活兒5分鐘招人10小時(shí),如果你不是勵(lì)志要讓企業(yè)倒閉的話大概是不會(huì)這么做到的,因此一個(gè)更好的策略就是招一批人后就地養(yǎng)著,有訂單時(shí)處理訂單,沒(méi)有訂單時(shí)大家可以閑呆著。

這就是線程池的由來(lái)。

從多線程到線程池

線程池的概念是非常簡(jiǎn)單的,無(wú)非就是創(chuàng)建一批線程,之后就不再釋放了,有任務(wù)就提交給這些線程處理,因此無(wú)需頻繁的創(chuàng)建、銷毀線程,同時(shí)由于線程池中的線程個(gè)數(shù)通常是固定的,也不會(huì)消耗過(guò)多的內(nèi)存,因此這里的思想就是復(fù)用、可控。

線程池是如何工作的

可能有的同學(xué)會(huì)問(wèn),該怎么給線程池提交任務(wù)呢?這些任務(wù)又是怎么給到線程池中線程呢?

很顯然,數(shù)據(jù)結(jié)構(gòu)中的隊(duì)列天然適合這種場(chǎng)景,提交任務(wù)的就是生產(chǎn)者,消費(fèi)任務(wù)的線程就是消費(fèi)者,實(shí)際上這就是經(jīng)典的生產(chǎn)者-消費(fèi)者問(wèn)題。

現(xiàn)在你應(yīng)該知道為什么操作系統(tǒng)課程要講、面試要問(wèn)這個(gè)問(wèn)題了吧,因?yàn)槿绻銓?duì)生產(chǎn)者-消費(fèi)者問(wèn)題不理解的話,本質(zhì)上你是無(wú)法正確的寫(xiě)出線程池的。

限于篇幅在這里博主不打算詳細(xì)的講解生產(chǎn)者消費(fèi)者問(wèn)題,參考操作系統(tǒng)相關(guān)資料就能獲取答案。這里博主打算講一講一般提交給線程池的任務(wù)是什么樣子的。

一般來(lái)說(shuō)提交給線程池的任務(wù)包含兩部分:1)需要被處理的數(shù)據(jù);2)處理數(shù)據(jù)的函數(shù)

structtask{void* data;// 任務(wù)所攜帶的數(shù)據(jù)handler handle;// 處理數(shù)據(jù)的方法}

(注意,你也可以把代碼中的struct理解成class,也就是對(duì)象。)

線程池中的線程會(huì)阻塞在隊(duì)列上,當(dāng)生產(chǎn)者向隊(duì)列中寫(xiě)入數(shù)據(jù)后,線程池中的某個(gè)線程會(huì)被喚醒,該線程從隊(duì)列中取出上述結(jié)構(gòu)體(或者對(duì)象),以結(jié)構(gòu)體(或者對(duì)象)中的數(shù)據(jù)為參數(shù)并調(diào)用處理函數(shù):

while(true) {structtask=GetFromQueue();// 從隊(duì)列中取出數(shù)據(jù)task->handle(task->data);// 處理數(shù)據(jù)}

以上就是線程池最核心的部分。

理解這些你就能明白線程池是如何工作的了。

線程池中線程的數(shù)量

現(xiàn)在線程池有了,那么線程池中線程的數(shù)量該是多少呢?

在接著往下看前先自己想一想這個(gè)問(wèn)題。

如果你能看到這里說(shuō)明還沒(méi)有睡著。

要知道線程池的線程過(guò)少就不能充分利用CPU,線程創(chuàng)建的過(guò)多反而會(huì)造成系統(tǒng)性能下降,內(nèi)存占用過(guò)多,線程切換造成的消耗等等。因此線程的數(shù)量既不能太多也不能太少,那到底該是多少呢?

回答這個(gè)問(wèn)題,你需要知道線程池處理的任務(wù)有哪幾類,有的同學(xué)可能會(huì)說(shuō)你不是說(shuō)有兩類嗎?長(zhǎng)任務(wù)和短任務(wù),這個(gè)是從生命周期的角度來(lái)看的,那么從處理任務(wù)所需要的資源角度看也有兩種類型,這就是沒(méi)事兒找抽型和。。啊不,是CPU密集型和I/O密集型。

1,CPU密集型

所謂CPU密集型就是說(shuō)處理任務(wù)不需要依賴外部I/O,比如科學(xué)計(jì)算、矩陣運(yùn)算等等。在這種情況下只要線程的數(shù)量和核數(shù)基本相同就可以充分利用CPU資源。

2,I/O密集型

這一類任務(wù)可能計(jì)算部分所占用時(shí)間不多,大部分時(shí)間都用在了比如磁盤(pán)I/O、網(wǎng)絡(luò)I/O等。

這種情況下就稍微復(fù)雜一些了,你需要利用性能測(cè)試工具評(píng)估出用在I/O等待上的時(shí)間,這里記為WT(wait time),以及CPU計(jì)算所需要的時(shí)間,這里記為CT(computing time),那么對(duì)于一個(gè)N核的系統(tǒng),合適的線程數(shù)大概是N * (1 + WT/CT),假設(shè)I/O等待時(shí)間和計(jì)算時(shí)間相同,那么你大概需要2N個(gè)線程才能充分利用CPU資源,注意這只是一個(gè)理論值,具體設(shè)置多少需要根據(jù)真實(shí)的業(yè)務(wù)場(chǎng)景進(jìn)行測(cè)試。

當(dāng)然充分利用CPU不是唯一需要考慮的點(diǎn),隨著線程數(shù)量的增多,內(nèi)存占用、系統(tǒng)調(diào)度、打開(kāi)的文件數(shù)量、打開(kāi)的socker數(shù)量以及打開(kāi)的數(shù)據(jù)庫(kù)鏈接等等是都需要考慮的。

因此這里沒(méi)有萬(wàn)能公式,要具體情況具體分析。

線程池不是萬(wàn)能的

線程池僅僅是多線程的一種使用形式,因此多線程面臨的問(wèn)題線程池同樣不能避免,像死鎖問(wèn)題、race condition問(wèn)題等等,關(guān)于這一部分同樣可以參考操作系統(tǒng)相關(guān)資料就能得到答案,所以基礎(chǔ)很重要呀老鐵們。

線程池使用的最佳實(shí)踐

線程池是程序員手中強(qiáng)大的武器,互聯(lián)網(wǎng)公司的各個(gè)server上幾乎都能見(jiàn)到線程池的身影,使用線程池前你需要考慮:

充分理解你的任務(wù),是長(zhǎng)任務(wù)還是短任務(wù)、是CPU密集型還是I/O密集型,如果兩種都有,那么一種可能更好的辦法是把這兩類任務(wù)放到不同的線程池中,這樣也許可以更好的確定線程數(shù)量

如果線程池中的任務(wù)有I/O操作,那么務(wù)必對(duì)此任務(wù)設(shè)置超時(shí),否則處理該任務(wù)的線程可能會(huì)一直阻塞下去

線程池中的任務(wù)最好不要同步等待其它任務(wù)的結(jié)果

總結(jié)

本節(jié)我們從CPU開(kāi)始一路來(lái)到常用的線程池,從底層到上層、從硬件到軟件。注意,這里通篇沒(méi)有出現(xiàn)任何特定的編程語(yǔ)言,線程不是語(yǔ)言層面的概念(依然不考慮用戶態(tài)線程),但是當(dāng)你真正理解了線程后,相信你可以在任何一門(mén)語(yǔ)言下用好多線程,你需要理解的是道,此后才是術(shù)。

原文標(biāo)題:看完這篇還不懂高并發(fā)中的線程與線程池你來(lái)打我(內(nèi)含20張圖)

文章出處:【微信公眾號(hào):玩轉(zhuǎn)單片機(jī)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10804

    瀏覽量

    210841
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    8

    文章

    2966

    瀏覽量

    73814

原文標(biāo)題:看完這篇還不懂高并發(fā)中的線程與線程池你來(lái)打我(內(nèi)含20張圖)

文章出處:【微信號(hào):mcu168,微信公眾號(hào):硬件攻城獅】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Python中多線程和多進(jìn)程的區(qū)別

    Python作為一種高級(jí)編程語(yǔ)言,提供了多種并發(fā)編程的方式,其中多線程與多進(jìn)程是最常見(jiàn)的兩種方式之一。在本文中,我們將探討Python中多線程與多進(jìn)程的概念、區(qū)別以及如何使用線程
    的頭像 發(fā)表于 10-23 11:48 ?231次閱讀
    Python中<b class='flag-5'>多線程</b>和多進(jìn)程的區(qū)別

    CPU線程和程序線程的區(qū)別

    CPU線程與程序的線程在概念、作用、實(shí)現(xiàn)方式以及性能影響等方面存在顯著差異。以下是對(duì)兩者區(qū)別的詳細(xì)闡述,旨在深入探討這一技術(shù)話題。
    的頭像 發(fā)表于 09-02 11:18 ?710次閱讀

    多線程設(shè)計(jì)模式到對(duì) CompletableFuture 的應(yīng)用

    最近在開(kāi)發(fā) 延保服務(wù) 頻道頁(yè)時(shí),為了提高查詢效率,使用到了多線程技術(shù)。為了對(duì)多線程方案設(shè)計(jì)有更加充分的了解,在業(yè)余時(shí)間讀完了《圖解 Java 多線程設(shè)計(jì)模式》這本書(shū),覺(jué)得收獲良多。本篇文章將介紹其中
    的頭像 發(fā)表于 06-26 14:18 ?253次閱讀
    <b class='flag-5'>從</b><b class='flag-5'>多線程</b>設(shè)計(jì)模式到對(duì) CompletableFuture 的應(yīng)用

    動(dòng)態(tài)線程思想學(xué)習(xí)及實(shí)踐

    ://www.javadoop.com/post/java-thread-pool? 引言 在后臺(tái)項(xiàng)目開(kāi)發(fā)過(guò)程中,我們常常借助線程來(lái)實(shí)現(xiàn)多線程任務(wù),以此提升系統(tǒng)的吞吐率和響應(yīng)性;而線程
    的頭像 發(fā)表于 06-13 15:43 ?1117次閱讀
    動(dòng)態(tài)<b class='flag-5'>線程</b><b class='flag-5'>池</b>思想學(xué)習(xí)及實(shí)踐

    java實(shí)現(xiàn)多線程的幾種方式

    了多種實(shí)現(xiàn)多線程的方式,本文將詳細(xì)介紹以下幾種方式: 1.繼承Thread類 2.實(shí)現(xiàn)Runnable接口 3.Callable和Future 4.線程 5.Java 8中
    的頭像 發(fā)表于 03-14 16:55 ?550次閱讀

    什么是動(dòng)態(tài)線程?動(dòng)態(tài)線程的簡(jiǎn)單實(shí)現(xiàn)思路

    因此,動(dòng)態(tài)可監(jiān)控線程一種針對(duì)以上痛點(diǎn)開(kāi)發(fā)的線程管理工具。主要可實(shí)現(xiàn)功能有:提供對(duì) Spring 應(yīng)用內(nèi)線程
    的頭像 發(fā)表于 02-28 10:42 ?567次閱讀

    使用C++11新特性實(shí)現(xiàn)一個(gè)通用的線程設(shè)計(jì)

    在C++11標(biāo)準(zhǔn)之前,多線程編程只能使用pthread_xxx開(kāi)頭的一組POSIX標(biāo)準(zhǔn)的接口。C++11標(biāo)準(zhǔn)開(kāi)始,多線程相關(guān)接口封裝在了C++的std命名空間里。
    的頭像 發(fā)表于 12-22 13:58 ?1127次閱讀
    使用C++11新特性實(shí)現(xiàn)一個(gè)通用的<b class='flag-5'>線程</b><b class='flag-5'>池</b>設(shè)計(jì)

    redis多線程還能保證線程安全嗎

    是單線程的,多個(gè)客戶端請(qǐng)求會(huì)按序執(zhí)行,每個(gè)請(qǐng)求使用一個(gè)線程完成,這樣可以避免多線程之間的競(jìng)爭(zhēng)條件和鎖等帶來(lái)的開(kāi)銷。但是,由于Redis是存儲(chǔ)內(nèi)存中的數(shù)據(jù)的,當(dāng)多個(gè)客戶端同時(shí)對(duì)同一個(gè)數(shù)據(jù)進(jìn)行讀寫(xiě)操作時(shí),就會(huì)存在
    的頭像 發(fā)表于 12-05 10:28 ?1628次閱讀

    線程的創(chuàng)建方式有幾種

    線程是一種用于管理和調(diào)度線程的技術(shù),能夠有效地提高系統(tǒng)的性能和資源利用率。它通過(guò)預(yù)先創(chuàng)建一組線程并維護(hù)一個(gè)工作隊(duì)列,將任務(wù)提交給線程
    的頭像 發(fā)表于 12-04 16:52 ?801次閱讀

    線程七大核心參數(shù)執(zhí)行順序

    線程是一種用于管理和調(diào)度線程執(zhí)行的技術(shù),通過(guò)將任務(wù)分配到線程池中的線程進(jìn)行處理,可以有效地控制并發(fā)線程
    的頭像 發(fā)表于 12-04 16:45 ?914次閱讀

    mfc多線程編程實(shí)例

    (圖形用戶界面)應(yīng)用程序的開(kāi)發(fā)。在這篇文章中,我們將重點(diǎn)介紹MFC中的多線程編程。 多線程編程在軟件開(kāi)發(fā)中非常重要,它可以實(shí)現(xiàn)程序的并發(fā)執(zhí)行,提高程序的效率和響應(yīng)速度。MFC提供了豐富的多線程支持,可以輕松地實(shí)現(xiàn)
    的頭像 發(fā)表于 12-01 14:29 ?1377次閱讀

    線程三大核心參數(shù)的含義 線程核心線程數(shù)制定策略

    以上考點(diǎn)作為線程面試幾乎必問(wèn)的內(nèi)容,大部分人應(yīng)該都是如數(shù)家珍,張口就來(lái),但是懂了面試八股文真的就不一定在實(shí)際運(yùn)用中真的就會(huì)把線程用好 。
    的頭像 發(fā)表于 12-01 10:20 ?972次閱讀
    <b class='flag-5'>線程</b><b class='flag-5'>池</b>三大核心參數(shù)的含義 <b class='flag-5'>線程</b><b class='flag-5'>池</b>核心<b class='flag-5'>線程</b>數(shù)制定策略

    多線程如何保證數(shù)據(jù)的同步

    。本文將詳細(xì)介紹多線程數(shù)據(jù)同步的概念、問(wèn)題、以及常見(jiàn)的解決方案。 一、多線程數(shù)據(jù)同步概念 在多線程編程中,數(shù)據(jù)同步指的是通過(guò)某種機(jī)制來(lái)確保多個(gè)線程
    的頭像 發(fā)表于 11-17 14:22 ?1108次閱讀

    基于C++11的線程實(shí)現(xiàn)

    C++11 加入了線程庫(kù),從此告別了標(biāo)準(zhǔn)庫(kù)不支持并發(fā)的歷史。然而 c++ 對(duì)于多線程的支持還是比較低級(jí),稍微高級(jí)一點(diǎn)的用法都需要自己去實(shí)現(xiàn),譬如線程、信號(hào)量等。
    的頭像 發(fā)表于 11-13 15:29 ?706次閱讀

    如何用C語(yǔ)言實(shí)現(xiàn)線程

    線程是一種多線程處理形式,大多用于高并發(fā)服務(wù)器上,它能合理有效的利用高并發(fā)服務(wù)器上的線程資源;線程與進(jìn)程用于處理各項(xiàng)分支子功能,我們通常的
    的頭像 發(fā)表于 11-13 10:41 ?980次閱讀
    如何用C語(yǔ)言實(shí)現(xiàn)<b class='flag-5'>線程</b><b class='flag-5'>池</b>