0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何正確保護(hù)共享數(shù)據(jù)編寫并行程序

科技綠洲 ? 來(lái)源:Linux開發(fā)架構(gòu)之路 ? 作者:Linux開發(fā)架構(gòu)之路 ? 2023-11-09 09:39 ? 次閱讀

非阻塞型同步 (Non-blocking Synchronization) 簡(jiǎn)介

如何正確有效的保護(hù)共享數(shù)據(jù)是編寫并行程序必須面臨的一個(gè)難題,通常的手段就是同步。同步可分為阻塞型同步(Blocking Synchronization)和非阻塞型同步( Non-blocking Synchronization)。

阻塞型同步是指當(dāng)一個(gè)線程到達(dá)臨界區(qū)時(shí),因另外一個(gè)線程已經(jīng)持有訪問該共享數(shù)據(jù)的鎖,從而不能獲取鎖資源而阻塞,直到另外一個(gè)線程釋放鎖。常見的同步原語(yǔ)有 mutex、semaphore 等。如果同步方案采用不當(dāng),就會(huì)造成死鎖(deadlock),活鎖(livelock)和優(yōu)先級(jí)反轉(zhuǎn)(priority inversion),以及效率低下等現(xiàn)象。

為了降低風(fēng)險(xiǎn)程度和提高程序運(yùn)行效率,業(yè)界提出了不采用鎖的同步方案,依照這種設(shè)計(jì)思路設(shè)計(jì)的算法稱為非阻塞型算法,其本質(zhì)特征就是停止一個(gè)線程的執(zhí)行不會(huì)阻礙系統(tǒng)中其他執(zhí)行實(shí)體的運(yùn)行。

比較流行的 Non-blocking Synchronization 實(shí)現(xiàn)方案有三種:

  1. 1、Wait-free
  2. Wait-free 是指任意線程的任何操作都可以在有限步之內(nèi)結(jié)束,而不用關(guān)心其它線程的執(zhí)行速度。Wait-free 是基于 per-thread 的,可以認(rèn)為是 starvation-free 的。非常遺憾的是實(shí)際情況并非如此,采用 Wait-free 的程序并不能保證 starvation-free,同時(shí)內(nèi)存消耗也隨線程數(shù)量而線性增長(zhǎng)。目前只有極少數(shù)的非阻塞算法實(shí)現(xiàn)了這一點(diǎn)。
  3. 2、Lock-free
  4. Lock-Free 是指能夠確保執(zhí)行它的所有線程中至少有一個(gè)能夠繼續(xù)往下執(zhí)行。由于每個(gè)線程不是 starvation-free 的,即有些線程可能會(huì)被任意地延遲,然而在每一步都至少有一個(gè)線程能夠往下執(zhí)行,因此系統(tǒng)作為一個(gè)整體是在持續(xù)執(zhí)行的,可以認(rèn)為是 system-wide 的。所有 Wait-free 的算法都是 Lock-Free 的。
  5. 3、Obstruction-free
  6. Obstruction-free 是指在任何時(shí)間點(diǎn),一個(gè)孤立運(yùn)行線程的每一個(gè)操作可以在有限步之內(nèi)結(jié)束。只要沒有競(jìng)爭(zhēng),線程就可以持續(xù)運(yùn)行。一旦共享數(shù)據(jù)被修改,Obstruction-free 要求中止已經(jīng)完成的部分操作,并進(jìn)行回滾。所有 Lock-Free 的算法都是 Obstruction-free 的。

綜上所述,不難得出 Obstruction-free 是 Non-blocking synchronization 中性能最差的,而 Wait-free 性能是最好的,但實(shí)現(xiàn)難度也是最大的,因此 Lock-free 算法開始被重視,并廣泛運(yùn)用于正在運(yùn)行的程序中,比如 linux 內(nèi)核。

一般采用原子級(jí)的 read-modify-write 原語(yǔ)來(lái)實(shí)現(xiàn) Lock-Free 算法,其中 LL 和 SC 是 Lock-Free 理論研究領(lǐng)域的理想原語(yǔ),但實(shí)現(xiàn)這些原語(yǔ)需要 CPU 指令的支持,非常遺憾的是目前沒有任何 CPU 直接實(shí)現(xiàn)了 SC 原語(yǔ)。根據(jù)此理論,業(yè)界在原子操作的基礎(chǔ)上提出了著名的 CAS(Compare - And - Swap)操作來(lái)實(shí)現(xiàn) Lock-Free 算法,Intel 實(shí)現(xiàn)了一條類似該操作的指令:cmpxchg8。

CAS 原語(yǔ)負(fù)責(zé)將某處內(nèi)存地址的值(1 個(gè)字節(jié))與一個(gè)期望值進(jìn)行比較,如果相等,則將該內(nèi)存地址處的值替換為新值,CAS 操作偽碼描述如下:

清單 1. CAS 偽碼

Bool CAS(T* addr, T expected, T newValue)
{
if( *addr == expected )
{
*addr = newValue;
return true;
}
else
return false;
}

在實(shí)際開發(fā)過(guò)程中,利用 CAS 進(jìn)行同步,代碼如下所示:

清單 2. CAS 實(shí)際操作

do{
備份舊數(shù)據(jù);
基于舊數(shù)據(jù)構(gòu)造新數(shù)據(jù);
}while(!CAS( 內(nèi)存地址,備份的舊數(shù)據(jù),新數(shù)據(jù) ))

就是指當(dāng)兩者進(jìn)行比較時(shí),如果相等,則證明共享數(shù)據(jù)沒有被修改,替換成新值,然后繼續(xù)往下運(yùn)行;如果不相等,說(shuō)明共享數(shù)據(jù)已經(jīng)被修改,放棄已經(jīng)所做的操作,然后重新執(zhí)行剛才的操作。容易看出 CAS 操作是基于共享數(shù)據(jù)不會(huì)被修改的假設(shè),采用了類似于數(shù)據(jù)庫(kù)的 commit-retry 的模式。當(dāng)同步?jīng)_突出現(xiàn)的機(jī)會(huì)很少時(shí),這種假設(shè)能帶來(lái)較大的性能提升。

加鎖的層級(jí)

根據(jù)復(fù)雜程度、加鎖粒度及運(yùn)行速度,可以得出如下圖所示的鎖層級(jí):

圖 1. 加鎖層級(jí)

圖片

其中標(biāo)注為紅色字體的方案為 Blocking synchronization,黑色字體為 Non-blocking synchronization。Lock-based 和 Lockless-based 兩者之間的區(qū)別僅僅是加鎖粒度的不同。圖中最底層的方案就是大家經(jīng)常使用的 mutex 和 semaphore 等方案,代碼復(fù)雜度低,但運(yùn)行效率也最低。

Linux 內(nèi)核中的無(wú)鎖分析

Linux 內(nèi)核可能是當(dāng)今最大最復(fù)雜的并行程序之一,它的并行主要來(lái)至于中斷、內(nèi)核搶占及 SMP 等。內(nèi)核設(shè)計(jì)者們?yōu)榱瞬粩嗵岣?Linux 內(nèi)核的效率,從全局著眼,逐步廢棄了大內(nèi)核鎖來(lái)降低鎖的粒度;從細(xì)處下手,不斷對(duì)局部代碼進(jìn)行優(yōu)化,用無(wú)鎖編程替代基于鎖的方案,如 seqlock 及 RCU 等;不斷減少鎖沖突程度、降低等待時(shí)間,如 Double-checked locking 和原子鎖等。

內(nèi)核無(wú)鎖第一層級(jí) — 少鎖

無(wú)論什么時(shí)候當(dāng)臨界區(qū)中的代碼僅僅需要加鎖一次,同時(shí)當(dāng)其獲取鎖的時(shí)候必須是線程安全的,此時(shí)就可以利用 Double-checked Locking 模式來(lái)減少鎖競(jìng)爭(zhēng)和加鎖載荷。目前 Double-checked Locking 已經(jīng)廣泛應(yīng)用于單例 (Singleton) 模式中。內(nèi)核設(shè)計(jì)者基于此思想,巧妙的將 Double-checked Locking 方法運(yùn)用于內(nèi)核代碼中。

當(dāng)一個(gè)進(jìn)程已經(jīng)僵死,即進(jìn)程處于 TASK_ZOMBIE 狀態(tài),如果父進(jìn)程調(diào)用 waitpid() 系統(tǒng)調(diào)用時(shí),父進(jìn)程需要為子進(jìn)程做一些清理性的工作,代碼如下所示:

清單 3. 少鎖操作

984 static int wait_task_zombie(task_t *p, int noreap,
985 struct siginfo __user *infop,
986 int __user *stat_addr, struct rusage __user *ru)
987 {
……
1103 if (p->real_parent != p->parent) {
1104 write_lock_irq(&tasklist_lock);
1105 /* Double-check with lock held. */
1106 if (p->real_parent != p->parent) {
1107 __ptrace_unlink(p);
1108 // TODO: is this safe?
1109 p->exit_state = EXIT_ZOMBIE;
……
1120 }
1121 write_unlock_irq(&tasklist_lock);
1122 }
……
1127 }

如果將 write_lock_irq 放置于 1103 行之前,鎖的范圍過(guò)大,鎖的負(fù)載也會(huì)加重,影響效率;如果將加鎖的代碼放到判斷里面,且沒有 1106 行的代碼,程序會(huì)正確嗎?在單核情況下是正確的,但在雙核情況下問題就出現(xiàn)了。一個(gè)非主進(jìn)程在一個(gè) CPU 上運(yùn)行,正準(zhǔn)備調(diào)用 exit 退出,此時(shí)主進(jìn)程在另外一個(gè) CPU 上運(yùn)行,在子進(jìn)程調(diào)用 release_task 函數(shù)之前調(diào)用上述代碼。子進(jìn)程在 exit_notify 函數(shù)中,先持有讀寫鎖 tasklist_lock,調(diào)用 forget_original_parent。主進(jìn)程運(yùn)行到 1104 處,由于此時(shí)子進(jìn)程先持有該鎖,所以父進(jìn)程只好等待。在 forget_original_parent 函數(shù)中,如果該子進(jìn)程還有子進(jìn)程,則會(huì)調(diào)用 reparent_thread(),將執(zhí)行 p->parent = p->real_parent; 語(yǔ)句,導(dǎo)致兩者相等,等非主進(jìn)程釋放讀寫鎖 tasklist_lock 時(shí),另外一個(gè) CPU 上的主進(jìn)程被喚醒,一旦開始執(zhí)行,繼續(xù)運(yùn)行將會(huì)導(dǎo)致 bug。

嚴(yán)格的說(shuō),Double-checked locking 不屬于無(wú)鎖編程的范疇,但由原來(lái)的每次加鎖訪問到大多數(shù)情況下無(wú)須加鎖,就是一個(gè)巨大的進(jìn)步。同時(shí)從這里也可以看出一點(diǎn)端倪,內(nèi)核開發(fā)者為了降低鎖沖突率,減少等待時(shí)間,提高運(yùn)行效率,一直在持續(xù)不斷的進(jìn)行改進(jìn)。

內(nèi)核無(wú)鎖第二層級(jí) — 原子鎖

原子操作可以保證指令以原子的方式執(zhí)行——執(zhí)行過(guò)程不被打斷。內(nèi)核提供了兩組原子操作接口:一組針對(duì)于整數(shù)進(jìn)行操作,另外一組針對(duì)于單獨(dú)的位進(jìn)行操作。內(nèi)核中的原子操作通常是內(nèi)聯(lián)函數(shù),一般是通過(guò)內(nèi)嵌匯編指令來(lái)完成。對(duì)于一些簡(jiǎn)單的需求,例如全局統(tǒng)計(jì)、引用計(jì)數(shù)等等,可以歸結(jié)為是對(duì)整數(shù)的原子計(jì)算。

內(nèi)核無(wú)鎖第三層級(jí) — Lock-free

  1. Lock-free 應(yīng)用場(chǎng)景一 —— Spin Lock

Spin Lock 是一種輕量級(jí)的同步方法,一種非阻塞鎖。當(dāng) lock 操作被阻塞時(shí),并不是把自己掛到一個(gè)等待隊(duì)列,而是死循環(huán) CPU 空轉(zhuǎn)等待其他線程釋放鎖。Spin lock 鎖實(shí)現(xiàn)代碼如下:

清單 4. spin lock 實(shí)現(xiàn)代碼

static inline void __preempt_spin_lock(spinlock_t *lock)
{
……
do {
preempt_enable();
while (spin_is_locked(lock))
cpu_relax();
preempt_disable();
} while (!_raw_spin_trylock(lock));
}

static inline int _raw_spin_trylock(spinlock_t *lock)
{
char oldval;
__asm__ __volatile__(
"xchgb %b0,%1"
:"=q" (oldval), "=m" (lock->lock)
:"0" (0) : "memory");
return oldval > 0;
}

匯編語(yǔ)言指令 xchgb 原子性的交換 8 位 oldval( 存 0) 和 lock->lock 的值,如果 oldval 為 1(lock 初始值為 1),則獲取鎖成功,反之,則繼續(xù)循環(huán),接著 relax 休息一會(huì)兒,然后繼續(xù)周而復(fù)始,直到成功。

對(duì)于應(yīng)用程序來(lái)說(shuō),希望任何時(shí)候都能獲取到鎖,也就是期望 lock->lock 為 1,那么用 CAS 原語(yǔ)來(lái)描述 _raw_spin_trylock(lock) 就是 CAS(lock->lock,1,0);

如果同步操作總是能在數(shù)條指令內(nèi)完成,那么使用 Spin Lock 會(huì)比傳統(tǒng)的 mutex lock 快一個(gè)數(shù)量級(jí)。Spin Lock 多用于多核系統(tǒng)中,適合于鎖持有時(shí)間小于將一個(gè)線程阻塞和喚醒所需時(shí)間的場(chǎng)合。

pthread 庫(kù)已經(jīng)提供了對(duì) spin lock 的支持,所以用戶態(tài)程序也能很方便的使用 spin lock 了,需要包含 pthread.h 。在某些場(chǎng)景下,pthread_spin_lock 效率是 pthread_mutex_lock 效率的一倍多。美中不足的是,內(nèi)核實(shí)現(xiàn)了讀寫 spin lock 鎖,但 pthread 未能實(shí)現(xiàn)。

  1. Lock -free 應(yīng)用場(chǎng)景二 —— Seqlock

手表最主要最常用的功能是讀時(shí)間,而不是校正時(shí)間,一旦后者成了最常用的功能,消費(fèi)者肯定不會(huì)買賬。計(jì)算機(jī)的時(shí)鐘也是這個(gè)功能,修改時(shí)間是小概率事件,而讀時(shí)間是經(jīng)常發(fā)生的行為。以下代碼摘自 2.4.34 內(nèi)核:

清單 5. 2.4.34 seqlock 實(shí)現(xiàn)代碼

443 void do_gettimeofday(struct timeval *tv)
444 {
……
448 read_lock_irqsave(&xtime_lock, flags);
……
455 sec = xtime.tv_sec;
456 usec += xtime.tv_usec;
457 read_unlock_irqrestore(&xtime_lock, flags);
……
466 }

468 void do_settimeofday(struct timeval *tv)
469 {
470 write_lock_irq(&xtime_lock);
……
490 write_unlock_irq(&xtime_lock);
491 }

不難發(fā)現(xiàn)獲取時(shí)間和修改時(shí)間采用的是 spin lock 讀寫鎖,讀鎖和寫鎖具有相同的優(yōu)先級(jí),只要讀持有鎖,寫鎖就必須等待,反之亦然。

Linux 2.6 內(nèi)核中引入一種新型鎖——順序鎖 (seqlock),它與 spin lock 讀寫鎖非常相似,只是它為寫者賦予了較高的優(yōu)先級(jí)。也就是說(shuō),即使讀者正在讀的時(shí)候也允許寫者繼續(xù)運(yùn)行。當(dāng)存在多個(gè)讀者和少數(shù)寫者共享一把鎖時(shí),seqlock 便有了用武之地,因?yàn)?seqlock 對(duì)寫者更有利,只要沒有其他寫者,寫鎖總能獲取成功。根據(jù) lock-free 和時(shí)鐘功能的思想,內(nèi)核開發(fā)者在 2.6 內(nèi)核中,將上述讀寫鎖修改成了順序鎖 seqlock,代碼如下:

清單 6. 2.6.10 seqlock 實(shí)現(xiàn)代碼

static inline unsigned read_seqbegin(const seqlock_t *sl)
{
unsigned ret = sl->sequence;
smp_rmb();
return ret;
}

static inline int read_seqretry(const seqlock_t *sl, unsigned iv)
{
smp_rmb();
return (iv & 1) | (sl->sequence ^ iv);
}

static inline void write_seqlock(seqlock_t *sl)
{
spin_lock(&sl->lock);
++sl->sequence;
smp_wmb();
}

void do_gettimeofday(struct timeval *tv)
{
unsigned long seq;
unsigned long usec, sec;
unsigned long max_ntp_tick;
……
do {
unsigned long lost;
seq = read_seqbegin(&xtime_lock);
……
sec = xtime.tv_sec;
usec += (xtime.tv_nsec / 1000);
} while (read_seqretry(&xtime_lock, seq));
……
tv->tv_sec = sec;
tv->tv_usec = usec;
}

int do_settimeofday(struct timespec *tv)
{
……
write_seqlock_irq(&xtime_lock);
……
write_sequnlock_irq(&xtime_lock);
clock_was_set();
return 0;
}

Seqlock 實(shí)現(xiàn)原理是依賴一個(gè)序列計(jì)數(shù)器,當(dāng)寫者寫入數(shù)據(jù)時(shí),會(huì)得到一把鎖,并且將序列值加 1。當(dāng)讀者讀取數(shù)據(jù)之前和之后,該序列號(hào)都會(huì)被讀取,如果讀取的序列號(hào)值都相同,則表明寫沒有發(fā)生。反之,表明發(fā)生過(guò)寫事件,則放棄已進(jìn)行的操作,重新循環(huán)一次,直至成功。不難看出,do_gettimeofday 函數(shù)里面的 while 循環(huán)和接下來(lái)的兩行賦值操作就是 CAS 操作。

采用順序鎖 seqlock 好處就是寫者永遠(yuǎn)不會(huì)等待,缺點(diǎn)就是有些時(shí)候讀者不得不反復(fù)多次讀相同的數(shù)據(jù)直到它獲得有效的副本。當(dāng)要保護(hù)的臨界區(qū)很小,很簡(jiǎn)單,頻繁讀取而寫入很少發(fā)生(WRRM--- Write Rarely Read Mostly)且必須快速時(shí),就可以使用 seqlock。但 seqlock 不能保護(hù)包含有指針的數(shù)據(jù)結(jié)構(gòu),因?yàn)楫?dāng)寫者修改數(shù)據(jù)結(jié)構(gòu)時(shí),讀者可能會(huì)訪問一個(gè)無(wú)效的指針。

  1. Lock -free 應(yīng)用場(chǎng)景三 —— RCU

在 2.6 內(nèi)核中,開發(fā)者還引入了一種新的無(wú)鎖機(jī)制 -RCU(Read-Copy-Update),允許多個(gè)讀者和寫者并發(fā)執(zhí)行。RCU 技術(shù)的核心是寫操作分為寫和更新兩步,允許讀操作在任何時(shí)候無(wú)阻礙的運(yùn)行,換句話說(shuō),就是通過(guò)延遲寫來(lái)提高同步性能。RCU 主要應(yīng)用于 WRRM 場(chǎng)景,但它對(duì)可保護(hù)的數(shù)據(jù)結(jié)構(gòu)做了一些限定:RCU 只保護(hù)被動(dòng)態(tài)分配并通過(guò)指針引用的數(shù)據(jù)結(jié)構(gòu),同時(shí)讀寫控制路徑不能有睡眠。以下數(shù)組動(dòng)態(tài)增長(zhǎng)代碼摘自 2.4.34 內(nèi)核:

清單 7. 2.4.34 RCU 實(shí)現(xiàn)代碼

其中 ipc_lock 是讀者,grow_ary 是寫者,不論是讀或者寫,都需要加 spin lock 對(duì)被保護(hù)的數(shù)據(jù)結(jié)構(gòu)進(jìn)行訪問。改變數(shù)組大小是小概率事件,而讀取是大概率事件,同時(shí)被保護(hù)的數(shù)據(jù)結(jié)構(gòu)是指針,滿足 RCU 運(yùn)用場(chǎng)景。以下代碼摘自 2.6.10 內(nèi)核:

清單 8. 2.6.10 RCU 實(shí)現(xiàn)代碼

#define rcu_read_lock() preempt_disable()
#define rcu_read_unlock() preempt_enable()
#define rcu_assign_pointer(p, v) ({
smp_wmb();
(p) = (v);
})

struct kern_ipc_perm* ipc_lock(struct ipc_ids* ids, int id)
{
……
rcu_read_lock();
entries = rcu_dereference(ids->entries);
if(lid >= entries->size) {
rcu_read_unlock();
return NULL;
}
out = entries->p[lid];
if(out == NULL) {
rcu_read_unlock();
return NULL;
}
……
return out;
}

static int grow_ary(struct ipc_ids* ids, int newsize)
{
struct ipc_id_ary* new;
struct ipc_id_ary* old;
……
new = ipc_rcu_alloc(sizeof(struct kern_ipc_perm *)*newsize +
sizeof(struct ipc_id_ary));
if(new == NULL)
return size;
new->size = newsize;
memcpy(new->p, ids->entries->p, sizeof(struct kern_ipc_perm *)*size
+sizeof(struct ipc_id_ary));
for(i=size;i new->p[i] = NULL;
}
old = ids->entries;
/*
* Use rcu_assign_pointer() to make sure the memcpyed contents
* of the new array are visible before the new array becomes visible.
*/
rcu_assign_pointer(ids->entries, new);
ipc_rcu_putref(old);
return newsize;
};i++)>

縱觀整個(gè)流程,寫者除內(nèi)核屏障外,幾乎沒有一把鎖。當(dāng)寫者需要更新數(shù)據(jù)結(jié)構(gòu)時(shí),首先復(fù)制該數(shù)據(jù)結(jié)構(gòu),申請(qǐng) new 內(nèi)存,然后對(duì)副本進(jìn)行修改,調(diào)用 memcpy 將原數(shù)組的內(nèi)容拷貝到 new 中,同時(shí)對(duì)擴(kuò)大的那部分賦新值,修改完畢后,寫者調(diào)用 rcu_assign_pointer 修改相關(guān)數(shù)據(jù)結(jié)構(gòu)的指針,使之指向被修改后的新副本,整個(gè)寫操作一氣呵成,其中修改指針值的操作屬于原子操作。在數(shù)據(jù)結(jié)構(gòu)被寫者修改后,需要調(diào)用內(nèi)存屏障 smp_wmb,讓其他 CPU 知曉已更新的指針值,否則會(huì)導(dǎo)致 SMP 環(huán)境下的 bug。當(dāng)所有潛在的讀者都執(zhí)行完成后,調(diào)用 call_rcu 釋放舊副本。同 Spin lock 一樣,RCU 同步技術(shù)主要適用于 SMP 環(huán)境。

內(nèi)核無(wú)鎖第四層級(jí) — 免鎖

環(huán)形緩沖區(qū)是生產(chǎn)者和消費(fèi)者模型中常用的數(shù)據(jù)結(jié)構(gòu)。生產(chǎn)者將數(shù)據(jù)放入數(shù)組的尾端,而消費(fèi)者從數(shù)組的另一端移走數(shù)據(jù),當(dāng)達(dá)到數(shù)組的尾部時(shí),生產(chǎn)者繞回到數(shù)組的頭部。

如果只有一個(gè)生產(chǎn)者和一個(gè)消費(fèi)者,那么就可以做到免鎖訪問環(huán)形緩沖區(qū)(Ring Buffer)。寫入索引只允許生產(chǎn)者訪問并修改,只要寫入者在更新索引之前將新的值保存到緩沖區(qū)中,則讀者將始終看到一致的數(shù)據(jù)結(jié)構(gòu)。同理,讀取索引也只允許消費(fèi)者訪問并修改。

圖 2. 環(huán)形緩沖區(qū)實(shí)現(xiàn)原理圖

圖片

如圖所示,當(dāng)讀者和寫者指針相等時(shí),表明緩沖區(qū)是空的,而只要寫入指針在讀取指針后面時(shí),表明緩沖區(qū)已滿。

清單 9. 2.6.10 環(huán)形緩沖區(qū)實(shí)現(xiàn)代碼

/*
* __kfifo_put - puts some data into the FIFO, no locking version
* Note that with only one concurrent reader and one concurrent
* writer, you don't need extra locking to use these functions.
*/
unsigned int __kfifo_put(struct kfifo *fifo,
unsigned char *buffer, unsigned int len)
{
unsigned int l;
len = min(len, fifo->size - fifo->in + fifo->out);
/* first put the data starting from fifo->in to buffer end */
l = min(len, fifo->size - (fifo->in & (fifo->size - 1)));
memcpy(fifo->buffer + (fifo->in & (fifo->size - 1)), buffer, l);
/* then put the rest (if any) at the beginning of the buffer */
memcpy(fifo->buffer, buffer + l, len - l);
fifo->in += len;
return len;
}

/*
* __kfifo_get - gets some data from the FIFO, no locking version
* Note that with only one concurrent reader and one concurrent
* writer, you don't need extra locking to use these functions.
*/
unsigned int __kfifo_get(struct kfifo *fifo,
unsigned char *buffer, unsigned int len)
{
unsigned int l;
len = min(len, fifo->in - fifo->out);
/* first get the data from fifo->out until the end of the buffer */
l = min(len, fifo->size - (fifo->out & (fifo->size - 1)));
memcpy(buffer, fifo->buffer + (fifo->out & (fifo->size - 1)), l);
/* then get the rest (if any) from the beginning of the buffer */
memcpy(buffer + l, fifo->buffer, len - l);
fifo->out += len;
return len;
}

以上代碼摘自 2.6.10 內(nèi)核,通過(guò)代碼的注釋(斜體部分)可以看出,當(dāng)只有一個(gè)消費(fèi)者和一個(gè)生產(chǎn)者時(shí),可以不用添加任何額外的鎖,就能達(dá)到對(duì)共享數(shù)據(jù)的訪問。

總結(jié)

通過(guò)對(duì)比 2.4 和 2.6 內(nèi)核代碼,不得不佩服內(nèi)核開發(fā)者的智慧,為了提高內(nèi)核性能,一直不斷的進(jìn)行各種優(yōu)化,并將業(yè)界最新的 lock-free 理念運(yùn)用到內(nèi)核中。

在實(shí)際開發(fā)過(guò)程中,進(jìn)行無(wú)鎖設(shè)計(jì)時(shí),首先進(jìn)行場(chǎng)景分析,因?yàn)槊糠N無(wú)鎖方案都有特定的應(yīng)用場(chǎng)景,接著根據(jù)場(chǎng)景分析進(jìn)行數(shù)據(jù)結(jié)構(gòu)的初步設(shè)計(jì),然后根據(jù)先前的分析結(jié)果進(jìn)行并發(fā)模型建模,最后在調(diào)整數(shù)據(jù)結(jié)構(gòu)的設(shè)計(jì),以便達(dá)到最優(yōu)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    6713

    瀏覽量

    88303
  • 線程
    +關(guān)注

    關(guān)注

    0

    文章

    501

    瀏覽量

    19580
  • 并行程序
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    5891
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    面向多核處理器的低級(jí)并行程序驗(yàn)證

    指令的操作語(yǔ)義和所需要的安全策略,使得在該框架下可以驗(yàn)證多核并行程序的部分正確性。關(guān)鍵詞 多核處理器,自旋鎖,程序驗(yàn)證,匯編級(jí),部分正確性Abstract As the multi-c
    發(fā)表于 10-06 09:56

    AD7606并行讀取數(shù)據(jù)沒有讀出正確數(shù)據(jù)

    在使用AD7606的過(guò)程中,我使用的是Cyclone IV控制AD7606,將CONVSTA和B接在一起,再用并行讀取數(shù)據(jù),當(dāng)CONVST下拉后,busy有信號(hào)返回為4us,讀出的8通道數(shù)據(jù)都不
    發(fā)表于 08-27 11:43

    如何確保正確的到達(dá)順序讀取正確數(shù)據(jù)

    步驟(i)如何確保正確的到達(dá)順序讀取正確數(shù)據(jù)?我是否需要為SPI塊中的每個(gè)消息添加一個(gè)動(dòng)作“只讀”,我是否需要在每個(gè)動(dòng)作“只讀”之間添加一個(gè)動(dòng)作“延遲”?我附上了SPI塊的屏幕截圖
    發(fā)表于 11-06 12:37

    單片機(jī)前后臺(tái)順序執(zhí)行程序

    簡(jiǎn)單的前后臺(tái)順序執(zhí)行程序,這類寫法是大多數(shù)人使用的方法,不需用思考程序的具體架構(gòu),直接通過(guò)執(zhí)行順序編寫應(yīng)用程序即可。2. 時(shí)間片輪詢法,此方法是介于順序執(zhí)行與操作系統(tǒng)之間的一種方法。3
    發(fā)表于 11-25 09:25

    MPI并行程序設(shè)計(jì)的負(fù)載平衡實(shí)現(xiàn)方法

    MPI是目前集群系統(tǒng)中最重要的并行編程工具,它采用消息傳遞的方式實(shí)現(xiàn)并行程序間通信。在MPI 并行程序設(shè)計(jì)中實(shí)現(xiàn)負(fù)載平衡有著重要的意義,可以減少運(yùn)行時(shí)間,提高M(jìn)PI 并行
    發(fā)表于 07-30 10:56 ?35次下載

    正確保護(hù)iSCSI存儲(chǔ)系統(tǒng)的五大絕招

    正確保護(hù)iSCSI存儲(chǔ)系統(tǒng)的五大絕招 如何才能將網(wǎng)絡(luò)黑客阻擋在iSCSI SAN系統(tǒng)的大門之外?本文中將會(huì)推薦5種解決辦法。提醒讀者注
    發(fā)表于 01-11 11:58 ?734次閱讀

    VFP9.0編寫程序

    數(shù)據(jù)庫(kù)編寫程序,VFP9.0編寫程序,中文版利用數(shù)據(jù)庫(kù)知識(shí)編寫可以運(yùn)行程序
    發(fā)表于 06-21 16:42 ?0次下載

    行程序如何并行化,串行和并行的區(qū)別

    行程序是基于嵌入式Linux串行通信GUI終端設(shè)計(jì)及實(shí)現(xiàn)。傳統(tǒng)意義上的寫法,我們得到的往往會(huì)是串行執(zhí)行的程序形態(tài),程序的總的執(zhí)行時(shí)間是method1的執(zhí)行時(shí)間time1加上method2的執(zhí)行時(shí)間time2,這樣總的執(zhí)行時(shí)間t
    發(fā)表于 12-08 10:23 ?2.2w次閱讀
    串<b class='flag-5'>行程序</b>如何<b class='flag-5'>并行</b>化,串行和<b class='flag-5'>并行</b>的區(qū)別

    消息傳遞并行程序的變異測(cè)試

    并行程序執(zhí)行的不確定性,增加了測(cè)試的復(fù)雜性和難度.研究消息傳遞并行程序的變異測(cè)試,提出其弱變異測(cè)試轉(zhuǎn)化方法,以提高該程序變異測(cè)試的效率.首先,根據(jù)消息傳遞并行程序包含語(yǔ)句的類型和語(yǔ)句變
    發(fā)表于 01-10 15:31 ?0次下載

    支持容錯(cuò)的任務(wù)并行程序設(shè)計(jì)模型FT-TPP

    兩個(gè)顯著問題:(1)如何讓軟件設(shè)計(jì)充分發(fā)掘硬件的并行處理能力,從而提高系統(tǒng)的性能;(2)在系統(tǒng)硬件規(guī)模不斷擴(kuò)大、復(fù)雜度越來(lái)越高的情況下,如何保證系統(tǒng)的可靠性. 任務(wù)并行程序設(shè)計(jì)模型已成為并行程序設(shè)計(jì)的主流,其通
    發(fā)表于 01-12 09:35 ?0次下載
    支持容錯(cuò)的任務(wù)<b class='flag-5'>并行程序</b>設(shè)計(jì)模型FT-TPP

    自制CPU(四)程序編寫

    在我們?cè)O(shè)計(jì)出來(lái)前邊三種CPU之后,我們來(lái)進(jìn)行程序編寫。 所謂程序編寫,就是;利用我們寫好的CPU,根據(jù)我們可執(zhí)行的指令集,來(lái)編寫一段
    的頭像 發(fā)表于 07-16 09:20 ?7123次閱讀

    如何進(jìn)行程序的擴(kuò)展

    本文檔的主要內(nèi)容詳細(xì)介紹的是程序的擴(kuò)展性如何進(jìn)行程序的擴(kuò)展。
    發(fā)表于 04-26 18:26 ?0次下載
    如何進(jìn)<b class='flag-5'>行程序</b>的擴(kuò)展

    如何使用OpenMP實(shí)現(xiàn)電磁場(chǎng)FDTD多核并行程序的設(shè)計(jì)

    Interface)是一種基于消息傳遞并行編程模型的工業(yè)標(biāo)準(zhǔn),主要用于分布存儲(chǔ)體系結(jié)構(gòu)的現(xiàn)實(shí),是已被證實(shí)了的理想的程序設(shè)計(jì)模型;OpenMP標(biāo)準(zhǔn),主要用于共享存儲(chǔ)體系結(jié)構(gòu)的并行編程,
    發(fā)表于 11-04 10:40 ?0次下載
    如何使用OpenMP實(shí)現(xiàn)電磁場(chǎng)FDTD多核<b class='flag-5'>并行程序</b>的設(shè)計(jì)

    PLC編寫程序編寫的是什么?

    對(duì)于PLC程序編寫,一個(gè)好的plc程序一般都具有程序的具有正確性、可靠性、方便性、簡(jiǎn)潔性和可讀性就是很好的
    的頭像 發(fā)表于 05-10 17:38 ?1615次閱讀
    PLC<b class='flag-5'>編寫程序</b><b class='flag-5'>編寫</b>的是什么?

    idea如何多次運(yùn)行程序

    在計(jì)算機(jī)編程的世界中,我們通常需要多次運(yùn)行程序來(lái)測(cè)試其性能、調(diào)試錯(cuò)誤或者進(jìn)行大規(guī)模的數(shù)據(jù)處理。但是有些編程初學(xué)者可能會(huì)困惑于如何多次運(yùn)行程序的問題。本文將會(huì)詳細(xì)介紹如何多次運(yùn)行程序的不
    的頭像 發(fā)表于 12-06 14:59 ?1099次閱讀