0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

StratoVirt中vCPU管理模塊的組成及位置

openEuler ? 來(lái)源:openEuler ? 作者:openEuler ? 2021-12-20 15:41 ? 次閱讀

StratoVirt是開(kāi)源在openEuler社區(qū)的輕量級(jí)虛擬化平臺(tái),具備輕量低噪、強(qiáng)安全性的行業(yè)競(jìng)爭(zhēng)力。 StratoVirt進(jìn)程運(yùn)行在用戶(hù)態(tài),在虛擬機(jī)啟動(dòng)之前,StratoVirt會(huì)完成啟動(dòng)之前的準(zhǔn)備工作,包括虛擬機(jī)內(nèi)存的初始化、CPU寄存器初始化、設(shè)備初始化等,啟動(dòng),CPU寄存器初始化和虛擬機(jī)在運(yùn)行過(guò)程中vCPU陷出事件的處理,都是由StratoVirt的vCPU管理模塊CPU完成。如下是StratoVirt中vCPU管理模塊的組成,以及其在StratoVirt中的位置。

stratovirt
├──acpi
├──address_space
├──boot_loader
├──Cargo.lock
├──Cargo.toml
├──cpu
│├──Cargo.toml
│└──src
│├──aarch64
││├──caps.rs
││├──core_regs.rs
││└──mod.rs
│├──lib.rs
│└──x86_64
│├──caps.rs
│├──cpuid.rs
│└──mod.rs
├──devices
├──hypervisor
├──machine
├──machine_manager
├──migration
├──migration_derive
├──ozone
├──pci
├──src
│└──main.rs
├──sysbus
├──util
├──vfio
└──virtio

StratoVirt vCPU模塊的整體設(shè)計(jì)

StratoVirt的虛擬化解決方案也是一套軟硬結(jié)合的硬件輔助虛擬化解決方案,它的運(yùn)作依賴(lài)于硬件輔助虛擬化的能力(如VT-X或Kunpeng-V)。vCPU模塊的實(shí)現(xiàn)也是緊密依賴(lài)于這一套硬件輔助虛擬化的解決方案的。 對(duì)于物理機(jī)的CPU而言,硬件輔助虛擬化為CPU增加了一種新的模式:Non-Root模式,在該模式下,CPU執(zhí)行的并不是物理機(jī)的指令,而是虛擬機(jī)的指令。這種指令執(zhí)行方式消除了大部分性能開(kāi)銷(xiāo),非常高效。但是特權(quán)指令(如I/O指令)不能通過(guò)這種方式執(zhí)行,還是會(huì)強(qiáng)制將CPU退出到普通模式(即ROOT模式)下交給內(nèi)核KVM模塊和用戶(hù)態(tài)StratoVirt去處理,處理完再重新回到Non-Root模式下執(zhí)行下一條指令。 而StratoVirt中的vCPU模塊主要圍繞著KVM模塊中對(duì)vCPU的模擬來(lái)實(shí)現(xiàn),為了支持KVM模塊中對(duì)CPU的模擬,CPU子系統(tǒng)主要負(fù)責(zé)處理退出到普通模式的事件,以及根據(jù)在GuestOS內(nèi)核開(kāi)始運(yùn)行前對(duì)vCPU寄存器等虛擬硬件狀態(tài)的初始化。整個(gè)vCPU模塊的設(shè)計(jì)模型如下圖所示:

StratoVirt通過(guò)第三方庫(kù)kvm_ioctls來(lái)完成和KVM模塊的交互,通過(guò)匹配vcpu_fd.run()函數(shù)的返回值來(lái)處理退出到ROOT模式的事件,該函數(shù)的返回值是一個(gè)名為VcpuExit的枚舉,定義了退出到ROOT模式的事件類(lèi)型,包括I/O的下發(fā)、系統(tǒng)關(guān)機(jī)事件、系統(tǒng)異常事件等,根據(jù)事件的類(lèi)型vCPU將對(duì)不同的事件作出各自的處理。以上的整個(gè)過(guò)程都被包含在一個(gè)獨(dú)立的vCPU線(xiàn)程中,用戶(hù)可以自己通過(guò)對(duì)vCPU線(xiàn)程進(jìn)行綁核等方式讓虛擬機(jī)的vCPU獲取物理機(jī)CPU近似百分之百的性能。 同時(shí),對(duì)vCPU寄存器虛擬硬件狀態(tài)信息的初始化則是和StratoVirt的另一個(gè)模塊BootLoader相互結(jié)合,在BootLoader中實(shí)現(xiàn)了一種根據(jù)Linux啟動(dòng)協(xié)議快速引導(dǎo)啟動(dòng)Linux內(nèi)核鏡像的方法,在這套啟動(dòng)流程中,BootLoader將主動(dòng)完成傳統(tǒng)BIOS對(duì)一些硬件信息的獲取,將對(duì)應(yīng)的硬件表保存在虛擬機(jī)內(nèi)存中,同時(shí)將提供一定的寄存器設(shè)置信息,這些寄存器設(shè)置信息將傳輸給vCPU模塊,通過(guò)設(shè)置vCPU結(jié)構(gòu)中的寄存器值,讓虛擬機(jī)CPU跳過(guò)實(shí)模式直接進(jìn)入保護(hù)模式運(yùn)行,這樣Linux內(nèi)核就能直接從保護(hù)模式的入口開(kāi)始運(yùn)行,這種方式讓StratoVirt的啟動(dòng)流程變得輕量快速。 在整個(gè)vCPU模塊中,因?yàn)樯婕暗絻?nèi)核的KVM模塊,少不了與C語(yǔ)言代碼做交互。作為系統(tǒng)編程語(yǔ)言,Rust對(duì)FFI有非常完善的支持,讓vCPU中和KVM模塊交互的部分高效且安全。

vCPU線(xiàn)程模型同步

vCPU模塊還有一大職責(zé)就是管理vCPU的生命周期,包括new(創(chuàng)建),realize(使能),run(運(yùn)行),pause(暫停),resume(恢復(fù)),destroy(銷(xiāo)毀)。New和realize的過(guò)程就是結(jié)構(gòu)體創(chuàng)建和寄存器初始化的流程,run的過(guò)程即是實(shí)現(xiàn)KVM中vCPU運(yùn)作和VCPU_EXIT退出事件處理的流程。 另外的三種生命周期的實(shí)現(xiàn)則涉及到對(duì)線(xiàn)程同步的精密控制,例如在虛擬機(jī)destroy的過(guò)程中,一般只有某一個(gè)vCPU接收到VCPU_EXIT中的SHUTDOWN事件,該vCPU線(xiàn)程需要把該事件傳遞到所有的vCPU線(xiàn)程,同步所有vCPU線(xiàn)程的狀態(tài),完成虛擬機(jī)的優(yōu)雅關(guān)機(jī)。在這種場(chǎng)景下,我們就需要考慮在Rust中如何實(shí)現(xiàn)在多線(xiàn)程中進(jìn)行狀態(tài)同步。

Rust中通過(guò)條件變量來(lái)實(shí)現(xiàn)同步

Rust多線(xiàn)程編程中,有一類(lèi)用于同步的機(jī)制叫做屏障(Barrier),用于讓多線(xiàn)程來(lái)同步一些流程開(kāi)始的位置,它相當(dāng)于一個(gè)閘口,使用wait方法,將該線(xiàn)程放進(jìn)臨界區(qū)并阻塞住,只有每個(gè)Barrier都到達(dá)wait方法調(diào)用的點(diǎn),閘口才會(huì)打開(kāi),所有的線(xiàn)程同步往下運(yùn)行。 而在比較復(fù)雜的同步場(chǎng)景中,Rust還提供了另一個(gè)同步機(jī)制條件變量(Condition Variable)來(lái)支持更復(fù)雜的同步場(chǎng)景,它和屏障的功能類(lèi)似,但是它并不阻塞全部進(jìn)程,而是在滿(mǎn)足指定的條件之前阻塞某個(gè)得到互斥鎖的進(jìn)程。也就是說(shuō),通過(guò)條件變量,我們可以在達(dá)到某種條件之前阻塞某個(gè)線(xiàn)程,這個(gè)特性可以讓我們很好得對(duì)線(xiàn)程進(jìn)行同步。 為了支持各種場(chǎng)景的同步控制,條件變量還提供了三個(gè)方法:

notify_one(): 用來(lái)通知一次阻塞線(xiàn)程,如果有復(fù)數(shù)個(gè)線(xiàn)程被阻塞住,notify_one會(huì)被一個(gè)阻塞的線(xiàn)程所消耗,不會(huì)傳遞到別的阻塞線(xiàn)程去。

notify_all(): 用來(lái)通知所有的阻塞線(xiàn)程。

wait_timeout(): 將當(dāng)前線(xiàn)程置入臨界區(qū)阻塞住并等待通知,可以設(shè)定一個(gè)timeout來(lái)設(shè)置阻塞的最大時(shí)間,以免造成永久的阻塞導(dǎo)致程序卡死。

需要注意的一點(diǎn)是條件變量需要和鎖一起使用,而在程序運(yùn)行中,每個(gè)條件變量每次只能和一個(gè)互斥體(被Mutex等鎖包裹都可稱(chēng)為互斥體)進(jìn)行使用。

vCPU生命周期控制和線(xiàn)程同步

在CPU數(shù)據(jù)結(jié)構(gòu)初始化時(shí),創(chuàng)建一個(gè)互斥的生命周期枚舉(CpuLifecycleState)和一個(gè)條件變量。

pubfnnew(
vcpu_fd:Arc,
id:u8,
arch_cpu:Arc>,
vm:Arc>,
)->Self{
CPU{
id,
fd:vcpu_fd,
arch_cpu,
state:Arc::Created),Condvar::new())),
work_queue:Arc::new(0),Condvar::new())),
task:Arc::new(None)),
tid:Arc::new(None)),
vm:Arc::downgrade(&vm),
}
}
以destory生命周期為例,在x86_64架構(gòu)下,當(dāng)某個(gè)vCPU線(xiàn)程接收到VcpuExit::Shutdown事件后,會(huì)將該線(xiàn)程的CpuLifecycleState修改為Stopped,并調(diào)用保存在CPU數(shù)據(jù)結(jié)構(gòu)中一個(gè)指向上層結(jié)構(gòu)的虛擬機(jī)destroy方法,該方法能遍歷一個(gè)保存著所有CPU數(shù)據(jù)結(jié)構(gòu)的數(shù)組,執(zhí)行數(shù)組中每一個(gè)CPU的destory()方法,該函數(shù)的實(shí)現(xiàn)如下:
fndestory(&self)->Result<()>{
let(cpu_state,cvar)=&*self.state;
if*cpu_state.lock().unwrap()==CpuLifecycleState::Running{
*cpu_state.lock().unwrap()=CpuLifecycleState::Stopping;
}else{
*cpu_state.lock().unwrap()=CpuLifecycleState::Stopped;
}

/*省略具體的關(guān)機(jī)邏輯*/

letmutcpu_state=cpu_state.lock().unwrap();
cpu_state=cvar
.wait_timeout(cpu_state,Duration::from_millis(32))
.unwrap()
.0;

if*cpu_state==CpuLifecycleState::Stopped{
*cpu_state=CpuLifecycleState::Nothing;
Ok(())
}else{
Err(ErrorKind::DestroyVcpu(format!("VCPUstillin{:?}state",*cpu_state)).into())
}
}
作為CPU的成員方法,destory函數(shù)能獲取到每個(gè)CPU數(shù)據(jù)結(jié)構(gòu)的互斥狀態(tài)和條件變量,此時(shí)將除觸發(fā)vCPU外所有的CPU數(shù)據(jù)的互斥狀態(tài)解鎖,并將狀態(tài)從運(yùn)行時(shí)的Running修改為vCPU關(guān)機(jī)時(shí)的Stopping。這里要注意一點(diǎn),此時(shí)所有CPU的destroy函數(shù)都是在觸發(fā)關(guān)機(jī)事件的vCPU進(jìn)程中進(jìn)行的,而不是在每個(gè)vCPU各自的進(jìn)程中進(jìn)行。 緊接著進(jìn)入Stopping狀態(tài)后,destroy函數(shù)會(huì)執(zhí)行每個(gè)vCPU各自的關(guān)機(jī)邏輯,包括觸發(fā)vCPU,這部分主要還是與KVM模塊進(jìn)行交互,進(jìn)行一些退出狀態(tài)的變更等。在執(zhí)行完vCPU的關(guān)機(jī)邏輯后,條件變量會(huì)進(jìn)入到wait_timeout的等待狀態(tài),它的參數(shù)為每個(gè)vCPU的CpuLifecycleState生命周期狀態(tài)枚舉和等待超時(shí)時(shí)間,也就是說(shuō)在該生命周期枚舉狀態(tài)變化前,該線(xiàn)程都會(huì)進(jìn)入阻塞狀態(tài)。 此時(shí)除觸發(fā)vCPU外的vCPU線(xiàn)程中,CpuLifecycleState都已經(jīng)進(jìn)入了Stopping狀態(tài),在所有vCPU線(xiàn)程中,vCPU的指令模擬函數(shù)kvm_vcpu_exec()都運(yùn)行在一個(gè)循環(huán)中,對(duì)于每次循環(huán)的入口,都會(huì)執(zhí)行ready_for_running()函數(shù)進(jìn)入是否繼續(xù)模擬的判斷,在該函數(shù)中會(huì)對(duì)每個(gè)vCPU對(duì)應(yīng)的CpuLifecycleState進(jìn)行監(jiān)控,當(dāng)發(fā)現(xiàn)CpuLifecycleState已經(jīng)變成Stopping時(shí),vCPU將會(huì)退出循環(huán),不繼續(xù)進(jìn)行vCPU的模擬,退出模擬的循環(huán)后,將會(huì)修改CpuLifecycleState為Stopped:
//Thevcputhreadisabouttoexit,markingthestateoftheCPUstateasStopped.
let(cpu_state,_)=&*self.thread_cpu.state;
*cpu_state.lock().unwrap()=CpuLifecycleState::Stopped;
修改vCPU線(xiàn)程中互斥的生命周期狀態(tài)枚舉后,將會(huì)觸發(fā)阻塞線(xiàn)程中對(duì)應(yīng)的wait_timeout()函數(shù),同時(shí),該vCPU線(xiàn)程的生命周期結(jié)束。而對(duì)于阻塞線(xiàn)程,當(dāng)其余vCPU線(xiàn)程的狀態(tài)都已經(jīng)變成Stopped后,阻塞解除,此時(shí),所有的vCPU線(xiàn)程都已經(jīng)狀態(tài)都已經(jīng)同步到了Stopped,線(xiàn)程狀態(tài)同步成功。 用類(lèi)似思路也可以實(shí)現(xiàn)pause(暫停)和resume(恢復(fù))的生命周期控制。

原文標(biāo)題:StratoVirt vCPU管理Rust線(xiàn)程同步的實(shí)現(xiàn)

文章出處:【微信公眾號(hào):openEuler】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:彭菁
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 寄存器
    +關(guān)注

    關(guān)注

    31

    文章

    5302

    瀏覽量

    119875
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10813

    瀏覽量

    210898
  • 虛擬機(jī)
    +關(guān)注

    關(guān)注

    1

    文章

    906

    瀏覽量

    28028

原文標(biāo)題:StratoVirt vCPU管理Rust線(xiàn)程同步的實(shí)現(xiàn)

文章出處:【微信號(hào):openEulercommunity,微信公眾號(hào):openEuler】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    人員位置管理系統(tǒng):提升企業(yè)效率和安全性的利器

    在當(dāng)今競(jìng)爭(zhēng)激烈的商業(yè)環(huán)境,企業(yè)對(duì)于員工的管理和安全保障顯得尤為重要。傳統(tǒng)的員工出勤管理方式已經(jīng)逐漸被現(xiàn)代化的人員位置管理系統(tǒng)取代,該系統(tǒng)不
    的頭像 發(fā)表于 10-14 10:55 ?228次閱讀
    人員<b class='flag-5'>位置</b><b class='flag-5'>管理</b>系統(tǒng):提升企業(yè)效率和安全性的利器

    物聯(lián)網(wǎng)系統(tǒng)不間斷供電電源_UPS電源管理模塊詳解

    01 物聯(lián)網(wǎng)系統(tǒng)為什么要使用UPS電源管理模塊 在物聯(lián)網(wǎng)系統(tǒng),使用UPS(Uninterruptible Power Supply,不間斷電源)電源
    的頭像 發(fā)表于 09-26 12:08 ?440次閱讀
    物聯(lián)網(wǎng)系統(tǒng)<b class='flag-5'>中</b>不間斷供電電源_UPS電源<b class='flag-5'>管理</b><b class='flag-5'>模塊</b>詳解

    電動(dòng)自行車(chē)應(yīng)用位置檢測(cè)

    電子發(fā)燒友網(wǎng)站提供《電動(dòng)自行車(chē)應(yīng)用位置檢測(cè).pdf》資料免費(fèi)下載
    發(fā)表于 09-03 11:50 ?1次下載
    電動(dòng)自行車(chē)應(yīng)用<b class='flag-5'>中</b>的<b class='flag-5'>位置</b>檢測(cè)

    嵌入式設(shè)備的4G/5G模塊管理

    在高度數(shù)字化的智能時(shí)代,Linux嵌入式板卡在各個(gè)領(lǐng)域都發(fā)揮著重要作用,然而,隨著4G/5G技術(shù)的普及,如何高效、穩(wěn)定地管理這些嵌入式設(shè)備上的無(wú)線(xiàn)模塊,成為了用戶(hù)面臨的一大挑戰(zhàn)——嵌入式設(shè)備的4G
    發(fā)表于 07-13 16:45

    BMS電池管理系統(tǒng)的組成有哪些

    BMS(Battery Management System)電池管理系統(tǒng)是電動(dòng)汽車(chē)、儲(chǔ)能系統(tǒng)等電池應(yīng)用的關(guān)鍵技術(shù)之一,其主要作用是保證電池組的安全、穩(wěn)定、高效運(yùn)行。以下是對(duì)BMS電池管理系統(tǒng)
    的頭像 發(fā)表于 07-05 10:49 ?574次閱讀

    鴻蒙原生應(yīng)用元服務(wù)開(kāi)發(fā)-Web管理位置權(quán)限

    Web組件提供位置權(quán)限管理能力。開(kāi)發(fā)者可以通過(guò)onGeolocationShow()接口對(duì)某個(gè)網(wǎng)站進(jìn)行位置權(quán)限管理。Web組件根據(jù)接口響應(yīng)結(jié)果,決定是否賦予前端頁(yè)面權(quán)限。獲取設(shè)備
    發(fā)表于 04-28 16:57

    適用于VR12.6 VCPU的兩相D-CAP+降壓控制器TPS51624數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《適用于VR12.6 VCPU的兩相D-CAP+降壓控制器TPS51624數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 04-10 15:07 ?0次下載
    適用于VR12.6 <b class='flag-5'>VCPU</b>的兩相D-CAP+降壓控制器TPS51624數(shù)據(jù)表

    VR12.6 Vcpu的兩相D-CAP+?降壓控制器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《VR12.6 Vcpu的兩相D-CAP+?降壓控制器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 04-07 10:39 ?0次下載
    VR12.6 <b class='flag-5'>Vcpu</b>的兩相D-CAP+?降壓控制器數(shù)據(jù)表

    LoRa模塊在智能建筑與樓宇管理的前沿應(yīng)用

    隨著智能科技的不斷發(fā)展,LoRa(低功耗廣域網(wǎng))模塊在智能建筑與樓宇管理領(lǐng)域嶄露頭角,為樓宇管理提供了更先進(jìn)、高效的解決方案。本文將探討LoRa模塊在智能建筑領(lǐng)域的前沿應(yīng)用,揭示其在樓
    的頭像 發(fā)表于 03-28 15:01 ?482次閱讀

    適用于VR12.1 VCPU 的兩相 D-CAP+?降壓控制器TPS51623數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《適用于VR12.1 VCPU 的兩相 D-CAP+?降壓控制器TPS51623數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 03-26 13:54 ?0次下載
    適用于VR12.1 <b class='flag-5'>VCPU</b> 的兩相 D-CAP+?降壓控制器TPS51623數(shù)據(jù)表

    什么是光模塊的浪涌測(cè)試?

    什么是光模塊的浪涌測(cè)試? 光模塊的浪涌測(cè)試是一種驗(yàn)證光模塊抗擊浪涌電壓能力的測(cè)試方法。隨著光通信技術(shù)的發(fā)展,光
    的頭像 發(fā)表于 01-31 14:24 ?609次閱讀

    rfid倉(cāng)庫(kù)管理系統(tǒng)的硬件組成和軟件組成

    RFID(射頻識(shí)別)倉(cāng)庫(kù)管理系統(tǒng)是利用RFID技術(shù)實(shí)現(xiàn)對(duì)倉(cāng)庫(kù)貨物進(jìn)行追蹤、管理和安全控制的一種智能化系統(tǒng)。它由硬件部分和軟件部分組成,下面將進(jìn)行分析。 一、硬件組成 RFID讀寫(xiě)器:R
    的頭像 發(fā)表于 01-15 11:36 ?1695次閱讀

    plc以太網(wǎng)通訊模塊在哪個(gè)位置

    PLC以太網(wǎng)通信模塊是一種常用的工業(yè)自動(dòng)化設(shè)備,廣泛應(yīng)用于工廠(chǎng)、機(jī)械設(shè)備和自動(dòng)化控制系統(tǒng)。它被用來(lái)實(shí)現(xiàn)PLC與其他設(shè)備之間的數(shù)據(jù)傳輸和通信。在本文中,我們將詳細(xì)介紹PLC以太網(wǎng)通信模塊位置
    的頭像 發(fā)表于 01-10 15:30 ?1099次閱讀

    醫(yī)療廢物智能管理系統(tǒng)的組成與優(yōu)勢(shì)

    醫(yī)療廢物智能管理系統(tǒng)的組成與優(yōu)勢(shì) 隨著醫(yī)療技術(shù)的不斷發(fā)展,醫(yī)療廢物的管理和處理已經(jīng)成為一個(gè)日益突出的問(wèn)題。醫(yī)療廢物不僅對(duì)環(huán)境和人類(lèi)健康造成了巨大的威脅,也給醫(yī)院的管理帶來(lái)了很大的困擾。
    的頭像 發(fā)表于 11-27 17:17 ?530次閱讀
    醫(yī)療廢物智能<b class='flag-5'>管理</b>系統(tǒng)的<b class='flag-5'>組成</b>與優(yōu)勢(shì)

    千兆光模塊和萬(wàn)兆光模塊的供應(yīng)鏈管理

    千兆光模塊和萬(wàn)兆光模塊已成為現(xiàn)代網(wǎng)絡(luò)建設(shè)的重要組成部分。本文將介紹千兆光模塊和萬(wàn)兆光模塊的基本工作原理、類(lèi)型和常見(jiàn)應(yīng)用方式,并分析其供應(yīng)鏈
    的頭像 發(fā)表于 11-20 12:45 ?469次閱讀