0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

openEuler資源利用率提升之道:虛擬機(jī)混部介紹與功耗管理技術(shù)

openEuler ? 來源:openEuler ? 2023-01-13 15:10 ? 次閱讀

隨著云計(jì)算市場(chǎng)規(guī)模的快速增長(zhǎng),各云廠商基礎(chǔ)設(shè)施投入也不斷增加,但行業(yè)普遍存在資源利用率低的問題,在上述背景下,提升資源利用率已經(jīng)成為了一個(gè)重要的技術(shù)課題。

將業(yè)務(wù)區(qū)分優(yōu)先級(jí)混合部署(下文簡(jiǎn)稱混部)是典型有效的資源利用率提升手段。業(yè)務(wù)可根據(jù)時(shí)延敏感性分為高優(yōu)先級(jí)業(yè)務(wù)和低優(yōu)先級(jí)業(yè)務(wù)。當(dāng)高優(yōu)先級(jí)業(yè)務(wù)和低優(yōu)先級(jí)業(yè)務(wù)發(fā)生資源競(jìng)爭(zhēng)時(shí),需優(yōu)先保障高優(yōu)先級(jí)業(yè)務(wù)的資源供給。

業(yè)務(wù)混部的核心技術(shù)是資源隔離控制,主要涉及內(nèi)核態(tài)基礎(chǔ)資源隔離技術(shù)及用戶態(tài) QoS 控制技術(shù)。Skylark 是一種虛擬機(jī)混部場(chǎng)景下的 QoS 感知的資源調(diào)度器,由 openEuler Skylark 組件承載,在 Skylark 視角下,優(yōu)先級(jí)粒度為虛擬機(jī)級(jí)別,即給虛擬機(jī)新增高低優(yōu)先級(jí)屬性,以虛擬機(jī)為粒度進(jìn)行資源的隔離和控制,在保障高優(yōu)先級(jí)虛擬機(jī) QoS 前提下提升物理機(jī)資源利用率。內(nèi)核層提供了一些基礎(chǔ)資源干擾隔離機(jī)制,比如 CPU 調(diào)度硬優(yōu)先級(jí)機(jī)制以及 SMT(硬件超線程)干擾隔離機(jī)制等。此外集群管理系統(tǒng)軟件 OpenStack 也需要感知虛擬機(jī)優(yōu)先級(jí),設(shè)計(jì)實(shí)現(xiàn)一套混部資源模型。

虛擬機(jī)混部由 openEuler 社區(qū) OpenStack SIG、Virt SIG 以及 Kernel SIG 聯(lián)合開發(fā)。本文主要介紹 Skylark 組件的功耗管理技術(shù)。

為什么需要管理功耗

隨著各種混部方案的提出,服務(wù)器利用率有了明顯的提升。但是平均利用率的提高伴隨著的是瞬時(shí)利用率沖到 100%的概率大幅增加。服務(wù)器一般是以睿頻頻率運(yùn)行,當(dāng) CPU 以滿負(fù)荷運(yùn)行一段時(shí)間后,功耗的持續(xù)增加會(huì)大幅超過 TDP 觸發(fā) CPU 降頻。由于服務(wù)器是以整顆 CPU 供電,所以同一顆 CPU 上的所有 core 將會(huì)同時(shí)降頻,將會(huì)影響該 CPU 上運(yùn)行的所有虛擬機(jī)對(duì)應(yīng)的客戶業(yè)務(wù) QoS。當(dāng)利用率降低后,功耗也降低到一定值時(shí),頻率將再次升高到睿頻。因此,高的資源利用率會(huì)間接導(dǎo)致 CPU QoS 下降,在虛擬機(jī)混部后需要在提高資源利用率的同時(shí)保證 CPU QoS 或者說客戶業(yè)務(wù)不受到影響。

本文詳細(xì)介紹并分享了功耗相關(guān)的基礎(chǔ)概念以及虛擬機(jī)混部技術(shù)中功耗管理的技術(shù)細(xì)節(jié)。

CPU 功耗來源

CPU 的功耗主要是由晶體管工作產(chǎn)生,其功耗主要分為開關(guān)功耗、短路功耗和漏電功耗三類。下圖為 CMOS 反向示意圖。

28927fca-9297-11ed-bfe3-dac502259ad0.png

其中,開關(guān)功耗主要是電容的充放電。例如當(dāng)輸入低電平時(shí),輸出端負(fù)載電容會(huì)進(jìn)行一次充電。當(dāng)輸入變成高電平時(shí),電容中儲(chǔ)存的電能會(huì)以熱量的形式被釋放。當(dāng) CPU 中幾十億個(gè)晶體管同時(shí)釋放時(shí),將會(huì)產(chǎn)生大量的熱能。短路功耗則是 P 管和 N 管短路時(shí)產(chǎn)生的功耗。漏電功耗是 CMOS 管不能嚴(yán)格關(guān)閉時(shí)發(fā)生漏電所產(chǎn)生的功耗,與制程和溫度有關(guān)。

CPU 功耗關(guān)系公式:

28b08146-9297-11ed-bfe3-dac502259ad0.png

公式中,C 代表電容率(Capacitance),是個(gè)常數(shù),和 CPU 的工藝相關(guān),在 CPU 出廠時(shí)確定。P 是功耗(Power),F(xiàn) 是 CPU 運(yùn)行的頻率(Frequency),V 是電壓(Voltage)??梢钥闯?CPU 的功耗和 CPU 運(yùn)行的電壓以及運(yùn)行的頻率成正比。而其中,電壓 V 和頻率有一定的對(duì)應(yīng)關(guān)系,這是因?yàn)楫?dāng) CPU 的場(chǎng)效應(yīng)管進(jìn)行一次充放電需要一定時(shí)間,只有充放電完成后采樣才能保證信號(hào)的完整性。電壓越高,充電的時(shí)間越短,即翻轉(zhuǎn)的頻率就越大。

TDP 是什么

TDP(Thermal Design Power)即熱設(shè)計(jì)功耗,簡(jiǎn)稱熱功耗。它是用來指示 CPU 或者 GPU 在滿負(fù)荷運(yùn)行時(shí),散熱器需要達(dá)到的散熱熱量。根據(jù)能量守恒原理,CPU 運(yùn)行需要輸入能量,即電源的功率。輸入的電流經(jīng)過電容產(chǎn)生熱量,以熱能以及其他形式的能量散發(fā)出來,這些熱能如果沒有耗散掉,那么 CPU 的溫度則會(huì)越來越高,影響 CPU 的運(yùn)行,TDP 代表了按照 CPU 設(shè)計(jì)運(yùn)行的溫度范圍內(nèi)需要耗散的熱能,是散熱系統(tǒng)的重要參考指標(biāo)。TDP 越大,表示 CPU 在滿負(fù)荷工作產(chǎn)生的熱量就越大。

隨著睿頻 2.0 技術(shù)引入,TDP 已經(jīng)不是 CPU 能夠排除的最大熱量了。在睿頻 2.0 中,引入了 PL1、PL2、PL3、PL4、和 Tau。

PL1 是 CPU 運(yùn)行在默認(rèn)主頻不含睿頻和 AVX 的功耗,大多數(shù)情況等于 TDP。PL2 是 CPU 可以達(dá)到超過 TDP 工作的最大功率限制。可以看出在 Tau 時(shí)間內(nèi) CPU 是可以超過 TDP 閾值運(yùn)行的。PL3/PL4 一般廠家不設(shè)置,這里略過。Tau 是 CPU 能在 PL2 運(yùn)行的最長(zhǎng)時(shí)間。

在實(shí)際生產(chǎn)中,由于需要考慮到各種冗余以及生產(chǎn)安全,服務(wù)器并不能一直在最高功率下運(yùn)行,而且為了保護(hù) CPU,甚至?xí)O(shè)置"功耗墻",當(dāng)功耗大于一定閾值時(shí),CPU 會(huì)自動(dòng)調(diào)用調(diào)頻接口通過降低 CPU 的頻率來降低功耗。當(dāng)功耗降低,CPU 溫度回復(fù)正常時(shí),CPU 頻率會(huì)逐漸回復(fù)到原先頻率。

混部功耗管理技術(shù)

在 Skylark 虛擬機(jī)混部方案中,我們有數(shù)據(jù)采集,QoS 實(shí)時(shí)分析,QoS 實(shí)時(shí)控制,三個(gè)核心模塊。在這三個(gè)模塊中,通過以下算法實(shí)現(xiàn)功耗管理:

「功耗相關(guān)數(shù)據(jù)采集」:根據(jù) host 上的 topo 關(guān)系,通過 MSR 寄存器,準(zhǔn)確采集計(jì)算 CPU 每個(gè)核的頻率,以及每個(gè) package 的功耗。

「功耗及利用率實(shí)時(shí)分析」:在每個(gè)定時(shí)周期中,根據(jù)設(shè)定的 TDP 閾值,標(biāo)記功耗熱點(diǎn) package,以及降頻 CPU 核,對(duì)降頻核上運(yùn)行的虛擬機(jī) CPU 利用率進(jìn)行排序。由于我們要盡量保證高優(yōu)先級(jí)虛擬機(jī)的 QoS,所以利用率最高的若干個(gè)低優(yōu)先級(jí)虛擬機(jī)將被放入 QoS 調(diào)整隊(duì)列。

「QoS 實(shí)時(shí)控制」:在每個(gè) QoS 調(diào)整周期,根據(jù) CPU 核狀態(tài),功耗熱點(diǎn) package,限制或恢復(fù) QoS 調(diào)整隊(duì)列中虛擬機(jī) vCPU 的 CPU 帶寬,通過降低 CPU 帶寬,將減小降頻核的 CPU 利用率,來達(dá)到降低功耗的目的。

總結(jié)

在使用了高低優(yōu)先級(jí)虛擬機(jī)混部方案之后,平均資源利用率的提高對(duì)應(yīng)著 QoS 降低的風(fēng)險(xiǎn)也隨之增加。在 CPU 突發(fā)滿負(fù)載運(yùn)行時(shí),可能會(huì)因功耗升高觸發(fā)降頻而導(dǎo)致 CPU QoS 下降。我們?cè)?Skylark 中提出了功耗管理技術(shù),通過調(diào)整熱點(diǎn)低優(yōu)先級(jí)虛擬機(jī) vCPU 的 CPU 帶寬來間接調(diào)整功耗,保障 CPU QoS。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10804

    瀏覽量

    210839
  • 功耗
    +關(guān)注

    關(guān)注

    1

    文章

    807

    瀏覽量

    31899
  • 虛擬機(jī)
    +關(guān)注

    關(guān)注

    1

    文章

    904

    瀏覽量

    28018
  • 功耗管理
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    7167
  • openEuler
    +關(guān)注

    關(guān)注

    2

    文章

    301

    瀏覽量

    5810

原文標(biāo)題:openEuler資源利用率提升之道 05:虛機(jī)混部介紹與功耗管理技術(shù)

文章出處:【微信號(hào):openEulercommunity,微信公眾號(hào):openEuler】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    一種提升存儲(chǔ)資源利用率的方法

    在現(xiàn)代云平臺(tái)中,存儲(chǔ)設(shè)備,如基于閃存的固態(tài)硬盤(SSD)已經(jīng)被虛擬化為全系統(tǒng)的共享資源,以提供跨越多個(gè)應(yīng)用實(shí)例的存儲(chǔ)服務(wù)。這使得云平臺(tái)能夠通過在多個(gè)多租戶虛擬機(jī)(VM)之間進(jìn)行分片來有效利用
    的頭像 發(fā)表于 11-21 10:15 ?812次閱讀
    一種<b class='flag-5'>提升</b>存儲(chǔ)<b class='flag-5'>資源</b><b class='flag-5'>利用率</b>的方法

    提升現(xiàn)網(wǎng)網(wǎng)絡(luò)資源利用率和網(wǎng)絡(luò)承載能力的方法

    后1、3小區(qū)用戶數(shù)下降明顯,新分裂小區(qū)6、7業(yè)務(wù)吸收良好,指標(biāo)良好,起到很好的負(fù)荷分擔(dān)及感知提升的作用?! ”? 擴(kuò)容方案實(shí)施效果  小區(qū)ID操作RRC連接平均數(shù)LTE_上行PRB平均利用率LTE_
    發(fā)表于 12-03 15:40

    openEuler 資源利用率提升之道 01:概論

    提升資源利用率,這需要在集群調(diào)度、OS 等層面出現(xiàn)更多的技術(shù)突破。本文簡(jiǎn)要介紹對(duì)于云上資源
    發(fā)表于 07-06 09:54

    openEuler資源利用率提升之道02:典型應(yīng)用下的效果

    前文[1]介紹資源利用率提升這個(gè)課題的產(chǎn)生背景、形成原因、解決思路,以及在 openEuler 上所構(gòu)建的
    發(fā)表于 08-10 11:12

    openEuler 資源利用率提升之道 03:rubik 引擎簡(jiǎn)介

    :支持高級(jí)用戶針對(duì)特定業(yè)務(wù)場(chǎng)景開發(fā)自定義擴(kuò)展插件。rubik引擎在系統(tǒng)中的位置特性介紹在保障在線業(yè)務(wù)服務(wù)質(zhì)量前提下實(shí)現(xiàn)資源利用率最大化
    發(fā)表于 09-01 11:00

    openEuler 資源利用率提升之道 04:CPU 搶占和 SMT 隔離控制

    感知用戶配置的業(yè)務(wù)優(yōu)先級(jí)并配置其 CPU 優(yōu)先級(jí)屬性,rubik 具體的介紹和使用詳見《openEuler 資源利用率提升
    發(fā)表于 09-22 16:50

    關(guān)于Swarm和Mesos資源利用率優(yōu)化實(shí)踐分析

    資源調(diào)度領(lǐng)域的優(yōu)秀經(jīng)驗(yàn),以及他們?cè)贛esos社區(qū)為提升Mesos資源利用率而正在進(jìn)行的實(shí)踐活動(dòng),深度剖析了Mesos資源的收集和調(diào)度原理,以
    發(fā)表于 10-10 11:54 ?0次下載
    關(guān)于Swarm和Mesos<b class='flag-5'>資源</b><b class='flag-5'>利用率</b>優(yōu)化實(shí)踐分析

    虛擬機(jī)按需物理資源分配方法

    針對(duì)云平臺(tái)按負(fù)載峰值需求配置處理機(jī)資源、提供單一的服務(wù)應(yīng)用和資源需求動(dòng)態(tài)變化導(dǎo)致資源利用率低下的問題,采用云
    發(fā)表于 01-02 15:18 ?1次下載
    云<b class='flag-5'>虛擬機(jī)</b>按需物理<b class='flag-5'>資源</b>分配方法

    基于虛擬機(jī)負(fù)載高峰特征的虛擬機(jī)放置策略

    提出了一種基于虛擬機(jī)負(fù)載高峰特征的虛擬機(jī)放置策略,通過更好地復(fù)用物理主機(jī)資源來實(shí)現(xiàn)資源共享,從而提高資源
    發(fā)表于 01-13 10:34 ?0次下載

    虛擬機(jī)內(nèi)部隔離故障驅(qū)動(dòng)提高虛擬機(jī)可靠性

    利用虛擬技術(shù)來整合資源已成為高性能服務(wù)器提高資源利用率的重要手段,
    發(fā)表于 02-23 10:25 ?1次下載

    基于自適應(yīng)虛擬機(jī)遷移的云資源調(diào)度及架構(gòu)

    ,提岀了¨遷移路徑”和“服務(wù)開銷”等概念,并以服務(wù)器的CPU利用率和服務(wù)器間的帶寬利用率為指標(biāo),為系統(tǒng)中所有遷移的虛擬機(jī)規(guī)劃最優(yōu)的遷移路徑,以使系統(tǒng)總的服務(wù)開銷最小化。首先,設(shè)計(jì)了基于閾值的
    發(fā)表于 05-07 15:44 ?7次下載

    openEuler Summit 2021-云/虛擬化分論壇:業(yè)內(nèi)解決方案+虛擬機(jī)系統(tǒng)模擬

    openEuler Summit 2021-云/虛擬化分論壇:業(yè)內(nèi)解決方案+虛擬機(jī)系統(tǒng)模擬
    的頭像 發(fā)表于 11-10 14:42 ?1661次閱讀
    <b class='flag-5'>openEuler</b> Summit 2021-云/<b class='flag-5'>虛擬</b>化分論壇:業(yè)內(nèi)解決方案+<b class='flag-5'>虛擬機(jī)</b>系統(tǒng)模擬

    openEuler資源利用率提升之道虛擬機(jī)OpenStack調(diào)度

    虛擬機(jī)混合部署是指把對(duì) CPU、IO、Memory 等資源有不同需求的虛擬機(jī)通過調(diào)度方式部署、遷移到同一個(gè)計(jì)算節(jié)點(diǎn)上,從而使得節(jié)點(diǎn)的資源得到充分利用
    的頭像 發(fā)表于 01-30 10:26 ?939次閱讀

    廣凌房產(chǎn)管理系統(tǒng)(一):土地資源管理,提高資產(chǎn)資源利用率

    做好高校的土地資源管理,有效保障學(xué)校和使用單位的合法權(quán)益,確保整個(gè)變更過程公開、公正、透明,避免因人工進(jìn)行房屋與土地管理帶來的紕漏,大大提升工作效率,提高土地資源
    的頭像 發(fā)表于 06-22 09:16 ?452次閱讀
    廣凌房產(chǎn)<b class='flag-5'>管理</b>系統(tǒng)(一):土地<b class='flag-5'>資源管理</b>,提高資產(chǎn)<b class='flag-5'>資源</b><b class='flag-5'>利用率</b>

    Docker與虛擬機(jī)的區(qū)別

    的操作系統(tǒng)實(shí)例來實(shí)現(xiàn)虛擬化的技術(shù)。其實(shí)現(xiàn)方式是通過Hypervisor來實(shí)現(xiàn)的。Hypervisor是一個(gè)運(yùn)行在物理機(jī)上的軟件或硬件,負(fù)責(zé)管理和分配虛擬機(jī)的硬件
    的頭像 發(fā)表于 11-23 09:37 ?9045次閱讀