0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

兩篇大廠CTR預(yù)估最新工作

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:圓圓的算法筆記 ? 2023-03-03 11:17 ? 次閱讀

今天帶大家讀兩篇AAAI 2023關(guān)于CTR預(yù)估的兩篇工作。一篇是華為發(fā)表的Adaptive Low-Precision Training for Embeddings in Click-Through Rate Prediction,提出了一種CTR預(yù)估中embedding量化壓縮的方法;另一篇是美團(tuán)發(fā)表的Decision-Making Context Interaction Network for Click-Through Rate Prediction,通過(guò)在CTR預(yù)估模型中引入顯示和隱式的上下文信息提升預(yù)估效果。

1華為:Embedding量化

4f76d3b8-b91e-11ed-bfe3-dac502259ad0.png

CTR預(yù)估中占用參數(shù)量最大的就是embedding table,尤其user、item等特征的embedding表,由于實(shí)體數(shù)量很大,導(dǎo)致這些特征的embedding表非常大,占用了非常巨大的存儲(chǔ)開(kāi)銷(xiāo)。因此,對(duì)embedding table進(jìn)行壓縮是一個(gè)值得研究的領(lǐng)域。

目前業(yè)內(nèi)關(guān)于embedding table的壓縮主要有NAS-based embedding dimension search、Embedding pruning、Hashing三種方法。前兩者都需要額外的存儲(chǔ)和訓(xùn)練步驟來(lái)確定最優(yōu)的embedding維度和剪枝方法,而hashing方法由于沖突問(wèn)題會(huì)嚴(yán)重影響壓縮后的模型效果。

針對(duì)前面方法的不足,華為提出了一種基于量化的端到端CTR模型訓(xùn)練方法。量化方法是將模型高精度float參數(shù)映射到離散化的值上,模型結(jié)構(gòu)保持不變,極大節(jié)省了存儲(chǔ)空間。之前的文章中介紹過(guò)量化相關(guān)的工作。

本文提出的量化基本的訓(xùn)練框架如下圖中的b所示。以往的量化壓縮方法為圖a,需要保存全精度的參數(shù),在前向傳播過(guò)程中對(duì)全精度參數(shù)量化,基于量化后的參數(shù)計(jì)算梯度,再更新到全精度參數(shù)上,節(jié)省了計(jì)算資源。而本文提出的b方法,直接在量化后的參數(shù)上進(jìn)行更新,而不用保存全精度的參數(shù),適合本文提出的embedding存儲(chǔ)壓縮的場(chǎng)景。先把量化參數(shù)還原成全精度參數(shù),再在全精度參數(shù)行梯度反傳更新,最后將更新后的參數(shù)還原回量化參數(shù),完成一輪訓(xùn)練。

4f91eb26-b91e-11ed-bfe3-dac502259ad0.png

量化中存在兩個(gè)核心問(wèn)題,一個(gè)是如何確定離散化兩個(gè)值之間的step size,另一個(gè)是使用什么方法把float映射到離散化值。

針對(duì)第一個(gè)問(wèn)題,文中提出了一種Adaptive low-precision training的方法,自動(dòng)學(xué)習(xí)step size。具體的算法邏輯如下表,核心是在訓(xùn)練過(guò)程中有兩階段的優(yōu)化,第一階段更新模型的參數(shù),第二階段優(yōu)化step size。

4fb76ff4-b91e-11ed-bfe3-dac502259ad0.png

針對(duì)第二個(gè)問(wèn)題,業(yè)內(nèi)主要有DR和SR兩種方式。DR直接根據(jù)四舍五入,確定性的將float離散化,而SR則是以一定概率隨機(jī)的將float離散化到距離最近的兩個(gè)整數(shù)之間。雖然之前的一些工作在實(shí)驗(yàn)角度驗(yàn)證了SR效果更好,但是沒(méi)有給出具體的理論證明。本文作者填補(bǔ)了這部分的空白,從理論上證明了SR的離散化方法具有更快的收斂性和更好的準(zhǔn)確率,因此本文采用了SR的離散化方法。

在實(shí)驗(yàn)階段,文中對(duì)比了不同壓縮方法的運(yùn)行效率和效果,驗(yàn)證了本文提出的方法的優(yōu)越性:

4fd8d91e-b91e-11ed-bfe3-dac502259ad0.png

2美團(tuán):上下文建模

4ff48fc4-b91e-11ed-bfe3-dac502259ad0.png

這篇文章提出在CTR中引入顯示和隱式的上下文信息來(lái)提升CTR預(yù)估模型效果。

先說(shuō)說(shuō)顯示上下文信息。以往的CTR預(yù)估模型重點(diǎn)在于用戶歷史行為序列建模,而忽略了用戶歷史行為中的上下文信息。比如下圖左側(cè)的例子,是某個(gè)用戶某次歷史搜索的行為,點(diǎn)擊了藍(lán)色框中的漢堡。以往的行為建模模型中,直接將這個(gè)漢堡加入到歷史行為中,判斷和當(dāng)前商品的匹配情況。而上下文指的是用戶歷史搜索中,除了藍(lán)色框以外紅色框的部分。這部分信息引入的好處是,能夠確定用戶歷史行為產(chǎn)生的原因。例如點(diǎn)擊紅色框的漢堡,是和藍(lán)色框其他漢堡在價(jià)格、款式等維度上進(jìn)行對(duì)比后,用戶做出的決策。

再說(shuō)隱式上下文信息,指的是上游的匹配、打分鏈路中,根據(jù)用戶個(gè)性化信息建模流入下游的候選商品。如果流入下游的候選商品漢堡較多,那么表明用戶可能更喜歡吃漢堡。將這部分信息引入進(jìn)來(lái),有利于提升用戶喜好的建模。

50164dda-b91e-11ed-bfe3-dac502259ad0.png

基于以上出發(fā)點(diǎn),本文提出了考慮用戶顯示隱式上下文信息的ctr預(yù)估模型。對(duì)于顯示上下文,使用CIU模塊進(jìn)行編碼,主要包括對(duì)上下文中不相關(guān)商品的過(guò)濾,以及利用上下文中相關(guān)商品信息增強(qiáng)用戶的興趣建模。對(duì)于隱式上下文信息,即前面模型送到ctr預(yù)估模型打分的候選item,也使用CIU模塊進(jìn)行有效信息的提取。最后,顯示信息和隱式信息經(jīng)過(guò)CIU的結(jié)果會(huì)經(jīng)過(guò)一層AIAU進(jìn)行融合,AIAU主要和MLP+self-attention的結(jié)構(gòu),用于融合經(jīng)過(guò)顯示、隱式增強(qiáng)后的用戶興趣信息。

50494c6c-b91e-11ed-bfe3-dac502259ad0.png

本文提出的模型上線后,經(jīng)過(guò)A/B test實(shí)驗(yàn),取得了CTR+2.9%/CPM+2.1%/GMV+1.5%的比較明顯的效果收益。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 高精度
    +關(guān)注

    關(guān)注

    1

    文章

    516

    瀏覽量

    25415
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3121

    瀏覽量

    48663
  • CTR
    CTR
    +關(guān)注

    關(guān)注

    0

    文章

    36

    瀏覽量

    14075

原文標(biāo)題:AAAI'23 | 兩篇大廠CTR預(yù)估最新工作

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    CTR熱敏電阻

    CTR熱敏電阻   臨界溫度熱敏電阻CTR(CritiCal Temperature Resistor)具有負(fù)電阻突變特性,在某一溫度下,電阻值隨溫度的增加激劇減小,具有很大的負(fù)溫度系數(shù).構(gòu)成
    發(fā)表于 11-12 10:02 ?7084次閱讀

    光耦隔離電路的CTR參數(shù)設(shè)計(jì)

    光耦隔離電路的CTR參數(shù)設(shè)計(jì)
    的頭像 發(fā)表于 04-30 11:16 ?2.6w次閱讀
    光耦隔離電路的<b class='flag-5'>CTR</b>參數(shù)設(shè)計(jì)

    二極管(PN結(jié))的工作原理

    前面已經(jīng)寫(xiě)了兩篇介紹放大器應(yīng)用和MOSFET作驅(qū)動(dòng)的文章。但是對(duì)它們的工作原理并沒(méi)有進(jìn)一步研究一下,今天寫(xiě)下這篇文章,主要是介紹二極管的工作原理,為后面的三極管和MOSFET工作原理的
    發(fā)表于 02-07 16:43 ?6110次閱讀
    二極管(PN結(jié))的<b class='flag-5'>工作</b>原理

    光電耦合器的轉(zhuǎn)換效率即(CTR)

    輸入到LED的電流(IF)受室溫的影響。它隨工作時(shí)間(年齡)而改變因而,有交流電流輸入能力的光耦合器在輸入端有個(gè)LED(光發(fā)射二極管),所以每個(gè)LED都存在CTR值。如果具有相同正負(fù)電流值IF輸入
    發(fā)表于 07-02 15:05

    日本東京大學(xué)的兩篇關(guān)于無(wú)線充電的文章,需要的拿去,...

    日本東京大學(xué)的兩篇關(guān)于無(wú)線充電的文章
    發(fā)表于 03-08 15:08

    電子創(chuàng)新工作室招募活動(dòng)

    物理與電子工程系舉辦電子創(chuàng)新工作室招募活動(dòng) 為積極響應(yīng)第三節(jié)大學(xué)生科技文化藝術(shù)節(jié)號(hào)召,努力提高我校大學(xué)生科技創(chuàng)新意識(shí)和能力,物理與電子工程系電子創(chuàng)新工作室于3月29、30日在東、西區(qū)餐廳門(mén)口舉辦招募
    發(fā)表于 05-12 14:09

    紅外遙控設(shè)計(jì)的兩篇文檔

    路紅外遙控器的,也想請(qǐng)大家關(guān)注一下。這兩篇文檔是我設(shè)計(jì)前期先閱讀的文檔,一仔細(xì)看了,一備用的,分享給大家。
    發(fā)表于 01-10 15:07

    盤(pán)點(diǎn):日本被動(dòng)元件大廠投資設(shè)廠的最新進(jìn)展

    美元提升2成產(chǎn)能同年9月25日,全球MLCC龍頭廠村田制作所在官網(wǎng)發(fā)布公告,計(jì)劃在日本島根縣興建MLCC新工廠,預(yù)估投資額約400億日元,該座新廠將在2018年10月動(dòng)工,預(yù)估2019年內(nèi)完工,目標(biāo)在
    發(fā)表于 10-10 16:13

    【技術(shù)雜談】備戰(zhàn)秋招:國(guó)內(nèi)大廠技術(shù)面試指南,GitHub六千星

    最近,GitHub 上有一個(gè)項(xiàng)目很火,這個(gè)項(xiàng)目主要介紹了阿里、騰訊、百度、美團(tuán)、今日頭條等國(guó)內(nèi)互聯(lián)網(wǎng)大廠的面試題,還配備有答案和出題人分析等信息。這個(gè)項(xiàng)目或許對(duì)大家找工作面試有所幫助。項(xiàng)目
    發(fā)表于 07-23 09:52

    PCB設(shè)計(jì)資料大全,49干貨共1476頁(yè),含各硬件大廠工程師使用資料

    `49PCB設(shè)計(jì)教程及規(guī)范文檔,共1476頁(yè),有實(shí)操經(jīng)驗(yàn)、有知識(shí)點(diǎn)、有規(guī)范;資料完整、文檔豐富,攬括各大廠一線工程師們的設(shè)計(jì)心得、技巧,值得用心收藏學(xué)習(xí)。資料涵蓋知識(shí)面廣,內(nèi)容詳實(shí),有圖有文有案例。<span]需要的可自行下載。`
    發(fā)表于 04-26 10:24

    什么是轉(zhuǎn)換效率CTR?

    什么是轉(zhuǎn)換效率CTR?
    發(fā)表于 05-31 11:13 ?2918次閱讀
    什么是轉(zhuǎn)換效率<b class='flag-5'>CTR</b>?

    Python自然語(yǔ)言處理實(shí)戰(zhàn):兩篇文章相似度清晰透明

    用訓(xùn)練好的詞向量和段落向量對(duì)兩篇關(guān)于天津全運(yùn)會(huì)的新聞進(jìn)行向量化,并計(jì)算兩篇新聞的相似度~~
    的頭像 發(fā)表于 07-09 09:22 ?6022次閱讀

    深度強(qiáng)化學(xué)習(xí)給推薦系統(tǒng)以及CTR預(yù)估工業(yè)界帶來(lái)的最新進(jìn)展

    所以,Google這兩篇強(qiáng)化學(xué)習(xí)應(yīng)用于YouTube推薦論文的出現(xiàn)給大家?guī)?lái)了比較振奮人心的希望。首先,論文中宣稱(chēng)效果對(duì)比使用的Baseline就是YouTube推薦線上最新的深度學(xué)習(xí)模型;
    的頭像 發(fā)表于 07-18 11:11 ?8657次閱讀
    深度強(qiáng)化學(xué)習(xí)給推薦系統(tǒng)以及<b class='flag-5'>CTR</b><b class='flag-5'>預(yù)估</b>工業(yè)界帶來(lái)的最新進(jìn)展

    什么是光耦的CTRCTR受那些因素影響?

    CTR表示電流傳輸比,當(dāng)輸出電壓保持恒定時(shí),它等于直流輸出電流IC與直流輸入電流IF的百分比。光耦的CTR的范圍大多為20%~300%甚至有的可達(dá)600%。
    發(fā)表于 09-20 09:39 ?2.1w次閱讀
    什么是光耦的<b class='flag-5'>CTR</b>?<b class='flag-5'>CTR</b>受那些因素影響?

    光耦合器的CTR是什么

    ,而If則是流向光耦合器二極管側(cè)的電流。通過(guò)這一公式,我們可以直觀地了解到光耦合器在不同工作狀態(tài)下的電流傳輸能力。 從物理層面來(lái)看,光耦合器的CTR反映了二極管側(cè)與晶體管側(cè)之間的電流傳輸關(guān)系。二極管側(cè)通過(guò)器件電流傳輸比鏈接到晶體管側(cè),實(shí)現(xiàn)了電信號(hào)的隔離
    的頭像 發(fā)表于 09-19 10:58 ?369次閱讀
    光耦合器的<b class='flag-5'>CTR</b>是什么