0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

超詳細(xì)EMNLP2020 因果推斷

深度學(xué)習(xí)自然語言處理 ? 來源:復(fù)旦DISC ? 作者:何嘯風(fēng) ? 2021-05-19 15:59 ? 次閱讀

引言

X,Y之間的因果性被定義為操作X,會使得Y發(fā)生改變。在很多領(lǐng)域如藥物效果預(yù)測、推薦算法有效性,因果性都有著重要作用。然而現(xiàn)實(shí)數(shù)據(jù)中,變量之間還會存在其他的相關(guān)關(guān)系(confounding)。如何從觀察獲得的數(shù)據(jù)中發(fā)現(xiàn)不同因素之間的因果關(guān)系則是統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)人工智能領(lǐng)域具有挑戰(zhàn)性的重要研究問題---統(tǒng)計(jì)推斷。

本次Fudan DISC實(shí)驗(yàn)室將分享EMNLP 2020中有關(guān)因果推斷的3篇論文,介紹在不同任務(wù)下因果推斷方法的應(yīng)用。

文章概覽

基于因果推理的邏輯相關(guān)多任務(wù)學(xué)習(xí)研究

Exploring Logically Dependent Multi-task Learning with Causal Inference

論文地址:

https://www.aclweb.org/anthology/2020.emnlp-main.173

該篇文章從因果推理的角度出發(fā),使用mediation assumption對邏輯依賴的MTL進(jìn)行了研究。具體模型使用label transfer利用之前的低級邏輯依賴的任務(wù)label,以及Gumbel sampling方法來處理級聯(lián)錯誤。

腳本知識的因果推理

Causal Inference of Script Knowledge

論文地址:

https://www.aclweb.org/anthology/2020.emnlp-main.612

該篇文章從概念和實(shí)踐的角度論證了純粹基于相關(guān)性的方法對于腳本知識歸納是不夠的,并提出了一種基于事件干預(yù)評估因果效應(yīng)的腳本歸納方法。

使用因果關(guān)系消除偏見的法院意見生成

De-Biased Court’s View Generation with Causality

論文地址:

https://www.aclweb.org/anthology/2020.emnlp-main.56

本文提出了一種新的基于注意力和反事實(shí)的自然語言生成方法(AC-NLG),該方法由一個注意力編碼器和一對反事實(shí)譯碼器組成。注意力編碼器利用原告的索賠和事實(shí)描述來學(xué)習(xí)索賠感知的編碼表示。反事實(shí)譯碼器被用來消除數(shù)據(jù)中的混淆偏差,并與協(xié)同的判決預(yù)測模型結(jié)合來生成法院意見。

論文細(xì)節(jié)

1

bdeb7606-b4a6-11eb-bf61-12bb97331649.png

論文動機(jī)

以往的研究表明,分層多任務(wù)學(xué)習(xí)(MTL)可以通過堆疊編碼器和輸出形式的民主MTL來利用任務(wù)依賴性。然而,在邏輯相關(guān)的任務(wù)中,堆疊編碼器只考慮特征表示的依賴性,而忽略了標(biāo)簽的依賴性。MLT的三種結(jié)構(gòu)如下圖所示

be267f08-b4a6-11eb-bf61-12bb97331649.png

從因果關(guān)系的角度來看,前兩個方案假設(shè)ym和yn是條件獨(dú)立的,而第三個方案假設(shè)ym對yn有因果關(guān)系。在這篇文章中,作者認(rèn)為因果關(guān)系對于邏輯相關(guān)的任務(wù)是重要的,并提出了一種稱為標(biāo)簽轉(zhuǎn)移(label transfer,LT)的機(jī)制,使得一個任務(wù)可以利用其所有較低級別任務(wù)的標(biāo)簽。

當(dāng)使用前任務(wù)的標(biāo)簽時,會引入訓(xùn)練和測試的分歧問題。也就是說該策略在訓(xùn)練中使用低水平任務(wù)的標(biāo)注標(biāo)簽,在測試中則需要使用預(yù)測的標(biāo)簽,這樣會導(dǎo)致任務(wù)之間的級聯(lián)錯誤。本文使用Gumbel抽樣(GS)來解決這個問題。具體來說,模型從每個任務(wù)的預(yù)測概率分布中抽取一個標(biāo)簽,并將其提供給更高級別的任務(wù)。抽樣可以看作是一個反事實(shí)推理過程,可以估計(jì)不同任務(wù)標(biāo)簽之間的因果關(guān)系。如果因果效應(yīng)存在,反向傳播的梯度將懲罰錯誤的預(yù)測。

方法

1. Basic Causal Assumptions

be52d904-b4a6-11eb-bf61-12bb97331649.png

如上圖MTL有兩種可能的因果假設(shè):confounding 和 mediation。confounding假設(shè)是,Ym和Yn是條件獨(dú)立的,僅由H決定。然而,對于邏輯相關(guān)的任務(wù),文章使用mediation假設(shè),即Ym對Yn有因果關(guān)系。具體來說,此假設(shè)包括Ym和Yn之間的兩條因果路徑。通過媒體H(實(shí)線),稱為間接效應(yīng)。另一個直接鏈接Ym到Y(jié)n(虛線),稱為直接效果。一條是通過metiator H(實(shí)線)把Ym和Yn聯(lián)系起來的,稱為間接效應(yīng)。另一個直接連接Ym到Y(jié)n(虛線),稱為直接效應(yīng)。

2. Full Causal Graphs

c18c38fe-b4a6-11eb-bf61-12bb97331649.png

CMTL通過兩條路徑將任務(wù)間因果性結(jié)合起來。它首先創(chuàng)建一個中間變量傳達(dá)之前所有任務(wù)的標(biāo)簽信息。然后該模型考慮了路徑→→的間接因果效應(yīng),還包括路徑→的直接因果效應(yīng)。

3. Model Details

完整模型結(jié)構(gòu)下圖所示。

c1ecabf8-b4a6-11eb-bf61-12bb97331649.png

Label Transfer LT使用RNN-LSTM的結(jié)構(gòu)來編碼:

**Encoders ** 然后將被送入編碼器。如圖所示,Encoder^(k) 的輸入包括三個部分:詞嵌入、轉(zhuǎn)移標(biāo)簽和k-1層的輸出。輸出可表示為:

¥4f對于JERE和ABSA任務(wù)編碼器使用Bi-LSTM。對于LJP任務(wù),先使用CNN編碼句子,隨后使用LSTM編碼標(biāo)簽嵌入。

Gumbel Sampling GS使用重參數(shù)技巧來估計(jì)多項(xiàng)抽樣:

其中g(shù)符合Gumbel(0,1),是溫度參數(shù)。在訓(xùn)練過程中將使用來代替標(biāo)注標(biāo)簽。這樣低水平的任務(wù)將有一定的概率抽樣一個反事實(shí)的值,如果因果關(guān)系確實(shí)存在,會從高水平的任務(wù)得到反饋。

4. 因果解釋

估計(jì)任務(wù)tm的標(biāo)簽對任務(wù)tn的標(biāo)簽的因果效應(yīng):

除了估計(jì)標(biāo)簽的因果效應(yīng)外,還可以檢驗(yàn)X中n-grams元素的影響。對原始序列進(jìn)行干預(yù),得到另一個文本序列,其中n-gram 被屏蔽。由于n-gram可能非常稀疏,因此僅對單個因果效應(yīng)進(jìn)行了估計(jì):

實(shí)驗(yàn)結(jié)果

1. 主要結(jié)果

c22d5068-b4a6-11eb-bf61-12bb97331649.png

在三個任務(wù)上模型都有所提升。

c288489c-b4a6-11eb-bf61-12bb97331649.png

如圖所示,GS和LT對模型都是有影響的,特別是對于高水平的任務(wù)。例如,消除GS導(dǎo)致RE的F1得分下降2.24分,消除這兩種機(jī)制導(dǎo)致顯著下降4.47分。此外,文章保留了CMTL的間接因果路徑或直接因果路徑,分別記為CMTL(間接)和CMTL(直接)模型。兩種相關(guān)模型的性能都略差于CMTL。

2. 案例分析

c2cb48a4-b4a6-11eb-bf61-12bb97331649.png

3. 因果效應(yīng)估計(jì)

c31fd82e-b4a6-11eb-bf61-12bb97331649.png

c34be496-b4a6-11eb-bf61-12bb97331649.png

2

c417b594-b4a6-11eb-bf61-12bb97331649.png

論文動機(jī)

長期以來典型事件序列所定義的日常情景的常識性知識,一直被認(rèn)為在文本理解和理解中起著重要作用。通過數(shù)據(jù)驅(qū)動的方法從文本語料庫中學(xué)習(xí)這樣的知識需要確定定量度量標(biāo)準(zhǔn)。雖然觀察到的事件之間存在相關(guān)性,但相關(guān)性并不是決定事件是否形成有意義腳本的唯一因素。這篇文章則提出基于因果關(guān)系的方法,用于提取腳本知識。

方法

Step 1: Define a Causal Model

c43be91e-b4a6-11eb-bf61-12bb97331649.png

世界,U:生成數(shù)據(jù)的起點(diǎn)是真實(shí)世界,由未測量的變量U顯式表示。這個變量是不可知的,通常是不可測量的:我們不知道它是如何分布的,甚至不知道它是什么類型的變量。這個變量由圖2中的六邊形節(jié)點(diǎn)表示。

Text,T:下一種類型的變量是文本。將文本分割成塊T1,…,TN,其中N是文本中事件數(shù)。因此,變量Ti是與文本中提到的第i個事件相對應(yīng)的文本塊。

事件推斷,e:讀取一段文本,并推斷文本中提到的事件類型。這個類型在模型中由變量 表示,其中E是一組可能的原子事件類型。文本直接因果影響推斷的時間類型,所以文本有指向事件的單向箭頭。

語篇表征,D:變量ei表示Ti中部分語義內(nèi)容的高層次抽象。而文本中發(fā)生過事件以及它們之間的因果關(guān)系是人類閱讀時的核心部分,這種信息會顯著影響讀者基于事件的推理。因此,引入一個話語表征變量,它本身就是兩個子變量和的組合。

Step 2: Establishing Identifiability

由后門準(zhǔn)則知道:

使用蒙特卡洛估計(jì)上述期望。

Step 3: Estimation

通過機(jī)器學(xué)習(xí)方法上述中的

Extracting Script Knowledge

令,則腳本相容分?jǐn)?shù)(因果分?jǐn)?shù))為。

實(shí)驗(yàn)結(jié)果

使用人工分別對事件對和事件鏈評分的結(jié)果如下:

c46e8504-b4a6-11eb-bf61-12bb97331649.png

c4954432-b4a6-11eb-bf61-12bb97331649.png

結(jié)果表明因果模型的分?jǐn)?shù)更高。

3

c4b28a24-b4a6-11eb-bf61-12bb97331649.png

論文動機(jī)

法院意見生成是法律人工智能的一項(xiàng)新穎而重要的任務(wù),旨在提高判決預(yù)測結(jié)果的可解釋性,實(shí)現(xiàn)法律文書的自動生成。雖然先前的文本到文本的自然語言生成(NLG)方法可以用來解決這個問題,但是他們都忽略了數(shù)據(jù)生成機(jī)制中的混淆偏差,這樣會限制模型的性能,影響學(xué)習(xí)結(jié)果。主要挑戰(zhàn)有:1. 民事法律制度中的“無訴不審”原則,使得判決需要回應(yīng)原告的索賠;2. 民事案件中判決的不平衡,由于原告只會在有很大把握的前提下提起訴訟,也就導(dǎo)致大部分的判決都是支持的,這樣就形成了數(shù)據(jù)分布不均。

c4e09f2c-b4a6-11eb-bf61-12bb97331649.png

如上因果圖角度看,判決的不平衡揭示了數(shù)據(jù)生成機(jī)制導(dǎo)致的混淆偏見。這種不平衡的數(shù)據(jù)將導(dǎo)致輸入(索賠和公認(rèn)事實(shí))和輸出(法院觀點(diǎn))的學(xué)習(xí)表示傾向于支持,導(dǎo)致輸入和輸出之間的混淆偏差,并影響傳統(tǒng)NLG模型的訓(xùn)練。

針對這些問題,文章提出了一種基于注意力和反事實(shí)的自然語言生成(AC-NLG)方法,通過聯(lián)合優(yōu)化一個索賠感知編碼器、一對反事實(shí)解碼器來生成判決分辨性法院意見和一個協(xié)同判決預(yù)測模型。

方法

Backdoor Adjustment

對于一般的生成任務(wù),我們需要計(jì)算:如果 ,則 退化為 , 將會忽略 時的表示。后門調(diào)整是因果推理中的一個消除混淆的技術(shù)。后門調(diào)整對進(jìn)行操作,將后驗(yàn)概率從被動觀察提升到主動干預(yù)。后門調(diào)整通過計(jì)算介入后驗(yàn)P(V | do(I))和控制混雜因子來解決混雜偏差:。后門調(diào)整切斷了和之間的依賴。

Backdoor In Implementation

實(shí)現(xiàn)過程中,使用一對反事實(shí)解碼器估計(jì),使用判據(jù)預(yù)測模型估計(jì)。

Model Architecture

Claim-aware Encoder:原告的權(quán)利要求c和事實(shí)描述f是句子形式。因此,編碼器首先將單詞轉(zhuǎn)換為嵌入詞。然后將嵌入序列反饋給Bi-LSTM,產(chǎn)生兩個隱藏狀態(tài)序列hc、hf,分別對應(yīng)于原告的請求和事實(shí)描述。之后,我們使用Claim-aware attention來融合hc和hf。對于hf中的每個隱藏狀態(tài),是其對的注意權(quán)重,注意分布計(jì)算如下:

隨后產(chǎn)生新的事實(shí)描述表示:

經(jīng)過Bi-LSTM層,得到最終表是。

Judgment Predictor:使用全連接層由h生成判決的概率預(yù)測:

Counterfactual Decoder:為了消除數(shù)據(jù)偏差的影響,使用一對反事實(shí)解碼器,其中包含兩個解碼器,一個用于支持的情況,另一個用于不支持的情況。這兩種譯碼器的結(jié)構(gòu)相同,但目的是產(chǎn)生不同判決的法院觀點(diǎn)。運(yùn)用了注意機(jī)制:在每個步驟t,給定編碼器的輸出和解碼狀態(tài),注意力分布的計(jì)算方法與相同,但參數(shù)不同。上下文向量是h的加權(quán)和:

。上下文向量與解碼狀態(tài)相連接并送到線性層以產(chǎn)生詞匯分布:

實(shí)驗(yàn)結(jié)果

c5371758-b4a6-11eb-bf61-12bb97331649.png

上圖顯示了法院意見生成的一些評估指標(biāo):ROUGE, BLEU, 和 BERT SCORE分?jǐn)?shù)??梢缘贸觯?/p>

(1)S2S傾向于重復(fù)單詞,這使得其BLEU得分較高,而BERT得分較低

(2) 過采樣策略對模型沒有好處,因此,它不能解決混淆偏差

(3) 與基準(zhǔn)相比,AC-NLG具有索賠感知編碼器和后門反事實(shí)解碼器,在法庭視圖生成方面取得了更好的性能

(4) AC NLGw/oCA和AC-NLG之間的性能差距證明了索賠感知編碼器的有效性,AC NLGw/oBA和AC-NLG之間的差距說明了反事實(shí)解碼器的優(yōu)越性。

c5762ede-b4a6-11eb-bf61-12bb97331649.png

上圖顯示了判決預(yù)測準(zhǔn)確率以及人類評估結(jié)果:

判據(jù)預(yù)測結(jié)果:

(1) 模型中反事實(shí)譯碼器可以顯著地消除混淆偏差,從而在不支持的情況下獲得顯著的改進(jìn),例如將f1從49.8%提高到76.9%

(2) 提出的索賠感知編碼器是為提高生成質(zhì)量而設(shè)計(jì)的,對判決預(yù)測的影響有限。

(3) 過采樣并不能給模型帶來任何改進(jìn)。

人類評估結(jié)果:

(1) 由于數(shù)據(jù)中的混雜偏差,PGN中的判決生成在無支持案例中的表現(xiàn)較差,支持案例和無支持案例之間的表現(xiàn)差距很大(1.56)

(2) 通過使用后門反事實(shí)解碼器,AC-NLG大大提高了判決生成的性能,特別是對于不支持的情況,并且在支持和不支持的情況之間實(shí)現(xiàn)了較小的性能差距(只有0.28)

(3) AC-NLG使用了一個支持索賠的編碼器,在理性和流暢性方面也取得了更好的性能

c5b6be18-b4a6-11eb-bf61-12bb97331649.png

上圖展示了不同模型產(chǎn)生的法院觀點(diǎn)。

總結(jié)

此次 Fudan DISC 解讀的三篇論文圍繞因果推斷的應(yīng)用。對于多任務(wù)學(xué)習(xí),可以考慮任務(wù)標(biāo)簽之間的因果性。對于抽取任務(wù),可以考慮使用因果性評估來篩選想要的抽取內(nèi)容。對于數(shù)據(jù)集有偏差的文本生成任務(wù),因果推斷可以幫助消除混淆偏差。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3574

    瀏覽量

    133982
  • 譯碼器
    +關(guān)注

    關(guān)注

    4

    文章

    310

    瀏覽量

    50260
  • 自然語言
    +關(guān)注

    關(guān)注

    1

    文章

    285

    瀏覽量

    13320

原文標(biāo)題:EMNLP2020 因果推斷

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    鑒源實(shí)驗(yàn)室·測試設(shè)計(jì)方法-因果

    上篇文章(ISO 26262中測試用例的得出方法-邊界值分析)我們介紹了等價類方法和邊界值方法,這兩種方法廣泛應(yīng)用并適用于各種類型測試的設(shè)計(jì)中,本章開始我們介紹黑盒測試常用的其他方法,先從因果圖法
    的頭像 發(fā)表于 11-05 15:17 ?94次閱讀
    鑒源實(shí)驗(yàn)室·測試設(shè)計(jì)方法-<b class='flag-5'>因果</b>圖

    經(jīng)緯恒潤功能安全AI 智能體論文成功入選EMNLP 2024!

    :AnAdvancedLLM-BasedMulti-AgentforIntelligentFunctionalSafetyEngineering》成功入選EMNLP2024產(chǎn)業(yè)應(yīng)用分會(IndustryTrack)。EMNLP作為自然語言處理領(lǐng)域的高規(guī)格會議,匯聚了全球前
    的頭像 發(fā)表于 10-18 08:00 ?233次閱讀
    經(jīng)緯恒潤功能安全AI 智能體論文成功入選<b class='flag-5'>EMNLP</b> 2024!

    AT指令速通FTP:合宙Air780EP模塊詳細(xì)教程

    合宙Air780EP低功耗4G模組AT開發(fā)接入FTP詳細(xì)示例!
    的頭像 發(fā)表于 08-20 17:40 ?2209次閱讀
    AT指令速通FTP:合宙Air780EP模塊<b class='flag-5'>超</b><b class='flag-5'>詳細(xì)</b>教程

    第19.1 章-星瞳科技 OpenMV視覺循跡功能 詳細(xì)OpenMV與STM32單片機(jī)通信

    第19.1 章-[星瞳科技]OpenMV視覺循跡功能 詳細(xì)OpenMV與STM32單片機(jī)通信 (有完整版源碼) 【星曈科技】OpenMv筆記——利用OpenMV與STM32進(jìn)行串口通信
    的頭像 發(fā)表于 08-20 11:41 ?806次閱讀
    第19.1 章-星瞳科技 OpenMV視覺循跡功能 <b class='flag-5'>超</b><b class='flag-5'>詳細(xì)</b>OpenMV與STM32單片機(jī)通信

    當(dāng)系統(tǒng)鬧脾氣:用「因果推斷」哄穩(wěn)技術(shù)的心

    背景 系統(tǒng)穩(wěn)定性問題往往涉及復(fù)雜的因果關(guān)系。例如,一個系統(tǒng)的崩潰可能由多個因素引起,包括硬件故障、軟件bug、業(yè)務(wù)配置、外部攻擊或其他操作不當(dāng)?shù)?。理解這些因素之間的因果關(guān)系對于系統(tǒng)穩(wěn)定性建設(shè)至關(guān)重要
    的頭像 發(fā)表于 08-14 10:42 ?217次閱讀
    當(dāng)系統(tǒng)鬧脾氣:用「<b class='flag-5'>因果</b><b class='flag-5'>推斷</b>」哄穩(wěn)技術(shù)的心

    透鏡的設(shè)計(jì)與分析

    **摘要 ** 透鏡是一種透射光學(xué)裝置,通過改變光的相位使光聚焦或散焦。與傳統(tǒng)透鏡不同,透鏡的優(yōu)點(diǎn)是能夠在非常薄的層中實(shí)現(xiàn)所需的相位變化,使用的結(jié)構(gòu)尺寸在波長量級及以下,而不需要復(fù)雜和體積龐大
    發(fā)表于 08-06 13:48

    什么是透鏡?透鏡的制造及其應(yīng)用

    ? 1.什么是透鏡? 透鏡利用介電表面上的亞波長“原子”圖案來控制入射光。具體而言,原子圖案會改變?nèi)肷涔馐南辔环植迹瑥亩鴮?dǎo)致光束彎曲(重定向)。
    的頭像 發(fā)表于 07-16 06:26 ?360次閱讀

    融合架構(gòu)解決方案

    隨著信息技術(shù)的發(fā)展,企業(yè)對數(shù)據(jù)中心的依賴日益增強(qiáng),對存儲、計(jì)算和網(wǎng)絡(luò)資源的需求也在不斷增長。融合架構(gòu)作為一種新興的IT基礎(chǔ)設(shè)施解決方案,正逐漸成為企業(yè)數(shù)據(jù)中心建設(shè)的首選。本文將詳細(xì)介紹融合架構(gòu)
    的頭像 發(fā)表于 04-10 14:57 ?550次閱讀

    充時代,認(rèn)識

    2024年被譽(yù)為中國超級充電樁(以下簡稱“充”)發(fā)展的元年。 在國家大力支持基礎(chǔ)充電設(shè)施建設(shè)的同時,各地方政府也在積極推動充的建設(shè)。廣州于2022年提出要建設(shè)“充之都”,海南于2023年3月
    的頭像 發(fā)表于 03-04 17:30 ?864次閱讀

    COMSOL Multiphysics在材料與表面仿真中的應(yīng)用

    的透射反射分析。此外,COMSOL Multiphysics還提供了豐富的物理場求解器,可以對表面的光學(xué)性能進(jìn)行詳細(xì)分析。 周期性表面的透射反射分析 配圖說明:圖3展示了周期性
    發(fā)表于 02-20 09:20

    《新能源車維修技術(shù)自學(xué),鏈接匯總AI智能分類》4000案例

    收藏欄鏈接共享-新能源車維修自學(xué)-4000案例 -html文件 詳細(xì)見附件 [*附件:收藏欄鏈接共享-新能源車維修自學(xué)-4000案例.zip] (注:可導(dǎo)入瀏覽器,在瀏覽器的收藏欄里方便查看)
    發(fā)表于 02-18 03:30

    融合和虛擬化的區(qū)別

    融合和虛擬化是當(dāng)今IT領(lǐng)域非常熱門的兩個概念,它們都是為了提高數(shù)據(jù)中心的效能和靈活性,但在實(shí)現(xiàn)方式和功能上存在一些區(qū)別。本文將詳細(xì)討論融合和虛擬化的定義、原理、特點(diǎn)、優(yōu)缺點(diǎn)以及它們的應(yīng)用場
    的頭像 發(fā)表于 01-15 10:36 ?3904次閱讀

    ChatGPT是一個好的因果推理器嗎?

    因果推理能力對于許多自然語言處理(NLP)應(yīng)用至關(guān)重要。最近的因果推理系統(tǒng)主要基于經(jīng)過微調(diào)的預(yù)訓(xùn)練語言模型(PLMs),如BERT [1] 和RoBERTa [2]。
    的頭像 發(fā)表于 01-03 09:55 ?797次閱讀
    ChatGPT是一個好的<b class='flag-5'>因果</b>推理器嗎?

    GPT推斷中的批處理(Batching)效應(yīng)簡析

    機(jī)器學(xué)習(xí)模型依賴于批處理(Batching)來提高推斷吞吐量,尤其是對于 ResNet 和 DenseNet 等較小的計(jì)算機(jī)視覺模型。
    的頭像 發(fā)表于 12-18 15:52 ?653次閱讀
    GPT<b class='flag-5'>推斷</b>中的批處理(Batching)效應(yīng)簡析

    靜音端子機(jī)怎么使用

    靜音端子機(jī)怎么使用 靜音端子機(jī)是一種專用設(shè)備,廣泛應(yīng)用于音頻錄制和音樂制作領(lǐng)域。它憑借其出色的噪音抑制能力和高音質(zhì)傳輸性能,成為專業(yè)音頻工作者的首選設(shè)備。在本文中,我將詳細(xì)介紹
    的頭像 發(fā)表于 12-08 16:36 ?1427次閱讀