0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PPO物理改性及化學(xué)改性的方法

倩倩 ? 來(lái)源:深圳市賽姆烯金科技有限 ? 作者:深圳市賽姆烯金科 ? 2022-09-06 15:12 ? 次閱讀

聚苯醚(PPO)樹(shù)脂因其良好的耐熱性、低吸水性、尺寸穩(wěn)定性、化學(xué)穩(wěn)定性、以及玻璃化轉(zhuǎn)變溫度高、低介電常數(shù)(εr)和低介電損耗(tanδ)等特點(diǎn)在5G材料尤其是PCB領(lǐng)域具有較好的應(yīng)用前景,也廣泛應(yīng)用于光伏、汽車、電子、家電、水處理等領(lǐng)域。但是PPO存在熔融黏度大、流動(dòng)性差、缺口沖擊強(qiáng)度低、加工成型困難等缺陷限制了其工業(yè)應(yīng)用,因此需對(duì)其改性以滿足使用要求。

5befc884-2d96-11ed-ba43-dac502259ad0.png

光伏接線盒

PPO改性方法分為物理改性(共混、填充等)和化學(xué)改性(主鏈、端基改性等),物理改性主要是與其他高性能樹(shù)脂共混形成塑料合金,化學(xué)改性是在PPO分子鏈上引入活性基團(tuán)改善相容性或與其他分子進(jìn)行嵌段、接枝以克服自身缺陷。

以下綜述了近年來(lái)PPO物理改性及化學(xué)改性的方法,重點(diǎn)分析了不同改性方式對(duì)PPO的微結(jié)構(gòu)、熱性能、力學(xué)性能、介電及加工性能的影響。

物理改性

PPO物理改性中對(duì)PPO的合金化研究較多,合金化是基于界面物理作用將兩種或兩種以上高分子材料混合在一起,借助不同組分的優(yōu)勢(shì)互補(bǔ)提升共混合金的加工、熱學(xué)、力學(xué)及電性能等。

以下分析了聚苯乙烯(PS)、高抗沖聚苯乙烯(HIPS)、丙烯腈-丁二烯-苯乙烯共聚物(ABS)、聚酰胺6(PA6)、超高相對(duì)分子質(zhì)量聚乙烯(UHMWPE)、高密度聚乙烯(HDPE)、鄰苯二甲酸二烯丙酯(DAOP)等不同聚合物對(duì)PPO物理改性的研究。

PS,HIPS,ABS改性PPO

PS與PPO均為非結(jié)晶性聚合物,彼此相容性較好,共混合金為相容體系。在PPO/PS合金中,PS起內(nèi)增塑作用,可改善PPO流動(dòng)性,使PPO具有優(yōu)良的成型加工性,然而PPO/PS合金又呈現(xiàn)脆性,可通過(guò)加入含有PS鏈段的聚合物來(lái)改善PPO合金的沖擊強(qiáng)度及韌性。常見(jiàn)含PS鏈段的聚合物包括SEBS、ABS、苯乙烯接枝馬來(lái)酸酐(MAH)共聚物(SMA)等。

錢丹等研究了HIPS及SEBS對(duì)PPO的共混改性。研究發(fā)現(xiàn),HIPS與PPO共混形成的合金沖擊強(qiáng)度得到提高,緣于HIPS分子側(cè)鏈上存在的苯環(huán)相當(dāng)于PPO的增韌劑,起到了微增韌作用。而彈性體SEBS的加入顯著提高了PPO/HIPS合金的韌性,因?yàn)镾EBS在合金受力時(shí)能夠有效緩解和吸收外部沖擊能,同時(shí)又防止材料表面銀紋的擴(kuò)展。

ABS樹(shù)脂具有高彈性、高沖擊強(qiáng)度及良好成型加工性,但其極性特性且在結(jié)構(gòu)上與PPO的差異導(dǎo)致在共混時(shí)出現(xiàn)相分離現(xiàn)象。郭正虹等采用熔融共混法制備PPO/ABS合金,研究了SMA對(duì)PPO/ABS合金的影響,SMA中PS鏈段與PPO可以混溶,而MAH與ABS均為極性組分可混溶,這樣SMA在兩相間起到類似于橋梁作用,從而起到增容作用。因此,在PPO/ABS合金中,SMA的加入使兩相之間大分子鏈段纏結(jié)程度顯著提高,且分散相尺寸變小。

2. PA6改性PPO

PA6屬于極性聚合物,與PPO不混溶,提高PA6/PPO共混體系相容性的關(guān)鍵是在共混過(guò)程中加入(或形成)含有與PA6和PPO分別相互混溶的共聚物。

GuoZ等研究了SMA對(duì)PA6/PPO共混物性能的影響。SMA與PA6接枝生成的原位增容劑SMA-b-PA6嵌段共聚物與PA6結(jié)構(gòu)高度相似而互溶,改善了PPO/PA6共混物的相界面張力與沖擊強(qiáng)度,如質(zhì)量分?jǐn)?shù)9%SMA時(shí)共混物的沖擊強(qiáng)度增加到12.7kJ/m2。

MAH接枝SEBS(SEBS-g-MAH)可做增韌劑來(lái)改善PPO/PA6共混合金的相容性及韌性。吳亦建等采用熔融共混法制備超韌PA6/SEBS-g-MAH/PPO共混物,其中,SEBS-g-MAH分散在PA6基體中,一部分與PA6中的氨基反應(yīng)形成單獨(dú)小粒子,另一部分在界面張力以及擴(kuò)展系數(shù)影響下形成了以PPO為核、SEBS-g-MAH為殼的“核殼結(jié)構(gòu)”粒子,測(cè)試表明該材料沖擊強(qiáng)度提升至82.6kJ/m2。

加入SEBS及SMA等高彈性共聚物能夠有效增韌PPO/PA6,也有研究利用纖維與無(wú)機(jī)填料對(duì)PPO/PA6合金進(jìn)行填充改性,合金的熱穩(wěn)定性得到改善。RanJC等研究發(fā)現(xiàn)有機(jī)改性磷酸鋯OZrP納米片與聚氨酯包覆碳纖維CF的加入有效提高了PA46/PPO合金的阻燃性、熱穩(wěn)定性和力學(xué)性能。

將PA6,PS,PPO三者共混后,綜合性能顯著增強(qiáng)。HadimaniP等研究發(fā)現(xiàn),GF的加入改善了PPO/PS/PA6三元共混體系的黏度及熱穩(wěn)定性,降低了熔體流動(dòng)速率以及揮發(fā)性有機(jī)分子的揮發(fā),30%GF時(shí)體系的熱變形溫度及維卡軟化溫度均得到了顯著提高,40%GF時(shí)共混物具有較高的拉伸強(qiáng)度和彎曲強(qiáng)度。

3. HDPE及UHMWPE改性PPO

UHMWPE和HDPE具有優(yōu)異的抗沖擊性、耐磨性,但結(jié)構(gòu)上的差異導(dǎo)致與PPO之間的相容性較差,常通過(guò)加入含PS的聚合物來(lái)增容。WuQ等采用懸浮法接枝共聚合成了UHMWPE接枝PS共聚物(UHMWPE-g-PS),以此為增容劑,采用擠出法制備不同質(zhì)量比的PPO/UHMWPE-g-PS/UHMWPE共混物。結(jié)果表明,當(dāng)PPO/UHMWPE-g-PS/UHMWPE質(zhì)量比為90∶10∶0時(shí),混合樹(shù)脂的力學(xué)性能大大提高,如磨損量、摩擦系數(shù)分別比純PPO提高了2.6%和45.0%,且拉伸強(qiáng)度、彎曲強(qiáng)度和洛氏硬度分別為66.5MPa,96.1MPa和109.9。

BinRM等研究了SEBS對(duì)HDPE/PPO混合體系的影響。結(jié)果表明該合金韌性及其耐熱性均得到改善。SEBS共聚物能夠通過(guò)聚合物的鏈纏結(jié)和架橋作用降低HDPE/PS共混物的界面張力,穩(wěn)定界面形態(tài),增強(qiáng)界面黏結(jié)性,同時(shí)也降低了PPO分散相的顆粒大小。

4.DAOP改性PPO

DAOP相對(duì)分子質(zhì)量和黏度均較低,在加工結(jié)束完成聚合的同時(shí)仍能保持材料的熱力學(xué)性質(zhì),相當(dāng)于添加了低相對(duì)分子質(zhì)量的增塑劑,其有助于提高熱塑性材料的加工性能。WangHH等采用2,3-二甲基-2,3-二苯基丁烷作為引發(fā)劑,以相對(duì)分子質(zhì)量較低的DAOP預(yù)聚物對(duì)PPO進(jìn)行改性研究,質(zhì)量分?jǐn)?shù)40%DAOP時(shí)共混物的拉伸強(qiáng)度和彎曲強(qiáng)度分別提升至62.7MPa和78.0MPa,且熔融黏度降低。

化學(xué)改性

超低εr和tanδ特性的PPO是制造高頻PCB基板的理想材料。然而PPO存在熔融黏度大且因缺乏活性基團(tuán)而無(wú)法交聯(lián)的缺陷限制其在PCB領(lǐng)域的工業(yè)應(yīng)用。對(duì)PPO的主鏈或端基進(jìn)行化學(xué)改性如羥基化、烯丙基化、環(huán)氧化,或與功能分子嵌段或接枝共聚等改性而形成具有活性端基的PPO低聚物,使用相應(yīng)固化劑交聯(lián)可形成耐熱沖擊的交聯(lián)PPO,從而在5G通信PCB領(lǐng)域獲得工業(yè)應(yīng)用。

1. 羥基改性PPO

含羥基的改性PPO可作為PPO合金的相容劑進(jìn)一步與環(huán)氧樹(shù)脂(EP)、氰酸酯(CE)等樹(shù)脂固化得到熱固性樹(shù)脂,同時(shí)保留了熱塑性材料的特性。

EP/PPO體系相容性較差,通過(guò)對(duì)PPO的結(jié)構(gòu)改性使PPO含有羥基或氨基官能團(tuán),之后再與EP固化形成固化體系。LiHF等合成了一種低相對(duì)分子質(zhì)量的雙端羥基改性PPO,研究了其對(duì)EP體系性能的影響。由于苯環(huán)的存在使共混物熱穩(wěn)定性得到顯著提高,同時(shí)與EP基體之間依靠共價(jià)鍵連接而保持了交聯(lián)結(jié)構(gòu)和高強(qiáng)度。改性PPO作為分散相均勻分散在EP基體的連續(xù)相中,體系的力學(xué)性能得到改善,如共混物的沖擊強(qiáng)度、拉伸強(qiáng)度分別增至16.17kJ/m2和66.6MPa。

利用雙酚A對(duì)PPO進(jìn)行化學(xué)再分配反應(yīng),制備端基含有一定數(shù)量羥基的改性PPO,并分別與EP和CE混合作為PCB基板樹(shù)脂。改性后的PPO酚羥基數(shù)量增多使改性PPO與EP和CE分子間的反應(yīng)顯著增強(qiáng),而此改性PPO所產(chǎn)生的非極性效應(yīng)導(dǎo)致混合樹(shù)脂體系的εr下降,如在107Hz頻率下測(cè)得與EP固化所得材料的εr和tanδ分別為4.65和2.11×10-3,且彎曲強(qiáng)度為49.1MPa。而此改性PPO能夠與CE中的—OCN基團(tuán)發(fā)生反應(yīng)形成亞胺-碳酸鹽,進(jìn)一步與—OCN基團(tuán)反應(yīng)生成三嗪環(huán),這能夠大大增加PPO的熱穩(wěn)定性,測(cè)得與CE固化后材料的εr為3.85(107Hz下)、tanδ為2.64×10-3(106Hz下)、熱擴(kuò)散系數(shù)降低到0.143m2/s。

2.烯丙基改性PPO

在PPO分子鏈上引入可交聯(lián)的烯丙基使改性PPO轉(zhuǎn)變?yōu)闊峁绦詷?shù)脂,充分發(fā)揮其優(yōu)異的介電性能。GuoJM等將活性烯丙基引入PPO中得到改性PPO,研究了SEBS與無(wú)機(jī)填料Li2TiO3(LT)陶瓷顆粒對(duì)改性PPO的影響,借助烯丙基雙鍵發(fā)生交聯(lián)得到耐溶劑性更強(qiáng)的熱固性PPO,當(dāng)改性PPO與SEBS共混物質(zhì)量比為5∶1時(shí),體系的tanδ為0.0027(1GHz下)。將LT陶瓷顆粒加入該共混物中,tanδ降為0.0026,彎曲強(qiáng)度提升至125MPa,可見(jiàn),該材料是高頻通信器件領(lǐng)域以及高頻、高速PCB領(lǐng)域的理想材料。

3.端基接枝其他功能分子

PPO分子嵌段或接枝其他小分子用作PPO合金的增容劑。孟運(yùn)東等將腰果酚分子中長(zhǎng)碳鏈結(jié)構(gòu)接枝到PPO分子中得到改性PPO。其中長(zhǎng)碳鏈結(jié)構(gòu)能增加與EP之間的纏結(jié)作用,另一端又與PPO相混溶。同樣,KimDK等將富馬酸(FA)接枝到PPO上得到共聚物PPO-g-FA,作為PPO/PA66共混合金的增容劑,由于PPO-g-FA和PPO具有相同的骨架結(jié)構(gòu),且PPO-g-FA的羧酸基團(tuán)很容易與PA66上的胺基發(fā)生反應(yīng),所以PPO-g-FA與PA66具有很好的相容性。

對(duì)PPO進(jìn)行物理和化學(xué)改性有利于提高PPO的耐沖擊性、韌性、加工性能等。物理改性中通常采用與其他樹(shù)脂進(jìn)行混溶的方法,在共混物中加入界面相容劑來(lái)改變不容體系相界面之間的作用力來(lái)提高兩相相容性,達(dá)到提升界面混溶和物理性能目的。化學(xué)改性中常在PPO分子末端引入端羥基、烯丙基或接枝其他功能分子來(lái)增加反應(yīng)活性和交聯(lián)性,形成網(wǎng)狀結(jié)構(gòu)來(lái)提升耐熱性及耐溶劑性。

改性PPO因其優(yōu)良的介電性能滿足5G高頻覆銅板基材的發(fā)展要求,具有廣闊的市場(chǎng)及應(yīng)用前景。目前我國(guó)5G高頻電子使用的改性PPO樹(shù)脂主要來(lái)自日本及美國(guó)的羅杰斯公司。因此,我國(guó)應(yīng)該加強(qiáng)對(duì)PPO的基礎(chǔ)研究及工業(yè)應(yīng)用技術(shù)的開(kāi)發(fā),盡早實(shí)現(xiàn)國(guó)產(chǎn)改性PPO的工業(yè)應(yīng)用。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • pcb
    pcb
    +關(guān)注

    關(guān)注

    4315

    文章

    22939

    瀏覽量

    395586
  • 光伏
    +關(guān)注

    關(guān)注

    38

    文章

    2811

    瀏覽量

    68633
  • 熱性能
    +關(guān)注

    關(guān)注

    0

    文章

    23

    瀏覽量

    6465

原文標(biāo)題:改性聚苯醚PPO研究進(jìn)展

文章出處:【微信號(hào):深圳市賽姆烯金科技有限公司,微信公眾號(hào):深圳市賽姆烯金科技有限公司】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    IC 封裝載板用有機(jī)復(fù)合基板材料研究進(jìn)展

    (PPO)及碳?xì)錁?shù)脂是分子極性極低,具有非常低的介電常數(shù)(Dk:2.45)和介質(zhì)損耗(Df:0.0007);同時(shí)聚苯醚的苯醚鍵結(jié)構(gòu)具兼顧剛性又兼顧韌性,是一種BT 樹(shù)脂較佳的改性劑。張**[17
    的頭像 發(fā)表于 11-01 11:08 ?94次閱讀

    微流控芯片的熱鍵合和表面改性鍵合的工藝區(qū)別

    微流控芯片是一種在微尺度下進(jìn)行流體操控的裝置,廣泛應(yīng)用于生物、化學(xué)、醫(yī)學(xué)等領(lǐng)域。在微流控芯片的制造過(guò)程中,鍵合技術(shù)是至關(guān)重要的一步,它決定了芯片的密封性和功能性。熱鍵合和表面改性鍵合是兩種常見(jiàn)的鍵合
    的頭像 發(fā)表于 10-28 14:03 ?61次閱讀

    DSC差示掃描量熱儀測(cè)試PA6及PA66(尼龍)的差異性

    改性塑料是指在通用塑料和工程塑料的基礎(chǔ)上,經(jīng)過(guò)填充、共混、增強(qiáng)等方法加工改性,提高了阻燃性、強(qiáng)度、抗沖擊性、韌性等方面的性能的塑料制品。 PA6及PA66(尼龍6和尼龍66)作為工程塑料中絕對(duì)
    的頭像 發(fā)表于 08-14 18:15 ?433次閱讀
    DSC差示掃描量熱儀測(cè)試PA6及PA66(尼龍)的差異性

    化學(xué)測(cè)試方法詳解

    伴隨當(dāng)今世界發(fā)展,不僅電化學(xué)理論和電化學(xué)方法不斷創(chuàng)新,而且在應(yīng)用領(lǐng)域也占有越來(lái)越重要的地位。新能源汽車工業(yè)以及生物電化學(xué)這些領(lǐng)域所取得的突出成績(jī)都是比較典型的例子,因此強(qiáng)調(diào)并且重視電
    的頭像 發(fā)表于 07-03 10:13 ?1131次閱讀
    電<b class='flag-5'>化學(xué)</b>測(cè)試<b class='flag-5'>方法</b>詳解

    化學(xué)儲(chǔ)能與物理儲(chǔ)能的對(duì)比

    在能源存儲(chǔ)領(lǐng)域,電化學(xué)儲(chǔ)能和物理儲(chǔ)能是兩種重要的儲(chǔ)能方式。它們各自具有獨(dú)特的原理和優(yōu)勢(shì),并在不同的應(yīng)用場(chǎng)景中發(fā)揮著重要作用。本文將對(duì)電化學(xué)儲(chǔ)能和物理儲(chǔ)能進(jìn)行詳細(xì)的對(duì)比,旨在揭示它們之間
    的頭像 發(fā)表于 05-20 16:27 ?1116次閱讀

    改性瀝青拌合站生產(chǎn)監(jiān)控系統(tǒng)助力公路建設(shè)

    ? ? ? ?一、背景介紹 ? ? ? ?瀝青的質(zhì)量對(duì)瀝青路面性能有重要的影響,目前全國(guó)高速公路中、上面層普遍采用改性瀝青。然而。隨著研究工作的不斷深入和路面膠結(jié)料新材料的出現(xiàn),尤其是改性瀝青在公路
    的頭像 發(fā)表于 05-08 18:09 ?227次閱讀
    <b class='flag-5'>改性</b>瀝青拌合站生產(chǎn)監(jiān)控系統(tǒng)助力公路建設(shè)

    駿鼎達(dá)今日上市,專注高分子改性保護(hù)材料

    深圳市駿鼎達(dá)新材料股份有限公司(股票簡(jiǎn)稱:駿鼎達(dá),股票代碼:301538.SZ)今日正式登陸深交所,開(kāi)啟資本市場(chǎng)新征程。公司專注于高分子改性保護(hù)材料的研發(fā)、生產(chǎn)和銷售,其核心產(chǎn)品功能性保護(hù)套
    的頭像 發(fā)表于 03-20 14:28 ?743次閱讀

    腦機(jī)接口電極界面材料與改性技術(shù)進(jìn)展綜述

    近期,華東理工大學(xué) 材料科學(xué)與工程學(xué)院 屈雪教授等人在期刊Biomaterials Translational上發(fā)表綜述文章:Advances in electrode interface materials and modification technologies for brain-computer interfaces,文章綜述了神經(jīng)電極材料與改進(jìn)技術(shù)的最新進(jìn)展。
    的頭像 發(fā)表于 03-12 09:39 ?1009次閱讀
    腦機(jī)接口電極界面材料與<b class='flag-5'>改性</b>技術(shù)進(jìn)展綜述

    化學(xué)氣相沉積與物理氣相沉積的差異

    在太陽(yáng)能電池的薄膜沉積工藝中,具有化學(xué)氣相沉積(CVD)與物理氣相沉積(PVD)兩種薄膜沉積方法,電池廠商在沉積工藝中也需要根據(jù)太陽(yáng)能電池的具體問(wèn)題進(jìn)行針對(duì)性選擇,并在完成薄膜沉積工藝后通過(guò)
    的頭像 發(fā)表于 12-26 08:33 ?1154次閱讀
    <b class='flag-5'>化學(xué)</b>氣相沉積與<b class='flag-5'>物理</b>氣相沉積的差異

    金剛石表面改性技術(shù)研究概況

    表面改性技術(shù)可有效改善金剛石與基體材料間的結(jié)合狀態(tài),解決其表面惰性強(qiáng)、難潤(rùn)濕、界面熱阻大、熱導(dǎo)率小,以及超細(xì)顆粒比表面能大、易團(tuán)聚等問(wèn)題。
    的頭像 發(fā)表于 12-21 15:36 ?1160次閱讀

    拆解大語(yǔ)言模型RLHF中的PPO算法

    由于本文以大語(yǔ)言模型 RLHF 的 PPO 算法為主,所以希望你在閱讀前先弄明白大語(yǔ)言模型 RLHF 的前兩步,即 SFT Model 和 Reward Model 的訓(xùn)練過(guò)程。另外因?yàn)楸疚牟皇羌冎v強(qiáng)化學(xué)習(xí)的文章,所以我在敘述的時(shí)候不會(huì)假設(shè)你已經(jīng)非常了解強(qiáng)
    的頭像 發(fā)表于 12-11 18:30 ?2021次閱讀
    拆解大語(yǔ)言模型RLHF中的<b class='flag-5'>PPO</b>算法

    機(jī)器人如何分得打磨市場(chǎng)一杯羹?

    打磨,是表面改性技術(shù)的一種,通過(guò)摩擦改變材料表面物理性能的一種加工方法,主要目的是為了獲取特定表面粗糙度。在傳統(tǒng)的制造業(yè)中,打磨應(yīng)用十分廣泛,如鑄、鍛造和焊后的零件通常需要通過(guò)打磨來(lái)提高輪廓精度和表面質(zhì)量
    發(fā)表于 12-01 09:58 ?299次閱讀

    ?cmp工藝是什么?化學(xué)機(jī)械研磨工藝操作的基本介紹

    化學(xué)機(jī)械研磨工藝操作的基本介紹以及其比單純物理研磨的優(yōu)勢(shì)介紹。
    的頭像 發(fā)表于 11-29 10:05 ?1711次閱讀

    微流控紡絲化學(xué)綜述與展望

    微流控技術(shù)是一項(xiàng)能夠?qū)ξ⑼ǖ乐械牧黧w進(jìn)行精確和系統(tǒng)操縱的先進(jìn)技術(shù)。該技術(shù)能夠在微平臺(tái)上靈活組合多功能組件,在微流控芯片內(nèi)實(shí)現(xiàn)微流控紡絲化學(xué)反應(yīng),與傳統(tǒng)紡絲方法相比,此紡絲過(guò)程不再是一種物理牽伸的過(guò)程,而是一個(gè)紡
    的頭像 發(fā)表于 11-19 16:05 ?988次閱讀
    微流控紡絲<b class='flag-5'>化學(xué)</b>綜述與展望

    怎樣讓PPO訓(xùn)練更穩(wěn)定?早期人類征服RLHF的馴化經(jīng)驗(yàn)

    盡管魯迅先生曾言:真的強(qiáng)化敢于直面慘淡的結(jié)果,敢于正視崩壞的曲線。但日復(fù)一復(fù)地開(kāi)盲盒難免會(huì)讓人心臟承受不了,好在前人們留下了寶貴的馴化經(jīng)驗(yàn),今天讓我們一起看看“如何穩(wěn)定且有效地訓(xùn)練PPO”。
    的頭像 發(fā)表于 11-16 11:41 ?786次閱讀
    怎樣讓<b class='flag-5'>PPO</b>訓(xùn)練更穩(wěn)定?早期人類征服RLHF的馴化經(jīng)驗(yàn)