0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

哈工大訊飛聯(lián)合實驗室發(fā)布的中文ELECTRA系列預(yù)訓(xùn)練模型再迎新成員

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 作者:哈工大訊飛聯(lián)合實 ? 2020-12-26 09:49 ? 次閱讀

哈工大訊飛聯(lián)合實驗室發(fā)布的中文ELECTRA系列預(yù)訓(xùn)練模型再迎新成員。我們基于大規(guī)模法律文本訓(xùn)練出中文法律領(lǐng)域ELECTRA系列模型,并且在法律領(lǐng)域自然語言處理任務(wù)中獲得了顯著性能提升。歡迎各位讀者下載試用相關(guān)模型。

項目地址:http://electra.hfl-rc.com

中文法律領(lǐng)域ELECTRA

我們在20G版(原版)中文ELECTRA的基礎(chǔ)上加入了高質(zhì)量2000萬裁判文書數(shù)據(jù)進(jìn)行了二次預(yù)訓(xùn)練,在不丟失大規(guī)模通用數(shù)據(jù)上學(xué)習(xí)到的語義信息,同時使模型對法律文本更加適配。本次發(fā)布以下三個模型:

legal-ELECTRA-large, Chinese:24-layer,1024-hidden, 16-heads, 324M parameters

legal-ELECTRA-base, Chinese:12-layer,768-hidden, 12-heads, 102M parameters

legal-ELECTRA-small, Chinese: 12-layer, 256-hidden, 4-heads, 12M parameters

快速加載

哈工大訊飛聯(lián)合實驗室發(fā)布的所有中文預(yù)訓(xùn)練語言模型均可通過huggingface transformers庫進(jìn)行快速加載訪問,請登錄我們的共享頁面獲取更多信息。

https://huggingface.co/HFL

模型鍵值如下:

hfl/chinese-legal-electra-large-discriminator

hfl/chinese-legal-electra-large-generator

hfl/chinese-legal-electra-base-discriminator

hfl/chinese-legal-electra-base-generator

hfl/chinese-legal-electra-small-discriminator

hfl/chinese-legal-electra-small-generator

效果評測

我們在罪名預(yù)測以及要素抽取任務(wù)上進(jìn)行了基線測試。其中罪名預(yù)測任務(wù)使用的是CAIL 2018數(shù)據(jù),要素抽取任務(wù)為in-house實際應(yīng)用。可以看到本次發(fā)布的法律領(lǐng)域ELECTRA模型均相比通用ELECTRA模型獲得了顯著性能提升。

表1罪名預(yù)測任務(wù)

e4007c02-4691-11eb-8b86-12bb97331649.png

表2要素抽取任務(wù)

e46fa672-4691-11eb-8b86-12bb97331649.png

其他相關(guān)資源

TextBrewer知識蒸餾工具

http://textbrewer.hfl-rc.com

中文BERT、RoBERTa、RBT系列模型

http://bert.hfl-rc.com

中文XLNet系列模型

http://xlnet.hfl-rc.com

中文MacBERT模型

http://macbert.hfl-rc.com

責(zé)任編輯:xj

原文標(biāo)題:哈工大訊飛聯(lián)合實驗室發(fā)布法律領(lǐng)域ELECTRA預(yù)訓(xùn)練模型

文章出處:【微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4587

    瀏覽量

    92503
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5463

    瀏覽量

    120890
  • 訓(xùn)練模型
    +關(guān)注

    關(guān)注

    1

    文章

    35

    瀏覽量

    3794

原文標(biāo)題:哈工大訊飛聯(lián)合實驗室發(fā)布法律領(lǐng)域ELECTRA預(yù)訓(xùn)練模型

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    科大發(fā)布星火4.0 Turbo大模型及星火多語言大模型

    ,科大以其一貫的創(chuàng)新精神,開創(chuàng)性地發(fā)布了星火多語言大模型。這一創(chuàng)新之舉不僅進(jìn)一步鞏固了科大飛在中文
    的頭像 發(fā)表于 10-24 13:58 ?270次閱讀

    華工科技聯(lián)合哈工大實現(xiàn)國內(nèi)首臺激光智能除草機(jī)器人落地

    華工科技黨委書記、董事長、總裁馬新強一行赴哈爾濱對哈爾濱工業(yè)大學(xué)機(jī)器人技術(shù)與系統(tǒng)全國重點實驗室(后簡稱哈工大機(jī)器人實驗室)、愛輝區(qū)智能激光除草機(jī)器人試點基地進(jìn)行實地調(diào)研,代表華工科技中央研究院同
    的頭像 發(fā)表于 09-06 10:45 ?660次閱讀

    榮耀與智譜攜手共建AI大模型聯(lián)合實驗室

    近日,榮耀終端有限公司與北京智譜華章科技有限公司正式攜手,共同宣布成立AI大模型技術(shù)聯(lián)合實驗室,并簽署了戰(zhàn)略合作協(xié)議。此次合作標(biāo)志著雙方在人工智能領(lǐng)域的深度合作邁入新階段,共同致力于為用戶帶來前所未有的智能體驗。
    的頭像 發(fā)表于 09-03 18:15 ?888次閱讀

    高鴻信安出席飛騰基礎(chǔ)軟件聯(lián)合實驗室第三屆年會

    7月12日,飛騰基礎(chǔ)軟件聯(lián)合實驗室(簡稱“實驗室”)第三屆年會暨技術(shù)交流分享會在深圳順利召開。大唐高鴻信安(浙江)信息科技有限公司(簡稱“高鴻信安”)作為實驗室
    的頭像 發(fā)表于 07-15 14:07 ?506次閱讀

    MediaTek與小米集團(tuán)聯(lián)合實驗室正式揭幕

    MediaTek 宣布攜手小米集團(tuán)持續(xù)強化戰(zhàn)略合作,共同開啟更深層次的多元合作,并為位于小米深圳研發(fā)總部的「聯(lián)合實驗室」揭牌。此次「聯(lián)合實驗室」的揭幕將進(jìn)一步強化雙方合作伙伴關(guān)系,推動
    的頭像 發(fā)表于 07-03 14:52 ?634次閱讀

    【大語言模型:原理與工程實踐】大語言模型預(yù)訓(xùn)練

    大語言模型的核心特點在于其龐大的參數(shù)量,這賦予了模型強大的學(xué)習(xí)容量,使其無需依賴微調(diào)即可適應(yīng)各種下游任務(wù),而更傾向于培養(yǎng)通用的處理能力。然而,隨著學(xué)習(xí)容量的增加,對預(yù)訓(xùn)練數(shù)據(jù)的需求也相
    發(fā)表于 05-07 17:10

    西井科技和香港理工大學(xué)簽署合作協(xié)議,將共建聯(lián)合創(chuàng)新實驗室

    西井科技和香港理工大學(xué)簽署了人工智能和自動駕駛方面的深度產(chǎn)學(xué)研合作協(xié)議,將共建聯(lián)合創(chuàng)新實驗室,雙方共同探索該領(lǐng)域的前沿技術(shù)和應(yīng)用實踐。
    的頭像 發(fā)表于 04-29 09:42 ?471次閱讀
    西井科技和香港理<b class='flag-5'>工大</b>學(xué)簽署合作協(xié)議,將共建<b class='flag-5'>聯(lián)合</b>創(chuàng)新<b class='flag-5'>實驗室</b>

    AI+教育 深圳市中小學(xué)聯(lián)合實驗室正式啟用

    4月18日,深圳市中小學(xué)人工智能聯(lián)合實驗室在深圳高級中學(xué)(集團(tuán))南校區(qū)啟用。 去年,深圳市教育局發(fā)布推進(jìn)中小學(xué)人工智能教育工作方案,提出要建成具有深圳特色的人工智能教育課程體系,構(gòu)建社會資源支持
    發(fā)表于 04-22 10:07 ?220次閱讀
    AI+教育 深圳市中小學(xué)<b class='flag-5'>聯(lián)合</b><b class='flag-5'>實驗室</b>正式啟用

    谷歌模型訓(xùn)練軟件有哪些功能和作用

    谷歌模型訓(xùn)練軟件主要是指ELECTRA,這是一種新的預(yù)訓(xùn)練方法,源自谷歌AI。ELECTRA不僅
    的頭像 發(fā)表于 02-29 17:37 ?727次閱讀

    科大發(fā)布星火V3.5”:基于全國產(chǎn)算力訓(xùn)練的全民開放大模型

    科大,作為中國領(lǐng)先的智能語音和人工智能公司,近日宣布推出首個基于全國產(chǎn)算力訓(xùn)練的全民開放大模型
    的頭像 發(fā)表于 02-04 11:28 ?1439次閱讀

    上海AI實驗室發(fā)布新一代書生·視覺大模型

    近日,上海人工智能實驗室(上海AI實驗室)聯(lián)手多所知名高校及科技公司共同研發(fā)出新一代書生·視覺大模型(InternVL)。
    的頭像 發(fā)表于 02-04 11:25 ?1028次閱讀

    科大星火認(rèn)知大模型V3.5發(fā)布

    近日,科大舉辦了星火認(rèn)知大模型V3.5升級發(fā)布會。在發(fā)布會上,科大
    的頭像 發(fā)表于 01-31 17:28 ?1332次閱讀

    科大發(fā)布星火認(rèn)知大模型V3.5

    科大近日發(fā)布了星火認(rèn)知大模型V3.5版本,該版本基于全國產(chǎn)化算力底座“星一號”平臺進(jìn)行訓(xùn)練
    的頭像 發(fā)表于 01-31 14:40 ?812次閱讀

    模型星火V3.5,1月30日正式發(fā)布

    2024年1月30日14:00星火升級;這一次首個基于全國產(chǎn)化算力平臺訓(xùn)練的全民開放大模型
    的頭像 發(fā)表于 01-23 09:06 ?766次閱讀

    上能電氣&amp;江南大學(xué)聯(lián)合實驗室揭牌,共譜綠色未來

    11月14日,上能電氣-江南大學(xué)產(chǎn)學(xué)研合作交流會暨聯(lián)合實驗室揭牌儀式在上能電氣股份有限公司隆重舉行。江南大學(xué)物聯(lián)網(wǎng)工程學(xué)院黨委書記耿向陽、江南大學(xué)科學(xué)技術(shù)研究院副院長樊啟高,上能電氣副總裁李建
    的頭像 發(fā)表于 11-16 20:05 ?519次閱讀
    上能電氣&amp;江南大學(xué)<b class='flag-5'>聯(lián)合</b><b class='flag-5'>實驗室</b>揭牌,共譜綠色未來