0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在NGC上玩轉(zhuǎn)飛槳自然語(yǔ)言處理模型庫(kù)PaddleNLP!信息抽取、文本分類(lèi)、文檔智能、語(yǔ)義檢索、智能問(wèn)答等產(chǎn)業(yè)方

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:未知 ? 2022-11-30 21:35 ? 次閱讀

飛槳自然語(yǔ)言處理模型庫(kù) PaddleNLP,聚合眾多百度自然語(yǔ)言處理領(lǐng)域自研 SOTA 算法以及社區(qū)開(kāi)源模型,并憑借飛槳核心框架底層能力,不斷開(kāi)源適合產(chǎn)業(yè)界應(yīng)用的模型、場(chǎng)景、預(yù)測(cè)加速與部署能力,得到學(xué)術(shù)界與產(chǎn)業(yè)界的廣泛關(guān)注。今年,PaddleNLP 帶來(lái)重大升級(jí),覆蓋信息抽取、文本分類(lèi)、情感分析、語(yǔ)義檢索、智能問(wèn)答等自然語(yǔ)言處理領(lǐng)域核心任務(wù)。歡迎廣大開(kāi)發(fā)者使用 NVIDIA 與飛槳聯(lián)合深度適配的 NGC 飛槳容器,在 NVIDIA GPU 上進(jìn)行體驗(yàn)!

PaddleNLP 開(kāi)源首個(gè)面向通用信息抽取的產(chǎn)業(yè)級(jí)技術(shù)方案 UIE,零樣本、小樣本效果領(lǐng)先

通用信息抽取技術(shù) UIE(Universal Information Extraction)大一統(tǒng)諸多任務(wù),在實(shí)體、關(guān)系、事件和情感等 4 個(gè)信息抽取任務(wù)、13 個(gè)數(shù)據(jù)集的全監(jiān)督、低資源和少樣本設(shè)置下,取得了 SOTA 性能,這項(xiàng)成果發(fā)表在 ACL 2022。PaddleNLP 結(jié)合文心大模型中的知識(shí)增強(qiáng) NLP 大模型 ERNIE 3.0,發(fā)揮了 UIE 在中文任務(wù)上的強(qiáng)大潛力,開(kāi)源了首個(gè)面向通用信息抽取的產(chǎn)業(yè)級(jí)技術(shù)方案 UIE,其多任務(wù)統(tǒng)一建模特性大幅降低了模型開(kāi)發(fā)成本和部署的機(jī)器成本,基于 Prompt 的零樣本抽取和少樣本遷移能力更是驚艷!

通過(guò)調(diào)用paddlenlp.TaskflowAPI即可實(shí)現(xiàn)零樣本(zero-shot)抽取多種類(lèi)型的信息,以實(shí)體抽取為例:

from pprint import pprint
from paddlenlp import Taskflow
schema = ['時(shí)間', '選手', '賽事名稱(chēng)'] # Define the schema for entity extraction
ie = Taskflow('information_extraction', schema=schema)
pprint(ie("2月8日上午北京冬奧會(huì)自由式滑雪女子大跳臺(tái)決賽中中國(guó)選手谷愛(ài)凌以188.25分獲得金牌!")) # Better print results using pprint
>>> 
[{'時(shí)間': [{'end': 6, 'probability': 0.9857378532924486, 'start': 0, 'text': '2月8日上午'}],
  '賽事名稱(chēng)': [{'end': 23,'probability': 0.8503089953268272,'start': 6,'text': '北京冬奧會(huì)自由式滑雪女子大跳臺(tái)決賽'}],
'選手':[{'end':31,'probability':0.8981548639781138,'start':28,'text':'谷愛(ài)凌'}]}]

對(duì)于復(fù)雜目標(biāo),可以標(biāo)注少量數(shù)據(jù)(Few-shot)進(jìn)行模型訓(xùn)練,以進(jìn)一步提升效果。PaddleNLP 打通了從數(shù)據(jù)標(biāo)注-訓(xùn)練-部署全流程,方便大家進(jìn)行定制化訓(xùn)練。以金融領(lǐng)域事件抽取任務(wù)為例,僅僅標(biāo)注 5 條樣本,F(xiàn)1 值就提升了 25 個(gè)點(diǎn)!

990ef73e-70b3-11ed-8abf-dac502259ad0.png

表 1:UIE 在信息抽取數(shù)據(jù)集上零樣本和小樣本效果(F1-score)

GitHub 地址:

https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/uie

開(kāi)源文心 ERNIE-Layout,文檔智能不再難

(1)文心 ERNIE-Layout 多語(yǔ)言版跨模態(tài)布局增強(qiáng)文檔預(yù)訓(xùn)練大模型

文心 ERNIE-Layout 依托文心 ERNIE,基于布局知識(shí)增強(qiáng)技術(shù),融合文本、圖像、布局等信息進(jìn)行聯(lián)合建模,能夠?qū)Χ嗄B(tài)文檔(如文檔圖片、PDF 文件、掃描件等)進(jìn)行深度理解與分析,刷新了五類(lèi) 11 項(xiàng)文檔智能任務(wù)效果,為各類(lèi)上層應(yīng)用提供 SOTA 模型底座。

992460e2-70b3-11ed-8abf-dac502259ad0.png

圖 1:百度文檔智能技術(shù)指標(biāo)

(2)DocPrompt 開(kāi)放文檔抽取問(wèn)答模型(基于 ERNIE-Layout)

DocPrompt 以 ERNIE-Layout 為底座,可精準(zhǔn)理解圖文信息,推理學(xué)習(xí)附加知識(shí),準(zhǔn)確捕捉圖片、PDF 等多模態(tài)文檔中的每個(gè)細(xì)節(jié)。通過(guò)PaddleNLP Taskflow,僅用三行Python代碼即可快速體驗(yàn)DocPrompt功能。

995850f0-70b3-11ed-8abf-dac502259ad0.png

DocPrompt 零樣本效果非常強(qiáng)悍!能夠推理學(xué)習(xí)空間位置語(yǔ)義,準(zhǔn)確捕捉跨模態(tài)文檔信息,輕松應(yīng)對(duì)各類(lèi)復(fù)雜文檔:

99788cd0-70b3-11ed-8abf-dac502259ad0.png

圖 2:DocPrompt 可支持空間位置語(yǔ)義理解

99e701d8-70b3-11ed-8abf-dac502259ad0.png

圖 3:DocPrompt 支持多維度無(wú)框線表格問(wèn)答

9a17106c-70b3-11ed-8abf-dac502259ad0.png

圖 4:支持 10+ 語(yǔ)種的多語(yǔ)言提問(wèn)

GitHub 地址:

https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/ernie-layout

PaddleNLP 發(fā)布 NLP 流水線系統(tǒng)Pipelines,

10 分鐘搭建檢索、問(wèn)答等復(fù)雜系統(tǒng)

Pipelines 將各個(gè) NLP 復(fù)雜系統(tǒng)的通用模塊抽象封裝為標(biāo)準(zhǔn)組件,支持開(kāi)發(fā)者通過(guò)配置文件對(duì)標(biāo)準(zhǔn)組件進(jìn)行組合,僅需幾分鐘即可定制化構(gòu)建智能系統(tǒng),讓解決 NLP 任務(wù)像搭積木一樣便捷、靈活、高效。同時(shí),Pipelines 中預(yù)置了前沿的預(yù)訓(xùn)練模型和算法,在研發(fā)效率、模型效果和性能方面提供多重保障。

Pipelines 中集成 PaddleNLP 中豐富的預(yù)訓(xùn)練模型和領(lǐng)先技術(shù)。例如針對(duì)檢索、問(wèn)答等任務(wù),Pipelines 預(yù)置了領(lǐng)先的召回模型和排序模型,其依托國(guó)際領(lǐng)先的端到端問(wèn)答技術(shù) RocketQA 和首個(gè)人工標(biāo)注的百萬(wàn)級(jí)問(wèn)答數(shù)據(jù)集 DuReader。

9aae1458-70b3-11ed-8abf-dac502259ad0.png

圖 5:RocketQA 問(wèn)答技術(shù)領(lǐng)先

為了進(jìn)一步降低開(kāi)發(fā)門(mén)檻,提供最優(yōu)效果,PaddleNLP Pipelines 針對(duì)高頻場(chǎng)景內(nèi)置了產(chǎn)業(yè)級(jí)端到端系統(tǒng)。目前已開(kāi)源語(yǔ)義檢索、MRC(閱讀理解)問(wèn)答、FAQ 問(wèn)答、跨模態(tài)文檔問(wèn)答等多個(gè)應(yīng)用。以檢索系統(tǒng)為例,Pipelines 內(nèi)置的語(yǔ)義檢索系統(tǒng)包括文檔解析(支持 PDF、WORD、圖片等解析)、海量文檔建庫(kù)、模型組網(wǎng)訓(xùn)練、服務(wù)化部署、前端 Demo 界面(便于效果分析)等全流程功能。

9ac5b158-70b3-11ed-8abf-dac502259ad0.png

圖 6:檢索系統(tǒng)流水線示意圖

9ae0b8cc-70b3-11ed-8abf-dac502259ad0.gif

圖 7:檢索系統(tǒng)前端 Demo

GitHub 地址:

https://github.com/PaddlePaddle/PaddleNLP/tree/develop/pipelines

發(fā)布多場(chǎng)景文本分類(lèi)方案,新增數(shù)據(jù)增強(qiáng)策略,可信增強(qiáng)技術(shù)

文本分類(lèi)任務(wù)是 NLP 領(lǐng)域最常見(jiàn)、最基礎(chǔ)的任務(wù)之一,顧名思義,就是對(duì)給定的一個(gè)句子或一段文本進(jìn)行分類(lèi)。PaddleNLP 基于多分類(lèi)、多標(biāo)簽、層次分類(lèi)等高頻分類(lèi)場(chǎng)景,提供了預(yù)訓(xùn)練模型微調(diào)、提示學(xué)習(xí)、語(yǔ)義索引三種端到端全流程分類(lèi)方案。

a0e76acc-70b3-11ed-8abf-dac502259ad0.png

圖 8:模型精度-時(shí)延圖

以上方案均離不開(kāi)預(yù)訓(xùn)練模型,在預(yù)訓(xùn)練模型選擇上,ERNIE 系列模型在精度和性能上的綜合表現(xiàn)已全面領(lǐng)先于 UER/RoBERTa、Huawei/TinyBERT、HFL/RBT、RoBERTa-wwm-ext-large 等中文模型。PaddleNLP 開(kāi)源了如下多種尺寸的 ERNIE 系列預(yù)訓(xùn)練模型,滿(mǎn)足多樣化的精度、性能需求:

  • ERNIE 1.0-Large-zh-CW(24L1024H)

  • ERNIE 3.0-Xbase-zh(20L1024H)

  • ERNIE 2.0-Base-zh (12L768H)

  • ERNIE 3.0-Base(12L768H)

  • ERNIE 3.0-Medium(6L768H)

  • ERNIE 3.0-Mini(6L384H)

  • ERNIE 3.0-Micro(4L384H)

  • ERNIE 3.0-Nano(4L312H)

… …

除中文模型外,PaddleNLP 也提供 ERNIE 2.0 英文版、以及基于 96 種語(yǔ)言(涵蓋法語(yǔ)、日語(yǔ)、韓語(yǔ)、德語(yǔ)、西班牙語(yǔ)等幾乎所有常見(jiàn)語(yǔ)言)預(yù)訓(xùn)練的多語(yǔ)言模型 ERNIE-M,滿(mǎn)足不同語(yǔ)言的文本分類(lèi)任務(wù)需求。

此外,PaddleNLP 文本分類(lèi)方案依托TrustAI 可信增強(qiáng)能力數(shù)據(jù)增強(qiáng) API開(kāi)源了模型分析模塊,針對(duì)標(biāo)注數(shù)據(jù)質(zhì)量不高、訓(xùn)練數(shù)據(jù)覆蓋不足、樣本數(shù)量少等文本分類(lèi)常見(jiàn)數(shù)據(jù)痛點(diǎn),提供稀疏數(shù)據(jù)篩選、臟數(shù)據(jù)清洗、數(shù)據(jù)增強(qiáng)三種數(shù)據(jù)優(yōu)化策略,解決訓(xùn)練數(shù)據(jù)缺陷問(wèn)題,用低成本方式獲得大幅度的效果提升。例如,使用 TrustAI 進(jìn)行臟數(shù)據(jù)清洗后,文本分類(lèi)精度有明顯提升。

a10e3daa-70b3-11ed-8abf-dac502259ad0.jpg

圖 9:TrustAI 臟數(shù)據(jù)清洗策略效果展示

新增 AutoPrompt 自動(dòng)化提示功能,輕松上手 Prompt Learning,解決小樣本難題

通過(guò)配置自動(dòng)化運(yùn)行的提示學(xué)習(xí)框架 AutoPrompt,開(kāi)發(fā)者可以以最低學(xué)習(xí)成本上手提示學(xué)習(xí)。AutoPrompt 借鑒了 OpenPrompt 對(duì) Template、Verbalizer 等概念的抽象和設(shè)計(jì),并在此基礎(chǔ)上擴(kuò)展了更多特性,包括更靈活的提示設(shè)計(jì),更便捷的算法切換,通過(guò)配置即可運(yùn)行選擇最優(yōu)模型。

a12ae4f0-70b3-11ed-8abf-dac502259ad0.png

圖 10:AutoPrompt 整體流程方案

AutoPrompt 使用文檔:

https://github.com/PaddlePaddle/PaddleNLP/blob/develop/docs/advanced_guide/prompt.md

以上是 PaddleNLP 近期新發(fā)功能介紹,歡迎前往官方地址了解更多詳情。喜歡的小伙伴歡迎star支持哦~您的支持是我們不斷進(jìn)取的最大動(dòng)力!也歡迎加入 PaddleNLP 官方交流群,探討前沿技術(shù)與產(chǎn)業(yè)實(shí)踐經(jīng)驗(yàn)。

PaddleNLP 地址:

https://github.com/PaddlePaddle/PaddleNLPa17bda0e-70b3-11ed-8abf-dac502259ad0.png

NGC 飛槳容器介紹

如果您希望體驗(yàn) PaddleNLP 的新特性,歡迎使用 NGC 飛槳容器。NVIDIA 與百度飛槳聯(lián)合開(kāi)發(fā)了 NGC 飛槳容器,將最新版本的飛槳與最新的 NVIDIA 的軟件棧(如 CUDA)進(jìn)行了無(wú)縫的集成與性能優(yōu)化,最大程度的釋放飛槳框架在 NVIDIA 最新硬件上的計(jì)算能力。這樣,用戶(hù)不僅可以快速開(kāi)啟 AI 應(yīng)用,專(zhuān)注于創(chuàng)新和應(yīng)用本身,還能夠在 AI 訓(xùn)練和推理任務(wù)上獲得飛槳+NVIDIA 帶來(lái)的飛速體驗(yàn)。

最佳的開(kāi)發(fā)環(huán)境搭建工具 - 容器技術(shù)。

  1. 容器其實(shí)是一個(gè)開(kāi)箱即用的服務(wù)器。極大降低了深度學(xué)習(xí)開(kāi)發(fā)環(huán)境的搭建難度。例如你的開(kāi)發(fā)環(huán)境中包含其他依賴(lài)進(jìn)程(redis,MySQL,Ngnix,selenium-hub等等),或者你需要進(jìn)行跨操作系統(tǒng)級(jí)別的遷移。

  2. 容器鏡像方便了開(kāi)發(fā)者的版本化管理

  3. 容器鏡像是一種易于復(fù)現(xiàn)的開(kāi)發(fā)環(huán)境載體

  4. 容器技術(shù)支持多容器同時(shí)運(yùn)行

a19073e2-70b3-11ed-8abf-dac502259ad0.png

最好的 PaddlePaddle 容器

NGC 飛槳容器針對(duì) NVIDIA GPU 加速進(jìn)行了優(yōu)化,并包含一組經(jīng)過(guò)驗(yàn)證的庫(kù),可啟用和優(yōu)化 NVIDIA GPU 性能。此容器還可能包含對(duì) PaddlePaddle 源代碼的修改,以最大限度地提高性能和兼容性。此容器還包含用于加速 ETL(DALI, RAPIDS)、訓(xùn)練(cuDNN, NCCL)和推理(TensorRT)工作負(fù)載的軟件。

PaddlePaddle 容器具有以下優(yōu)點(diǎn):

  1. 適配最新版本的 NVIDIA 軟件棧(例如最新版本 CUDA),更多功能,更高性能。

  2. 更新的 Ubuntu 操作系統(tǒng),更好的軟件兼容性

  3. 按月更新

  4. 滿(mǎn)足 NVIDIA NGC 開(kāi)發(fā)及驗(yàn)證規(guī)范,質(zhì)量管理

通過(guò)飛槳官網(wǎng)快速獲取

a1a6d790-70b3-11ed-8abf-dac502259ad0.png

環(huán)境準(zhǔn)備

使用 NGC 飛槳容器需要主機(jī)系統(tǒng)(Linux)安裝以下內(nèi)容:

  • Docker 引擎

  • NVIDIA GPU 驅(qū)動(dòng)程序

  • NVIDIA 容器工具包

有關(guān)支持的版本,請(qǐng)參閱NVIDIA 框架容器支持矩陣NVIDIA 容器工具包文檔。

不需要其他安裝、編譯或依賴(lài)管理。無(wú)需安裝 NVIDIA CUDA Toolkit。

NGC 飛槳容器正式安裝:

要運(yùn)行容器,請(qǐng)按照 NVIDIA Containers For Deep Learning Frameworks User’s Guide 中Running A Container一章中的說(shuō)明發(fā)出適當(dāng)?shù)拿睿⒅付ㄗ?cè)表、存儲(chǔ)庫(kù)和標(biāo)簽。有關(guān)使用 NGC 的更多信息,請(qǐng)參閱 NGC 容器用戶(hù)指南。如果您有 Docker 19.03 或更高版本,啟動(dòng)容器的典型命令是:

a1dedb22-70b3-11ed-8abf-dac502259ad0.png

*詳細(xì)安裝介紹 《NGC 飛槳容器安裝指南》

https://www.paddlepaddle.org.cn/documentation/docs/zh/install/install_NGC_PaddlePaddle_ch.html

*詳細(xì)產(chǎn)品介紹視頻

【飛槳開(kāi)發(fā)者說(shuō)|NGC 飛槳容器全新上線 NVIDIA 產(chǎn)品專(zhuān)家全面解讀】

https://www.bilibili.com/video/BV16B4y1V7ue?share_source=copy_web&vd_source=266ac44430b3656de0c2f4e58b4daf82

飛槳與 NVIDIA NGC 合作介紹

NVIDIA 非常重視中國(guó)市場(chǎng),特別關(guān)注中國(guó)的生態(tài)伙伴,而當(dāng)前飛槳擁有超過(guò) 470 萬(wàn)的開(kāi)發(fā)者。在過(guò)去五年里我們緊密合作,深度融合,做了大量適配工作,如下圖所示。

a1f0bc34-70b3-11ed-8abf-dac502259ad0.png

今年,我們將飛槳列為 NVIDIA 全球前三的深度學(xué)習(xí)框架合作伙伴。我們?cè)谥袊?guó)已經(jīng)設(shè)立了專(zhuān)門(mén)的工程團(tuán)隊(duì)支持,賦能飛槳生態(tài)。

為了讓更多的開(kāi)發(fā)者能用上基于 NVIDIA 最新的高性能硬件和軟件棧。當(dāng)前,我們正在進(jìn)行全新一代 NVIDIA GPU H100 的適配工作,以及提高飛槳對(duì) CUDA Operation API 的使用率,讓飛槳的開(kāi)發(fā)者擁有優(yōu)秀的用戶(hù)體驗(yàn)及極致性能。

以上的各種適配,僅僅是讓飛槳的開(kāi)發(fā)者擁有高性能的推理訓(xùn)練成為可能。但是,這些離行業(yè)開(kāi)發(fā)者還很遠(yuǎn),門(mén)檻還很高,難度還很大。

為此,我們將剛剛這些集成和優(yōu)化工作,整合到三大產(chǎn)品線中。其中 NGC 飛槳容器最為閃亮。

NVIDIA NGC Container – 最佳的飛槳開(kāi)發(fā)環(huán)境,集成最新的 NVIDIA 工具包(例如 CUDA)

a2227c38-70b3-11ed-8abf-dac502259ad0.png

點(diǎn)擊查看往期精彩內(nèi)容

六:在 NGC 上玩轉(zhuǎn)圖像分割!NeurIPS 頂會(huì)模型、智能標(biāo)注 10 倍速神器、人像分割 SOTA 方案、3D 醫(yī)療影像分割利器應(yīng)有盡有!

五:在 NVIDIA NGC 上搞定模型自動(dòng)壓縮,YOLOv7 部署加速比 5.90,BERT 部署加速比 6.22

四:在 NVIDIA NGC 上體驗(yàn)輕量級(jí)圖像識(shí)別系統(tǒng)

三:在 NVIDIA NGC 上體驗(yàn)一鍵 PDF 轉(zhuǎn) Word

二:PaddleDetection 發(fā)新,歡迎在 NVIDIA NGC 飛槳容器中體驗(yàn)最新特性!

一:NVIDIA Deep Learning Examples飛槳ResNet50模型上線訓(xùn)練速度超PyTorch ResNet50

原文標(biāo)題:在NGC上玩轉(zhuǎn)飛槳自然語(yǔ)言處理模型庫(kù)PaddleNLP!信息抽取、文本分類(lèi)、文檔智能、語(yǔ)義檢索、智能問(wèn)答等產(chǎn)業(yè)方案應(yīng)有盡有!

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3637

    瀏覽量

    89856

原文標(biāo)題:在NGC上玩轉(zhuǎn)飛槳自然語(yǔ)言處理模型庫(kù)PaddleNLP!信息抽取、文本分類(lèi)、文檔智能、語(yǔ)義檢索、智能問(wèn)答等產(chǎn)業(yè)方案應(yīng)有盡有!

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【《大語(yǔ)言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)知識(shí)學(xué)習(xí)

    、機(jī)器翻譯、文本生成領(lǐng)域具有廣泛應(yīng)用。它們能夠基于用戶(hù)的提問(wèn)或描述生成相關(guān)的答案或執(zhí)行指令,極大地提升了信息檢索和利用的效率。 2. 局限性 盡管大
    發(fā)表于 08-02 11:03

    圖像識(shí)別技術(shù)包括自然語(yǔ)言處理

    計(jì)算機(jī)視覺(jué)技術(shù)對(duì)圖像進(jìn)行處理、分析和理解,從而實(shí)現(xiàn)對(duì)圖像中的目標(biāo)、場(chǎng)景、行為信息的識(shí)別和理解。圖像識(shí)別技術(shù)包括圖像預(yù)處理、特征提取、分類(lèi)
    的頭像 發(fā)表于 07-16 10:54 ?394次閱讀

    nlp自然語(yǔ)言處理基本概念及關(guān)鍵技術(shù)

    、問(wèn)答系統(tǒng)、文本摘要等眾多領(lǐng)域有著廣泛的應(yīng)用。 1. NLP的基本概念 1.1 語(yǔ)言模型 語(yǔ)言模型
    的頭像 發(fā)表于 07-09 10:32 ?265次閱讀

    nlp自然語(yǔ)言處理模型怎么做

    自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱(chēng)NLP)是人工智能領(lǐng)域的一個(gè)重要分支,它涉及到計(jì)算機(jī)對(duì)人類(lèi)語(yǔ)言的理解和生成。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,NLP領(lǐng)域
    的頭像 發(fā)表于 07-05 09:59 ?353次閱讀

    nlp自然語(yǔ)言處理模型有哪些

    自然語(yǔ)言處理(Natural Language Processing,NLP)是計(jì)算機(jī)科學(xué)和人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠理解、解釋和生成人類(lèi)語(yǔ)言。以下是對(duì)NLP領(lǐng)域一些
    的頭像 發(fā)表于 07-05 09:57 ?416次閱讀

    自然語(yǔ)言處理技術(shù)有哪些

    自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱(chēng)NLP)是人工智能領(lǐng)域的一個(gè)分支,它致力于使計(jì)算機(jī)能夠理解、解釋和生成人類(lèi)語(yǔ)言。
    的頭像 發(fā)表于 07-03 14:30 ?600次閱讀

    自然語(yǔ)言處理模式的優(yōu)點(diǎn)

    得到了廣泛的應(yīng)用,如搜索引擎、語(yǔ)音助手、機(jī)器翻譯、情感分析。 1. 提高信息獲取效率 自然語(yǔ)言處理技術(shù)能夠快速地從大量文本數(shù)據(jù)中提取關(guān)鍵
    的頭像 發(fā)表于 07-03 14:24 ?408次閱讀

    自然語(yǔ)言處理技術(shù)的核心是什么

    ,廣泛應(yīng)用于機(jī)器翻譯、情感分析、語(yǔ)音識(shí)別、智能問(wèn)答文本摘要等眾多領(lǐng)域。 自然語(yǔ)言處理技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代。1950年,圖靈
    的頭像 發(fā)表于 07-03 14:20 ?340次閱讀

    自然語(yǔ)言處理是什么技術(shù)的一種應(yīng)用

    廣泛,包括機(jī)器翻譯、語(yǔ)音識(shí)別、情感分析、信息檢索、問(wèn)答系統(tǒng)、文本摘要、聊天機(jī)器人。 一、自然語(yǔ)言
    的頭像 發(fā)表于 07-03 14:18 ?310次閱讀

    自然語(yǔ)言處理包括哪些內(nèi)容

    ,從而實(shí)現(xiàn)人機(jī)之間的自然交流。本文將詳細(xì)介紹NLP的主要內(nèi)容,包括基本概念、關(guān)鍵技術(shù)、應(yīng)用領(lǐng)域。 一、自然語(yǔ)言處理的基本概念 自然語(yǔ)言
    的頭像 發(fā)表于 07-03 14:15 ?517次閱讀

    自然語(yǔ)言處理屬于人工智能的哪個(gè)領(lǐng)域

    之間的交互,旨在使計(jì)算機(jī)能夠理解、生成和處理自然語(yǔ)言自然語(yǔ)言處理:人工智能的皇冠的明珠 引
    的頭像 發(fā)表于 07-03 14:09 ?695次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)文本分類(lèi)領(lǐng)域的應(yīng)用

    自然語(yǔ)言處理(NLP)領(lǐng)域,文本分類(lèi)一直是一個(gè)重要的研究方向。隨著深度學(xué)習(xí)技術(shù)的飛速發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱(chēng)CNN)
    的頭像 發(fā)表于 07-01 16:25 ?381次閱讀

    【大語(yǔ)言模型:原理與工程實(shí)踐】大語(yǔ)言模型的基礎(chǔ)技術(shù)

    模型架構(gòu)奠定基礎(chǔ)。然后,引介一些經(jīng)典的預(yù)訓(xùn)練模型,如BERT、GPT。最后,解讀ChatGPT和LLaMA系列模型,幫助讀者初步感知大語(yǔ)言
    發(fā)表于 05-05 12:17

    【大語(yǔ)言模型:原理與工程實(shí)踐】揭開(kāi)大語(yǔ)言模型的面紗

    。這一過(guò)程的不斷迭代使大語(yǔ)言模型語(yǔ)言理解和生成能力逐步提升。大語(yǔ)言模型
    發(fā)表于 05-04 23:55

    2023年科技圈熱詞“大語(yǔ)言模型”,與自然語(yǔ)言處理有何關(guān)系

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)大語(yǔ)言模型(LLM)是基于海量文本數(shù)據(jù)訓(xùn)練的深度學(xué)習(xí)模型。它不僅能夠生成自然語(yǔ)言
    的頭像 發(fā)表于 01-02 09:28 ?2063次閱讀