關(guān)于通過自然語言處理輔助完成匯總醫(yī)學(xué)領(lǐng)域知識的過程詳解

1、總述

近年來醫(yī)療數(shù)據(jù)挖掘發(fā)展迅速，然而目前醫(yī)療數(shù)據(jù)結(jié)構(gòu)化處于起步階段，更多的醫(yī)療數(shù)據(jù)仍然以自然語言文本形式出現(xiàn)。自然人的學(xué)習(xí)能力有限，因此學(xué)者們嘗試通過自然語言處理（Natural Language Processing，NLP）輔助完成匯總醫(yī)學(xué)領(lǐng)域知識的過程，將知識提煉出來，提取其中有用的診療信息，最終形成知識本體或者知識網(wǎng)絡(luò)，從而為后續(xù)的各種文本挖掘任務(wù)提供標(biāo)準(zhǔn)和便利。

2、具體應(yīng)用

2.1 文本挖掘

1）研究背景：生物醫(yī)學(xué)文本挖掘可以幫助人們從爆炸式增長的生物醫(yī)學(xué)自然語言文本數(shù)據(jù)中抽取出特定的事實(shí)信息（主要是生物實(shí)體如基因、蛋白質(zhì)、藥物、疾病之間的關(guān)系），對整個生物知識網(wǎng)絡(luò)的建立、生物體關(guān)系的預(yù)測、新藥的研制等均具有重要的意義。

2）典型應(yīng)用及應(yīng)用方法

2.1.1命名實(shí)體識別

1）研究背景

生物命名實(shí)體識別，就是從生物醫(yī)學(xué)文本中識別出指定類型的名稱，比如基因、蛋白質(zhì)、核糖核酸、脫氧核糖核酸、疾病、細(xì)胞、藥物的名稱等。由于生物醫(yī)學(xué)文獻(xiàn)的規(guī)模龐大，各種專有名詞不斷涌現(xiàn)，一個專有名詞往往有很多同義詞，而且普遍存在大量的縮寫詞，人工識別費(fèi)時費(fèi)力，因此如何對命名實(shí)體進(jìn)行識別就變得尤為重要。命名實(shí)體識別是文本挖掘系統(tǒng)中的一個重要的基礎(chǔ)步驟，命名實(shí)體識別的準(zhǔn)確程度是其他文本挖掘技術(shù)如信息提取或文本分類等的先決條件。

2）典型應(yīng)用及應(yīng)用方法

目前，使用比較多的生物命名實(shí)體識別的研究方法主要有以下幾種：基于啟發(fā)式規(guī)則的方法、詞典匹配的方法以及機(jī)器學(xué)習(xí)的方法，如支持向量機(jī)（SVM）、最大熵、條件隨機(jī)場（CRF）以及隱馬爾科夫（HMM）等。

（1）基于啟發(fā)式規(guī)則的方法

Fukuda等人最早利用基于規(guī)則的系統(tǒng)判定文檔中的蛋白質(zhì)名稱；Tsuruoka等人采用啟發(fā)式規(guī)則以最小化相關(guān)術(shù)語的歧義性和變化性，實(shí)現(xiàn)了術(shù)語名稱的標(biāo)準(zhǔn)化進(jìn)而提高了查找字典的效率。

優(yōu)點(diǎn)：利用啟發(fā)式信息產(chǎn)生識別命名實(shí)體的規(guī)則可以靈活地定義和擴(kuò)展

缺點(diǎn)：規(guī)則對領(lǐng)域知識的依賴性很強(qiáng)，修改它們需要該領(lǐng)域?qū)＜覅⑴c并花費(fèi)大量時間。另外，由于命名實(shí)體類型多樣，且新類型的命名實(shí)體還在不斷涌現(xiàn)，這使得人們很難建立一套一致的規(guī)則。

目前，基于規(guī)則的方法一般被整合到基于機(jī)器學(xué)習(xí)的方法的后期處理過程中。

（2）基于字典的方法

最早采用的方法是基于字典的方法，1998年，Proux等人［9］第一次應(yīng)用英語詞典來識別基因和蛋白質(zhì)。

優(yōu)點(diǎn)：簡單且實(shí)用。

缺點(diǎn)：新的命名實(shí)體不斷出現(xiàn)，并且很多命名實(shí)體的長度較長甚至存在變體，難以建立一個完整的的生物醫(yī)學(xué)命名實(shí)體字典。

因此，基于字典的方法通常以字典特征的形式被整合到基于機(jī)器學(xué)習(xí)的方法中［10］。

（3）基于機(jī)器學(xué)習(xí)的方法

基于機(jī)器學(xué)習(xí)的方法是目前主流的方法，它們利用統(tǒng)計(jì)方法從大量數(shù)據(jù)中估算相關(guān)參數(shù)和特征進(jìn)而建立識別模型。

優(yōu)點(diǎn)：客觀、移植性好。

缺點(diǎn)：需要大量的訓(xùn)練數(shù)據(jù)且訓(xùn)練過程相當(dāng)耗時。

命名實(shí)體識別可以看做是詞的分類問題，因此可以采用基于分類的方法如貝葉斯模型和支持向量機(jī)［4］等；同時，它也可以看做是序列分析問題（每個詞語作為序列中的一個詞被打上標(biāo)簽），因此可采用條件隨機(jī)域［6］、隱馬爾可夫模型等基于馬爾可夫的模型?；跈C(jī)器學(xué)習(xí)的方法包括特征選擇、分類方法和后期處理等幾個步驟。

2.1.2 關(guān)系抽取

1）研究背景

關(guān)系抽?。?Relationship extraction，RE）的目標(biāo)是檢測一對特定類型的實(shí)體之間有無預(yù)先假設(shè)的關(guān)系［39］。生物醫(yī)學(xué)文本挖掘抽取的就是基因、蛋白質(zhì)、藥物、疾病、治療之間的關(guān)系。

2）典型應(yīng)用及應(yīng)用方法

主要有基于模版的方式（手動、自動）、基于統(tǒng)計(jì)的方式和基于自然語言處理的方式?；谧匀徽Z言的方法就是把自然語言分解為可從中提取出關(guān)系的結(jié)構(gòu) 。Friedman 等人通過提出了GENIES系統(tǒng)，它從生物學(xué)文獻(xiàn)中提取和構(gòu)建關(guān)于細(xì)胞途徑的信息。

2.1.3 文本分類

1）研究背景

文本分類（ Text classification）就是將文本自動歸入預(yù)先定義好的主題類別中，是有監(jiān)督的機(jī)器學(xué)習(xí) 方法，主要應(yīng)用于自動索引、文本過濾、詞義消歧（ WSD）和 Web 文檔分類等。

2）典型應(yīng)用及應(yīng)用方法

目前，文本分類的方法有很多，典型且效果較好的有樸素貝葉斯分類法（ Na Bayes）、K 最近鄰（ K － NN）、支持向量機(jī)（ SVM）、決策樹等，還有基于關(guān)聯(lián)的分類（ CBA）及基于關(guān)聯(lián)規(guī)則的分類（ ARC）。Eskin E［13］使用 SVM 算法和基因序列 kernel 預(yù)測蛋白質(zhì)在細(xì)胞質(zhì)中的位置，達(dá)到了 87 % 的查準(zhǔn)率和 71% 的查全率。

2.1.4 文本聚類

1）研究背景

文本聚類（ Text clustering）是根據(jù)文本數(shù)據(jù)的特征將一組對象集合按照相似性歸納為不同類的過程，與文本分類的區(qū)別是分類的對象有類別標(biāo)記。

2）典型應(yīng)用及應(yīng)用方法

常見的聚類算法可歸納為平面劃分法（如 K －均值算法、K －中心點(diǎn)算法），層次聚類法（可分為凝聚層次聚類和分割聚類），基于密度的方法（如 DBSCAN 算法），基于網(wǎng)格的方法（如 STING 算法），基于模型的方法。

Groth P 等根據(jù)顯型的描述，利用文本聚類將基因聚類成簇，利用這些簇預(yù)測基因功能，采用客觀標(biāo)準(zhǔn)選擇一個子類團(tuán)，從生物過程次本體中預(yù)測GO-術(shù)語注釋，得到了 72． 6% 的查準(zhǔn)率和 16． 7% 的查全率。

2.1.5 共現(xiàn)分析

1）研究背景

共現(xiàn)（ Co-occurrence）分析主要是對隱性知識的挖掘，在生物醫(yī)學(xué)領(lǐng)域主要用于諸如 DNA 序列的數(shù)據(jù)分析、基因功能相似聚類、基因和蛋白質(zhì)的功能信息提取、提高遠(yuǎn)程同源性搜索、基因與確定疾病關(guān)系預(yù)測等［15］。如果在大規(guī)模語料（訓(xùn)練語料）中，兩個詞經(jīng)常共同出現(xiàn)（共現(xiàn)）在同一窗口單元（如一定詞語間隔、一句話、一篇文檔等）中，則認(rèn)為這兩個詞在語義上是相互關(guān)聯(lián)的。而且，共現(xiàn)的頻率越高，其相互間的關(guān)聯(lián)越緊密。

2）典型應(yīng)用及應(yīng)用方法

基于共現(xiàn)關(guān)系的假定，通過對訓(xùn)練語料的統(tǒng)計(jì)，計(jì)算得到詞與詞之間的互信息（ Mutual information），就可以對詞與詞之間的相關(guān)性進(jìn)行量化比較，獲得對文本詞匯語義級別的關(guān)聯(lián)認(rèn)識。如Pub-Gene系統(tǒng)使用共現(xiàn)方法建立了一個包含基因和基因交互關(guān)系的數(shù)據(jù)庫，實(shí)驗(yàn)結(jié)果達(dá)到了60%的精確率和51%的召回率。當(dāng)僅考慮5篇或5篇以上文章中的基因?qū)﹃P(guān)系時，精確率上升到72%。

2.2 決策支持系統(tǒng)

1）研究背景

在醫(yī)學(xué)臨床實(shí)踐中，對于醫(yī)務(wù)人員來說，作為一個理智、情感共存的個體，在醫(yī)學(xué)實(shí)踐中難免會犯錯，這導(dǎo)致了醫(yī)患雙方關(guān)系的緊張、甚至生命健康的負(fù)面影響。為了降低出錯的概率以及提高工作效率，臨床決策支持系統(tǒng)應(yīng)運(yùn)而生，它可以對醫(yī)務(wù)人員進(jìn)行診療方面的指導(dǎo)。

2）典型應(yīng)用及應(yīng)用方法

醫(yī)療決策支持系統(tǒng)的建立主要分為以下三個步驟：

2.2.1知識庫的建立

詞庫是自然語言處理的基礎(chǔ)，首先應(yīng)建立詞庫。使用醫(yī)學(xué)專業(yè)詞匯、頻率極高的謂詞、量詞等詞匯、醫(yī)療文書詞匯的常用組合及常用語句等，加上基本的語法庫，形成用于醫(yī)學(xué)語言處理的知識庫。

另外，作為臨床支持系統(tǒng)，還需要建立作為比較條件的知識庫，使患者的各種診療要素形成一定傾向性的結(jié)果輸出。

2.2.2語言處理

按照中文自然語言處理的一般步驟，進(jìn)行分句、分詞、語義分析、形成文本摘要。

? 分句

分為基本單句的分割，和句群的分割。分句主要以基本的標(biāo)點(diǎn)符號作為分隔符對語言進(jìn)行計(jì)算機(jī)子句分割，完成分句處理。中文主要以句號、問號、省略號等為句群結(jié)束符，而醫(yī)療文書基本上都是陳述句，故多以句號為句群結(jié)束符。

? 分詞

目前主流的分詞算法主要有三種，分別為基于字符串匹配的分詞算法、基于理解的分詞算法和基于統(tǒng)計(jì)的分詞算法。從詞庫中詞條或習(xí)慣搭配短語的最大長度開始，逐漸縮短，對基本分句進(jìn)行匹配詞庫中的詞條。最后把醫(yī)療文書分割為一個個詞匯或短語。

? 語義分析、文本摘要

根據(jù)漢語基本語法，對詞匯進(jìn)行重組，剔除意義不大的部分，形成摘要。以上述病程記錄進(jìn)行分句、分詞為例：

第一步、分句：句群：今日查房，患者訴頭昏乏力減輕，腹瀉停止，進(jìn)軟食。分句：今日查房患者訴頭昏乏力減輕腹瀉停止進(jìn)軟食

第二步、分詞：今日 \ 查房患者 \ 訴\ 頭昏\ 乏力\ 減輕腹瀉\停止進(jìn)\ 軟食

2.2.3 臨床決策支持系統(tǒng)

以臨床診療指南、操作規(guī)范為參考，在對醫(yī)療文書進(jìn)行語言處理后進(jìn)行推理、分析，找出其中存在的問題。分析模型是其中的關(guān)鍵。如圖1所示，以上述病程記錄為例：依次輸入詞匯、短語。

關(guān)于通過自然語言處理輔助完成匯總醫(yī)學(xué)領(lǐng)域知識的過程詳解

圖1 決策支持系統(tǒng)模型

在分析模型中，比照的是臨床診療指南、操作規(guī)范，所以在建立此知識庫時，所用的詞匯、短語應(yīng)該與語言處理所用的知識庫相對應(yīng)，否則會增加建立分析模型的難度和復(fù)雜性。

2.3 信息提取

1）研究背景

信息抽?。↖nformation Extraction，IE）是指從文本中抽取指定的一類事實(shí)信息，形成結(jié)構(gòu)化的數(shù)據(jù)儲存在數(shù)據(jù)庫中，以供用戶對信息的查詢或進(jìn)一步分析利用的過程。如一位生物醫(yī)學(xué)科學(xué)家要從海量的生物醫(yī)學(xué)文獻(xiàn)中尋求關(guān)于某種疾病的新的治療方案，借助于信息抽取系統(tǒng)抽取出的蛋白質(zhì)、基因或藥物等的交互關(guān)系信息，就有可能從中發(fā)現(xiàn)有價值的治療線索或方法。

2）典型應(yīng)用及應(yīng)用方法

? 信息抽取技術(shù)在電子病歷中的應(yīng)用

由哥倫比亞大學(xué)的Carol Friedman等人設(shè)計(jì)的MEDLEE系統(tǒng)也是一個很成功的醫(yī)學(xué)信息抽取系統(tǒng)，作為臨床信息系統(tǒng)（CIS）的一個獨(dú)立模塊在紐約長老會醫(yī)院使用，它將文本形式的病歷報告轉(zhuǎn)換成編碼數(shù)據(jù)以促進(jìn)乳腺癌研究，有利于病人看護(hù)質(zhì)量的提高。息抽取技術(shù)在電子病歷中的成功，將克服臨床決策支持、臨床路徑管理等前沿醫(yī)療信息發(fā)展所面臨的諸多瓶頸問題，提升我國醫(yī)療信息技術(shù)產(chǎn)業(yè)的核心競爭力。

? 信息抽取技術(shù)在醫(yī)學(xué)文獻(xiàn)中的應(yīng)用

國內(nèi)對生物醫(yī)學(xué)文獻(xiàn)信息抽取研究相對較多，極大地促進(jìn)了生物醫(yī)學(xué)的現(xiàn)代化進(jìn)程，如從中藥復(fù)方的臨床文獻(xiàn)進(jìn)行復(fù)方名稱的抽取；利用信息抽取技術(shù)從Web形式的中醫(yī)藥文獻(xiàn)資料中抽取結(jié)構(gòu)化中醫(yī)臨床診療信息的中醫(yī)臨床診療垂直搜索系統(tǒng)TCMVSE 。

? 信息抽取技術(shù)在生物醫(yī)學(xué)網(wǎng)絡(luò)資源中的應(yīng)用

針對網(wǎng)絡(luò)上分布散亂的生物醫(yī)學(xué)資源，可以用基于HTML結(jié)構(gòu)的信息抽取方法實(shí)現(xiàn)對生物醫(yī)學(xué)資源的抽取，將其轉(zhuǎn)換成結(jié)構(gòu)化的數(shù)據(jù)存儲到數(shù)據(jù)庫中。

北京中醫(yī)藥大學(xué)在1989年完成了“中醫(yī)方劑信息智能分析支援系統(tǒng)”，收集了對40余萬條方劑信息的解釋，可產(chǎn)生800余萬相關(guān)數(shù)據(jù)，并于1997年得到國家教育部博士點(diǎn)學(xué)科專項(xiàng)基金的支持，用Wed_db技術(shù)，將方劑數(shù)據(jù)庫移植到Oracle7for UNIX平臺，在Internet網(wǎng)上實(shí)驗(yàn)性地實(shí)現(xiàn)了方劑數(shù)據(jù)庫的查詢和分析處理。

2.4 自動問答系統(tǒng)

1）研究背景

隨著大數(shù)據(jù)時代的到來，對于傳統(tǒng)的信息檢索來說，由于醫(yī)學(xué)專業(yè)的特殊性，面對網(wǎng)絡(luò)上質(zhì)量參差不齊的醫(yī)學(xué)信息，非醫(yī)學(xué)專業(yè)人員在查找、理解及獲取方面存在諸多困難和障礙。而基于自動問答的醫(yī)學(xué)信息搜尋模式作為更智能的醫(yī)學(xué)信息資源獲取工具，不僅對海量數(shù)據(jù)資源的有效利用具有重大意義，而且在一定程度上可緩解醫(yī)患之間信息不對稱、提高醫(yī)療資源利用效率，同時能更好地體現(xiàn)“以病人為中心”服務(wù)理念的轉(zhuǎn)變。

2）典型應(yīng)用及應(yīng)用方法

2.4.1 基于傳統(tǒng)搜索技術(shù)的問答系統(tǒng)

基于傳統(tǒng)搜索技術(shù)的問答系統(tǒng)，在問題分析中將問題的關(guān)鍵詞和數(shù)據(jù)資源中的關(guān)鍵詞進(jìn)行匹配，進(jìn)而獲取可能相關(guān)的答案片段。典型的醫(yī)學(xué)領(lǐng)域自動問答應(yīng)用具體見表1。

關(guān)于通過自然語言處理輔助完成匯總醫(yī)學(xué)領(lǐng)域知識的過程詳解

表1 基于傳統(tǒng)檢索技術(shù)的自動問答系統(tǒng)相關(guān)研究

應(yīng)用方法如下：

基于傳統(tǒng)搜索技術(shù)的問答系統(tǒng)的核心技術(shù)包括三個主要組成模塊：問題處理、信息檢索和答案抽取。

2.4.1.1問題處理

（1）問題類型識別

主要有啟發(fā)式算法（基于規(guī)則的算法）、基于機(jī)器學(xué)習(xí)的算法等。

（2）提取問題關(guān)鍵詞

可根據(jù)詞語的詞性、tfidf值或?qū)Σ煌匾潭鹊脑~語賦予權(quán)重等方法篩選出關(guān)鍵詞。

（3）問題關(guān)鍵詞拓展?

主要有基于詞典的方法、基于統(tǒng)計(jì)的方法和相關(guān)反饋的方法。

- 基于詞典的方法可用Wordnet（用于英文問答系統(tǒng)）、Hownet（用于中文問答系統(tǒng)）或其他同義詞詞典來擴(kuò)展關(guān)鍵詞。

- 基于統(tǒng)計(jì)的方法需要大量的問題和預(yù)料來訓(xùn)練。每一類問題所對應(yīng)的答案一般有某種共同的特性，如對于詢問地點(diǎn)的問題，答案中經(jīng)常會出現(xiàn)“在、位于、地處”等關(guān)鍵詞。所以通過統(tǒng)計(jì)，我們找到這些詞后就可以把它們加到問句中。

- 相關(guān)反饋的方法是用檢索返回的相關(guān)文檔對關(guān)鍵詞進(jìn)行擴(kuò)展。

2.4.1.2 信息檢索

問答系統(tǒng)中的信息檢索模塊利用問題處理模塊輸出的關(guān)鍵詞以及其拓展來搜索相關(guān)的段落。

主要有基于統(tǒng)計(jì)的方法和基于語義的方法。

基于統(tǒng)計(jì)的方法主要根據(jù)用戶查詢與數(shù)據(jù)全集中數(shù)據(jù)的統(tǒng)計(jì)量來計(jì)算相關(guān)性。目前較流行的有：布爾模型、概率模型和向量空間模型。

基于語義的方法是對用戶查詢和數(shù)據(jù)全集中的數(shù)據(jù)進(jìn)行一定程度的語法語義分析，也就是在對用戶查詢和數(shù)據(jù)全集中的內(nèi)容進(jìn)行理解的基礎(chǔ)上進(jìn)行兩者的相關(guān)計(jì)算。

2.4.1.3 答案抽取

主要有根據(jù)命名實(shí)體、推理、上下文的方法。

2.4.2 基于語義技術(shù)的問答系統(tǒng)

基于語義技術(shù)的問答系統(tǒng)，對自然語言問題進(jìn)行語義處理，實(shí)現(xiàn)從語義層面理解用戶提出的問題。相關(guān)的應(yīng)用研究如表2，但目前相關(guān)的應(yīng)用研究較少。

關(guān)于通過自然語言處理輔助完成匯總醫(yī)學(xué)領(lǐng)域知識的過程詳解

表2 基于語義技術(shù)問答系統(tǒng)相關(guān)研究

應(yīng)用方法如下：

基于語義技術(shù)的問答系統(tǒng)在基于傳統(tǒng)搜索技術(shù)的問答系統(tǒng)的基礎(chǔ)上，可在問題處理模塊和答案抽取模塊加入對句子的結(jié)構(gòu)進(jìn)行分析（即句法分析）的方法。

在問題處理模塊里需要通過對問句結(jié)構(gòu)進(jìn)行分析，根據(jù)問句的結(jié)構(gòu)確定問句的類型，同時抽取句子關(guān)鍵詞。

在答案抽取階段，可對答案的候選句子進(jìn)行結(jié)構(gòu)分析，進(jìn)行句子相似度的計(jì)算，去除重復(fù)或相近的候選答案，最后根據(jù)問題類型抽取出答案實(shí)體。

2.5 醫(yī)學(xué)影像的信息提取和分析

1）研究背景

醫(yī)學(xué)影像報告是電子健康病歷（electronic health record，EHR）中包含大量數(shù)字信息的重要組成部分。醫(yī)學(xué)影像中使用NLP的總體目標(biāo)是挖掘診斷報告中結(jié)構(gòu)化信息，并將其應(yīng)用于臨床診治過程。

2）典型應(yīng)用及應(yīng)用方法

根據(jù)信息提取的對象和目的不同，NLP可用于患者個體信息分析、患者群體信息分析和醫(yī)學(xué)影像流程信息分析等。

1. 患者個體影像診斷信息提取和分析，對患者個體疾病處理提供幫助

（1）提示“危急發(fā)現(xiàn)（critical findings）”：NLP檢出影像報告中描述的、可能導(dǎo)致嚴(yán)重后果的影像征象，提醒處理該患者的醫(yī)師注意。目前NLP可提示的危急情況有闌尾炎、急性肺損傷、肺炎、血栓栓塞性疾病及各類潛在惡性病變等。

（2）提示隨訪建議：NLP檢出報告中應(yīng)提示臨床進(jìn)行后續(xù)操作的內(nèi)容，自動生成隨訪建議，提示后續(xù)檢查或治療。

2. 患者群體影像診斷信息提取和分析，構(gòu)建患者隊(duì)列，用于流行病學(xué)研究、行政管理等

（1）流行病學(xué)研究隊(duì)列的構(gòu)建：使用NLP可高效率地分析大數(shù)量、患者群體的影像報告，得到群體的特征性數(shù)據(jù)，從而提高流行病學(xué)研究效率，為循證影像醫(yī)學(xué)研究提供幫助。

3. 醫(yī)學(xué)影像流程信息的提取和分析，用于醫(yī)學(xué)影像報告質(zhì)量評價和改進(jìn)

（1）報告質(zhì)量評價和報告規(guī)范的建立：NLP可識別醫(yī)學(xué)影像學(xué)的流程和質(zhì)量指標(biāo)，判斷影像報告是否符合相關(guān)指南或診斷規(guī)則。同時可用于評價報告的完整性和規(guī)范，是否給出正確的建議，是否及時進(jìn)行危急情況的預(yù)警，報告信息是否用于疾病的診斷等方面。

（2）影像檢查全流程的改進(jìn)：NLP可對各類影像的綜合信息進(jìn)行分析，將報告中的檢查結(jié)果和建議等信息與全面的臨床信息相互關(guān)聯(lián)，如檢查適應(yīng)證、疾病種類、患者年齡、性別、申請科室、申請醫(yī)師及患者類型（住院或門診）等。這種大規(guī)模的數(shù)據(jù)分析在經(jīng)過驗(yàn)證后，可得到預(yù)測模型，形成適合本地情況的臨床決策支持系統(tǒng)（clinical decision support system，CDSS），應(yīng)可應(yīng)用到計(jì)算機(jī)醫(yī)囑系統(tǒng)（computerized physician order entry，CPOE）中去。

閱讀全文

智能醫(yī)療(73963) 智能醫(yī)療(73963)

如何開始使用PyTorch進(jìn)行自然語言處理

隨著人工智能和深度學(xué)習(xí)程序在未來幾年的蓬勃發(fā)展，自然語言處理（NLP）將日益普及，而且必要性也與日俱增。PyTorch 自然語言處理是實(shí)現(xiàn)這些程序的不錯選擇。

2022-07-07 10:01:31

2138

自然語言處理包括哪些內(nèi)容自然語言處理技術(shù)包括哪些

自然語言處理(Natural Language Processing, NLP)一般包括以下內(nèi)容：語音識別(Speech Recognition)：將人類語言轉(zhuǎn)換為計(jì)算機(jī)可以理解的形式。語音合成

2023-08-03 16:22:33

3392

2023年科技圈熱詞“大語言模型”，與自然語言處理有何關(guān)系

電子發(fā)燒友網(wǎng)報道（文/李彎彎）大語言模型（LLM）是基于海量文本數(shù)據(jù)訓(xùn)練的深度學(xué)習(xí)模型。它不僅能夠生成自然語言文本，還能夠深入理解文本含義，處理各種自然語言任務(wù)，如文本摘要、問答、翻譯

2024-01-02 09:28:33

1267

關(guān)于自然語言處理之54 語言模型(自適應(yīng))

自然語言處理——54 語言模型(自適應(yīng))

2020-04-09 08:20:30

關(guān)于MDK下C語言的基礎(chǔ)知識匯總

MDK5的使用技巧有哪些？關(guān)于MDK下C語言的基礎(chǔ)知識匯總

2022-02-25 06:47:47

關(guān)于匯編語言的知識點(diǎn)匯總，絕對實(shí)用

關(guān)于匯編語言的知識點(diǎn)匯總，絕對實(shí)用

2022-01-18 07:32:53

自然語言處理——總結(jié)、習(xí)題

自然語言處理——79 總結(jié)、習(xí)題

2020-06-19 11:22:23

自然語言處理中的分詞問題總結(jié)

提高了召回率。增加詞表增加詞表是提高切分準(zhǔn)確率“立竿見影”的辦法。在自然語言處理中，只要是封閉集合的詞語或?qū)嶓w，可以考慮利用詞表來切分，例如成語。該方法簡單有效。在明略分詞數(shù)據(jù)中，集成了全國所有的地名

2018-10-26 13:48:43

自然語言處理之66參數(shù)學(xué)習(xí)

自然語言處理——66參數(shù)學(xué)習(xí)

2020-07-16 09:43:33

自然語言處理之：搭建基于HanLP的開發(fā)環(huán)境

CharType.dat.yes 即可。相對比較簡單。嘗試HanLP主要處于各個開源自然語言處理工具包之間的差異，尋找一個適合學(xué)習(xí)的開源工具包。 HanLP調(diào)用方法HanLP幾乎所有的功能都可以通過工具類

2018-11-09 10:15:23

自然語言處理怎么最快入門？

`本文整理自知乎上的一個問答，分享給正在學(xué)習(xí)自然然語言處理的朋友們！一、自然語言處理是什么？自然語言處理說白了，就是讓機(jī)器去幫助我們完成一些語言層面的事情，典型的比如：情感分析、文本摘要、自動

2018-11-28 10:02:37

自然語言處理技術(shù)介紹

專業(yè)知識。本文主要介紹自然語言處理領(lǐng)域的一些常用技術(shù)。受限于本人在數(shù)據(jù)處理領(lǐng)域的實(shí)踐經(jīng)驗(yàn)，在示例的選擇上，主要以個人的研發(fā)項(xiàng)目為主，包括自動應(yīng)答系統(tǒng)、信息檢索系統(tǒng)等。1.1.術(shù)語l詞詞是自然語言

2018-09-27 09:57:14

自然語言處理的語言模型

自然語言處理——53 語言模型（數(shù)據(jù)平滑）

2020-04-16 11:11:25

自然語言處理的分詞方法

自然語言處理——75 自動分詞基本算法

2020-03-19 11:46:48

自然語言處理的功能合一文法

自然語言處理——82 功能合一文法(Function Unification Grammar, FUG)

2020-03-25 11:19:20

自然語言處理的未登錄詞識別

自然語言處理——76 未登錄詞識別

2019-10-23 17:00:22

自然語言處理的詞性標(biāo)注方法

自然語言處理——78 詞性標(biāo)注方法

2020-04-21 11:38:38

NLPIR語義分析是對自然語言處理的完美理解

和邏輯表示。語義分析就是對信息所包含的語義的識別，并建立一種計(jì)算模型，使其能夠像人那樣理解自然語言。語義分析是自然語言理解的根本問題，它在自然語言處理、信息檢索、信息過濾、信息分類、語義挖掘等領(lǐng)域有著廣泛

2018-10-19 11:34:47

Python自然語言處理學(xué)習(xí)筆記：建立基于特征的文法

《Python自然語言處理（第二版）-Steven Bird等》學(xué)習(xí)筆記：第09章建立基于特征的文法

2020-04-26 12:38:11

hanlp漢語自然語言處理入門基礎(chǔ)知識介紹

人類的視覺系統(tǒng)，但只有人類才擁有這么高級的語言。自然語言處理的目標(biāo)是讓計(jì)算機(jī)處理或說“理解”自然語言，以完成有意義的任務(wù)，比如訂機(jī)票購物或QA等。完全理解和表達(dá)語言是極其困難的，完美的語言理解等效于實(shí)現(xiàn)

2019-01-02 14:43:15

python自然語言

最近，python自然語言是越來越火了，那么什么是自然語言。自然語言（Natural Language ）廣納了眾多技術(shù)，對自然或人類語言進(jìn)行自動生成，處理與分析。雖然大部分 NLP 技術(shù)繼承自語言

2018-05-02 13:50:17

【推薦體驗(yàn)】騰訊云自然語言處理

`相信大家對NLP自然語言處理的技術(shù)都不陌生，它是計(jì)算機(jī)科學(xué)領(lǐng)域和AI領(lǐng)域中的一個分支，它與計(jì)算機(jī)和人類之間使用自然語言進(jìn)行交互密切相關(guān)，而NLP的最終目標(biāo)是使計(jì)算機(jī)能夠像人類一樣理解語言。目前

2019-10-09 15:28:44

中文自然語言處理之商品評論情感判別

中文自然語言處理——商品評論情感判別

2020-05-27 12:50:35

什么是自然語言處理

什么是自然語言處理？自然語言處理任務(wù)有哪些？自然語言處理的方法是什么？

2021-09-08 06:51:28

什么是自然語言處理？

會識別出我們正確說的話。我們使用免費(fèi)服務(wù)將在線遇到的外語短語翻譯成英語，有時它們可以為我們提供準(zhǔn)確的翻譯。盡管自然語言處理取得了長足的進(jìn)步，但仍有很大的改進(jìn)空間。[理...

2021-07-23 10:22:52

什么是人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和自然語言處理？

如下。深度學(xué)習(xí)是一種基于人工神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)，通過多層次的處理，逐步從數(shù)據(jù)中提取更高層次的特征自然語言處理是一個相關(guān)的多學(xué)科領(lǐng)域。它的目標(biāo)是使機(jī)器(計(jì)算機(jī))能夠理解、處理和與自然的人類語言交互。語言

2022-03-22 11:19:16

求自然語言處理筆記

自然語言處理筆記9-哈工大關(guān)毅

2020-06-04 16:34:18

目前常用的自然語言處理開源項(xiàng)目/開發(fā)包大匯總

總結(jié)詳細(xì)介紹HanLP：HanLP是由一系列模型與算法組成的Java工具包，目標(biāo)是普及自然語言處理在生產(chǎn)環(huán)境中的應(yīng)用。HanLP具備功能完善、性能高效、架構(gòu)清晰、語料時新、可自定義的特點(diǎn)。開發(fā)語言

2018-11-26 10:31:45

語義理解和研究資源是自然語言處理的兩大難題

都是為了解決低資源問題。自然語言處理在一些特定領(lǐng)域的應(yīng)用時，會受到資源不足的影響。一般現(xiàn)在采用的主要方法是對引入領(lǐng)域知識，通過增加人工標(biāo)注數(shù)據(jù)，使用半監(jiān)督利用標(biāo)注數(shù)據(jù)；或者采用多任務(wù)學(xué)習(xí)法使用其他任務(wù)

2019-09-19 14:10:38

空間信息自然語言查詢接口的研究與應(yīng)用

摘要：提出了空間信息自然語言查詢接口，并討論了基于語義詞典的建立、中文分詞、查詢文法規(guī)則及其應(yīng)用領(lǐng)域等主要問題。關(guān)鍵詞：自然語言；空間信息；空間查詢

2009-01-09 12:00:55

基于自然語言處理的知識檢索算法研究

基于自然語言處理的知識檢索算法研究_賈潤亮

2017-01-07 21:39:44

從語言學(xué)到深度學(xué)習(xí)NLP，一文概述自然語言處理

本文從兩篇論文出發(fā)先簡要介紹了自然語言處理的基本分類和基本概念，再向讀者展示了深度學(xué)習(xí)中的 NLP。這兩篇論文都是很好的綜述性入門論文，希望詳細(xì)了解自然語言處理的讀者可以進(jìn)一步閱讀這兩篇論文。

2017-08-22 14:56:36

6051

基于數(shù)據(jù)的自然語言對話技術(shù)大發(fā)展

前言我們在日常生活中經(jīng)常使用自然語言對話系統(tǒng)，比如蘋果Siri?，F(xiàn)在的對話系統(tǒng)多數(shù)只能做單輪對話，可以幫助用戶完成一些簡單的任務(wù)，如問天氣，查股票（如果做多輪對話，也是在單輪對話的基礎(chǔ)上加一些簡單

2017-10-13 17:50:39

RNN在自然語言處理中的應(yīng)用

。深度學(xué)習(xí)的興起又讓人們重新開始研究循環(huán)神經(jīng)網(wǎng)絡(luò)（Recurrent Neural Network），并在序列問題和自然語言處理等領(lǐng)域取得很大的成功。本文將從循環(huán)神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)出發(fā)，介紹RNN在自然語言處理中的應(yīng)用及其PyTorch 實(shí)現(xiàn)。

2017-11-28 11:41:58

5493

基于Hadoop集群的自然語言處理平臺實(shí)現(xiàn)

隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展，數(shù)據(jù)的智能化處理獲取越來越重要。在自然語言處理領(lǐng)域，大規(guī)模語料庫技術(shù)和其他基于概率統(tǒng)計(jì)的研究方法蓬勃發(fā)展，為自然語言的研究提供了新的思路和工具。各種新模型、新技術(shù)、新應(yīng)用層

2017-11-28 16:28:24

深度視頻自然語言描述方法

期記憶（ LSTM）的自然語言描述模型。通過不同的特征組合訓(xùn)練多個自然語言描述模型，在測試時再進(jìn)行后期融合，即先選擇一個模型獲取當(dāng)前輸入的多個可能的輸出，再使用其他模型計(jì)算當(dāng)前輸出的概率，對這些輸出的概率進(jìn)行加

2017-12-04 14:07:08

自然語言處理常用模型解析

自然語言處理常用模型使用方法一、N元模型二、馬爾可夫模型以及隱馬爾可夫模型及目前常用的自然語言處理開源項(xiàng)目/開發(fā)包有哪些？

2017-12-28 15:42:30

5382

什么是自然語言處理_自然語言處理常用方法舉例說明

自然語言處理是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個重要方向。它研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語言進(jìn)行有效通信的各種理論和方法。自然語言處理是一門融語言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)于一體的科學(xué)。

2017-12-28 16:56:28

18016

自然語言處理怎么最快入門_自然語言處理知識了解

自然語言處理就是實(shí)現(xiàn)人機(jī)間自然語言通信，實(shí)現(xiàn)自然語言理解和自然語言生成是十分困難的，造成困難的根本原因是自然語言文本和對話的各個層次上廣泛存在的各種各樣的歧義性或多義性。用自然語言與計(jì)算機(jī)進(jìn)行通信，這是人們長期以來所追求的。因?yàn)樗扔忻黠@的實(shí)際意義，同時也有重要的理論意義。

2017-12-28 17:10:09

5073

淺談自然語言處理技術(shù)的應(yīng)用領(lǐng)域

以下七種自然語言處理的常見應(yīng)用：1. 文本分類2. 語言建模3. 語音識別4. 說明生成5. 機(jī)器翻譯6.文檔總結(jié)7. 問題回答

2017-12-28 17:37:55

25347

自然語言處理的技術(shù)難點(diǎn)與挑戰(zhàn)_發(fā)展現(xiàn)狀分析

人工智能已經(jīng)是大部分普通人都耳熟能詳?shù)脑~匯，而人們對自然語言處理技術(shù)的了解程度卻大部分還停留在表面階段。本文通過回顧自然語言處理的發(fā)展歷史，解讀2015年整個自然語言處理行業(yè)的重大變化，進(jìn)而提出新的時代下自然語言處理技術(shù)的發(fā)展難點(diǎn)、以及對于自然語言處理所提出的挑戰(zhàn)、自然語言處理未來的發(fā)展方向。

2017-12-29 09:25:21

38573

國內(nèi)有哪些自然語言處理的牛人或團(tuán)隊(duì)以及公司

借助移動互聯(lián)網(wǎng)技術(shù)、機(jī)器學(xué)習(xí)領(lǐng)域深度學(xué)習(xí)技術(shù)的發(fā)展，以及大數(shù)據(jù)語料的積累，自然語言處理技術(shù)發(fā)生了突飛猛進(jìn)的變化。越來越多的科技巨頭開始看到了這塊潛在的“大蛋糕”中蘊(yùn)藏的價值，通過招兵買馬、合作、并購

2017-12-29 09:34:29

22165

自然語言處理的優(yōu)點(diǎn)有哪些_自然語言處理的5大優(yōu)勢

在自然語言處理領(lǐng)域，深度學(xué)習(xí)的承諾是：給新模型帶來更好的性能，這些新模型可能需要更多數(shù)據(jù)，但不再需要那么多的語言學(xué)專業(yè)知識。

2017-12-29 13:52:39

27280

閑談深度學(xué)習(xí)在自然語言處理領(lǐng)域的5大關(guān)鍵優(yōu)勢

在自然語言處理領(lǐng)域，深度學(xué)習(xí)將給予最大的幫助，深度學(xué)習(xí)方法主要依靠一下這五個關(guān)鍵優(yōu)勢，閱讀本文將進(jìn)一步了解自然語言處理的重要深度學(xué)習(xí)方法和應(yīng)用。

2018-01-12 16:00:54

4122

文本數(shù)據(jù)分析：文本挖掘還是自然語言處理？

自然語言處理（NLP）關(guān)注的是人類的自然語言與計(jì)算機(jī)設(shè)備之間的相互關(guān)系。NLP是計(jì)算機(jī)語言學(xué)的重要方面之一，它同樣也屬于計(jì)算機(jī)科學(xué)和人工智能領(lǐng)域。而文本挖掘和NLP的存在領(lǐng)域類似，它關(guān)注的是識別文本數(shù)據(jù)中有趣并且重要的模式。

2018-04-10 14:58:59

17525

翻譯機(jī)器人可“領(lǐng)會”使用意圖河南首個自然語言處理實(shí)驗(yàn)室發(fā)布新成果

還記得歷史上首個獲得公民身份的人工智能機(jī)器人Sophia么？驚人的口才和語言自主學(xué)習(xí)能力讓全世界所折服，儼然成為人工智能領(lǐng)域中的網(wǎng)紅。當(dāng)然，伴隨著Sophia的走紅，自然語言處理這一人工智能領(lǐng)域

2018-07-04 10:11:00

1105

自然語言處理方法和應(yīng)用

2018CCAI大會邀請到國內(nèi)NLP領(lǐng)域頂尖學(xué)者，蘇州大學(xué)特聘教授，計(jì)算機(jī)學(xué)院副院長，人類語言技術(shù)研究所所長、國家杰出青年科學(xué)基金獲得者的張民教授將以《自然語言處理方法和應(yīng)用》為題做專題講座。

2018-06-25 15:44:48

5203

自然語言對話領(lǐng)域的現(xiàn)狀與未來展望

原華為諾亞方舟實(shí)驗(yàn)室主任、現(xiàn)已加入字節(jié)跳動 AI Lab的李航教授近日發(fā)表博客，對自然語言對話領(lǐng)域的現(xiàn)狀和最新進(jìn)展進(jìn)行總結(jié)，并展望了未來的走向。

2018-07-28 10:22:40

3498

人工智能開啟自然語言處理新時代

語言是人類特有的技能，是人類智慧的體現(xiàn)。在人工智能時代，自然語言處理（NLP）技術(shù)為機(jī)器賦予了這樣的語言功能，讓機(jī)器有了自然語言識別能力，為用戶體驗(yàn)開辟了新路徑。

2018-08-09 11:19:22

3892

淺析自然語言處理知識體系結(jié)構(gòu)

自然語言處理知識太龐大了，網(wǎng)上也都是一些零零散散的知識，比如單獨(dú)講某些模型，也沒有來龍去脈，學(xué)習(xí)起來較為困難，于是總結(jié)了一份知識體系結(jié)構(gòu)。

2018-08-18 09:57:43

4636

如何成為一名自然語言處理工程師

自然語言處理和大部分的機(jī)器學(xué)習(xí)或者人工智能領(lǐng)域的技術(shù)一樣，是一個涉及到多個技能、技術(shù)和領(lǐng)域的綜合體。所以自然語言處理工程師會有各種各樣的背景，大部分都是在工作中自學(xué)或者是跟著項(xiàng)目一起學(xué)習(xí)的，這其中

2018-08-27 09:43:01

2846

自然語言處理（NLP）知識結(jié)構(gòu)總結(jié)

自然語言處理知識太龐大了，網(wǎng)上也都是一些零零散散的知識，比如單獨(dú)講某些模型，也沒有來龍去脈，學(xué)習(xí)起來較為困難，于是我自己總結(jié)了一份知識體系結(jié)構(gòu)，不足之處，歡迎指正。內(nèi)容來源主要參考黃志洪老師

2018-08-29 09:58:53

4388

深入機(jī)器學(xué)習(xí)之自然語言處理

由龍騎士于星期二, 2018-09-18 15:13 發(fā)表 自然語言處理（NLP）是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個重要方向。它研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語言進(jìn)行有效通信的各種理論

2018-09-18 22:31:01

578

自然語言處理研究的基本問題及發(fā)展趨勢

自然語言處理（NLP）是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個重要方向。它研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語言進(jìn)行有效通信的各種理論和方法。隨著深度學(xué)習(xí)在圖像識別、語音識別領(lǐng)域的大放異彩，人們對深度學(xué)習(xí)在NLP的價值也寄予厚望。

2018-09-21 14:22:57

8231

自然語言處理發(fā)展中不得不知的8件大事紀(jì)要

自然語言是人類獨(dú)有的智慧結(jié)晶。自然語言處理（Natural Language Processing，NLP）是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個重要方向，旨在研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語言進(jìn)行有效通信的各種理論和方法。

2018-10-21 09:52:20

4340

自然語言處理的ELMO使用

word embedding 是現(xiàn)在自然語言處理中最常用的 word representation 的方法，常用的word embedding 是word2vec的方法，然而word2vec本質(zhì)上是一個靜態(tài)模型，也就是說利用word2vec訓(xùn)練完每個詞之后，詞的表示就固定了，

2019-05-02 14:32:00

3042

采用深度學(xué)習(xí)對自然語言處理進(jìn)行分類

用深度學(xué)習(xí)對自然語言處理（NLP）進(jìn)行分類

2018-11-05 06:51:00

2945

盤點(diǎn)自然語言處理發(fā)展史上的8個轉(zhuǎn)折點(diǎn)

2018-11-02 17:34:39

8198

自然語言處理入門基礎(chǔ)之hanlp詳解

2018-11-29 14:33:45

522

淺談自然語言處理中的注意力機(jī)制

本文深入淺出地介紹了近些年的自然語言中的注意力機(jī)制包括從起源、變體到評價指標(biāo)方面。

2019-01-25 16:51:17

6044

面向自然語言處理的神經(jīng)網(wǎng)絡(luò)遷移學(xué)習(xí)的答辯PPT

現(xiàn)實(shí)中的自然語言處理面臨著多領(lǐng)域、多語種上的多種類型的任務(wù)，為每個任務(wù)都單獨(dú)進(jìn)行數(shù)據(jù)標(biāo)注是不大可行的，而遷移學(xué)習(xí)可以將學(xué)習(xí)的知識遷移到相關(guān)的場景下

2019-03-02 09:16:24

2885

自然語言處理有明顯和知識圖譜結(jié)合的趨勢

對于新型的深度學(xué)習(xí)框架，目前在自然語言處理中的應(yīng)用還有待進(jìn)一步加深和提高。比如對抗學(xué)習(xí)、對偶學(xué)習(xí)等雖然在圖像處理領(lǐng)域得到了比較好的效果，但是在自然語言處理領(lǐng)域的效果就稍微差一些。形。

2019-04-05 17:07:00

5648

多個視角對自然語言處理領(lǐng)域進(jìn)行全面梳理

接著，對自然語言處理面臨的技術(shù)挑戰(zhàn)進(jìn)行了分析，包括自然語言中大量存在的未知語言現(xiàn)象、歧義詞匯和結(jié)構(gòu)、隱喻表達(dá)、以及翻譯問題中不同語言之間概念的不對等性等，語義概念的表示和計(jì)算、說話人意圖的理解和推理、以及語用場景的分析是當(dāng)前面臨的核心挑戰(zhàn)。

2019-05-19 09:33:34

3292

斯坦福AI Lab主任、NLP大師Manning：將深度學(xué)習(xí)應(yīng)用于自然語言處理領(lǐng)域的領(lǐng)軍者

像Alexa和Siri那樣的對話助手對自然語言處理產(chǎn)生了巨大的影響。最開始這些變化跟深度學(xué)習(xí)和自然語言處理關(guān)系不大，因?yàn)榛旧嫌玫亩际侨斯ぞ庉嫷哪_本。所以這些積極的影響是得益于基于規(guī)則的自然語言處理的再度出現(xiàn)，跟機(jī)器學(xué)習(xí)和我從1995年到2010年主要研究的那種概率自然語言處理關(guān)系都不是很大。

2019-07-07 07:47:00

3962

解讀人工智能理解的自然語言的原理和概念

人工智能理解自然語言的原理是什么？要有針對性地回答該問題，需先將它的議題邊界進(jìn)行明確定義。如果將該問題理解為如何利用計(jì)算機(jī)工具處理和分析自然語言，以實(shí)現(xiàn)人與計(jì)算機(jī)通過自然語言進(jìn)行的有效溝通，那么可以得到一個相對狹義的回答。

2019-08-09 14:43:19

5582

如何利用人工智能和大數(shù)據(jù)來處理自然語言

學(xué)術(shù)領(lǐng)域叫自然語言，其實(shí)指的就是人類語言。自然語言處理可以說是從人工智能這個詞尚未出現(xiàn)前，就是一個重要研究對象。

2019-10-31 16:30:00

3322

自然語言處理與人工智能有著怎樣的關(guān)系

要想理解自然語言處理，讓我們先來看什么是“自然語言”。通常認(rèn)為，語言是人類區(qū)別其他動物的本質(zhì)特性。在所有生物中，只有人類才具有語言能力。

2019-11-04 22:22:24

10303

自然語言處理是極有吸引力的研究領(lǐng)域

　最早的自然語言處理研究工作是機(jī)器翻譯;美國知名科學(xué)家沃倫?韋弗先生在1949年首先提出了機(jī)器翻譯設(shè)計(jì)方案。在60年代，許多科學(xué)家對機(jī)器翻譯曾有大規(guī)模的研究工作，投入了大量的人力物力財力。

2020-04-20 14:50:30

5207

自然語言處理如何為全球抗疫

隨著互聯(lián)網(wǎng)的普及和海量信息的涌現(xiàn)，作為人工智能領(lǐng)域中的一個重要方向，自然語言處理（NLP）正在人們的日常生活中扮演著越來越重要的角色，并將在科技創(chuàng)新的過程中發(fā)揮越來越重要的作用。

2020-04-23 09:15:27

1263

用在自然語言處理上的業(yè)務(wù)應(yīng)用有哪一些

自然語言處理（NLP）對于企業(yè)來說已經(jīng)不僅僅是一種新興的技術(shù)，它還是一種每天都在廣泛使用的技術(shù)。

2020-04-23 09:19:05

1785

自然語言處理的前景是怎樣的

機(jī)器翻譯是更好的自然語言處理（NLP）應(yīng)用程序之一，但它并不是最常用的一種。

2020-04-24 15:12:38

5434

自然語言處理的發(fā)展簡史

自然語言處理是一門融語言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)于一體的科學(xué)。因此，這一領(lǐng)域的研究將涉及自然語言，即人們?nèi)粘Ｊ褂玫?b class="flag-6" style="color: red">語言，所以它與語言學(xué)的研究有著密切的聯(lián)系，但又有重要的區(qū)別。

2020-05-11 17:22:02

9227

自然語言處理（NLP）的學(xué)習(xí)方向

自然語言處理（Natural Language Processing，NLP）是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個重要方向。它研究人與計(jì)算機(jī)之間用自然語言進(jìn)行有效通信的理論和方法。融語言學(xué)、計(jì)算機(jī)

2020-07-06 16:30:24

12426

自然語言處理已成為AI領(lǐng)域的研究熱點(diǎn)，推動著語言智能的持續(xù)發(fā)展

Processing，簡稱NLP）已成為AI領(lǐng)域的研究熱點(diǎn)，它推動著語言智能的持續(xù)發(fā)展和突破，并越來越多地應(yīng)用于各個行業(yè)。正如國際知名學(xué)者周海中先生曾經(jīng)所言：“自然語言處理是極有吸引力的研究領(lǐng)域，它具有重大的理論意義和實(shí)用價值?！?/div>

2020-10-08 11:41:00

2924

騰訊自然語言處理面試問題

師兄在騰訊，就讓師兄內(nèi)推了一下騰訊自然語言處理的實(shí)習(xí)。在內(nèi)推前，簡單把李航的統(tǒng)計(jì)學(xué)習(xí)方法，簡歷涉及的知識點(diǎn)都過了一遍，整理了一下，同時leetcode刷了大概100題。準(zhǔn)備過后就把簡歷給師兄

2020-11-03 18:02:48

2793

淺析自然語言處理在人工智能領(lǐng)域中的重要性

自然語言處理（NLP）使聊天機(jī)器人能夠理解我們的會話信息并相應(yīng)地作出響應(yīng)。

2020-11-05 10:27:59

5307

自然語言處理是人工智能領(lǐng)域中的一個重要方向

作為未來科技發(fā)展的前沿領(lǐng)域，人工智能在技術(shù)應(yīng)用方面有很多細(xì)分領(lǐng)域，比如深度學(xué)習(xí)、推薦引擎、計(jì)算機(jī)視覺、智能機(jī)器人、自然語言處理、實(shí)時語音翻譯、視覺內(nèi)容自動識別等。其中的自然語言處理，是人工智能領(lǐng)域

2020-12-17 11:07:21

4083

AI：計(jì)算機(jī)視覺與自然語言處理融合的研究進(jìn)展

導(dǎo)讀通過語言給予智能體指示使其完成通用性的任務(wù)是人工智能領(lǐng)域的愿景之一。近年來有越來越多的學(xué)者試圖通過融合計(jì)算機(jī)視覺與自然語言處理領(lǐng)域的相關(guān)技術(shù)以期實(shí)現(xiàn)此目標(biāo)。近年來，深度學(xué)習(xí)方法已經(jīng)在計(jì)算機(jī)

2020-12-26 09:46:04

3165

視覺信號輔助的自然語言文法學(xué)習(xí)

長久以來，自然語言的文法學(xué)習(xí)（Grammar Learning）只考慮純文本輸入數(shù)據(jù)。我們試圖探究視覺信號（Visual Groundings），比如圖像，對自然語言文法學(xué)習(xí)是否有幫助。為此，我們

2021-01-05 14:14:34

1816

谷歌和微軟自然語言理解榜單中超越人類表現(xiàn)

，簡稱NLU）任務(wù)在人工智能領(lǐng)域歷史悠久，被譽(yù)為“人工智能皇冠上的明珠”。由于自然語言本身存在的歧義性或多義性，實(shí)現(xiàn)高質(zhì)量的自然語言理解有相當(dāng)?shù)碾y度。為了衡量人工智能模型的自然語言理解能力，紐約大學(xué)、華盛頓大學(xué)、Facebook和DeepMind在2019年合作提出一個名為

2021-01-08 16:54:21

1687

自然語言處理是什么？有什么用？

“自然語言處理” （Natural Language Processing，簡稱NLP）是近年來科技界最熱門的詞語之一，也是當(dāng)下人工智能研究最熱門的領(lǐng)域之一。自然語言處理推動著語言智能的持續(xù)發(fā)展

2021-02-08 16:00:00

5698

自然語言處理是人工智能重要的一項(xiàng)底層技術(shù)

自然語言處理是人工智能非常重要的一項(xiàng)底層技術(shù)，它指的是通過終端采集人類的語音或識別文本，并對其進(jìn)行分析，最終使機(jī)器理解人類要表達(dá)的含義的技術(shù)。目前我們經(jīng)常見到的翻譯機(jī)器人、客服機(jī)器人等均將自然語言處理作為了核心技術(shù)。

2021-01-26 10:41:30

4861

自然語言處理的圖像文本建模相關(guān)研究及分析

近年來，圖像文本建模研究已經(jīng)成為自然語言處理領(lǐng)域一個重要的硏究方向。圖像常被用于增強(qiáng)句子的語義理解與表示。然而也有硏究人員對圖像信息用于句子語義理解的必要性提岀質(zhì)疑，原因是文本本身就能夠提供強(qiáng)有力

2021-03-24 11:33:59

基于深度學(xué)習(xí)的自然語言處理對抗樣本模型

深度學(xué)習(xí)模型被證明存在脆弱性并容易遭到對抗樣本的攻擊，但目前對于對抗樣本的研究主要集中在計(jì)算機(jī)視覺領(lǐng)域而忽略了自然語言處理模型的安全問題。針對自然語言處理領(lǐng)域冋樣面臨對抗樣夲的風(fēng)險，在闡明對抗樣本

2021-04-20 14:36:57

淺談圖神經(jīng)網(wǎng)絡(luò)在自然語言處理中的應(yīng)用簡述

近幾年，神經(jīng)網(wǎng)絡(luò)因其強(qiáng)大的表征能力逐漸取代傳統(tǒng)的機(jī)器學(xué)習(xí)成為自然語言處理任務(wù)的基本模型。然而經(jīng)典的神經(jīng)網(wǎng)絡(luò)模型只能處理歐氏空間中的數(shù)據(jù)，自然語言處理領(lǐng)域中，篇章結(jié)構(gòu)，句法甚至句子本身都以圖數(shù)據(jù)的形式存在。

2021-04-26 14:57:07

2952

自然語言處理在社會傳播的應(yīng)用綜述

作為人工智能領(lǐng)域的重要研究方向之一，自然語言處理技術(shù)（ Natural Language processing，NLP）極大地促進(jìn)了社會傳播學(xué)的發(fā)展。文中在梳理囯內(nèi)外№LP發(fā)展脈絡(luò)的基礎(chǔ)上，綜述

2021-05-29 14:47:05

自然語言分析(NLA)是什么

連續(xù)多年入選 “Gartner增強(qiáng)分析代表廠商”的Smartbi正是看到了自然語言查詢的趨勢，自主研發(fā)了增強(qiáng)分析 NLA，希望能夠利用自然語言查詢、知識圖譜、推薦算法、智能問答等智能技術(shù)來了解使用者對數(shù)據(jù)的需求，從而幫助使用者更快地進(jìn)行分析，獲取更多的資料。

2022-05-24 17:35:38

456

一窺AMR圖譜在自然語言處理中的應(yīng)用

TreeBank 作為自然語言語法的結(jié)構(gòu)化表示可謂廣為人知，其實(shí)在語義層面也有一種類似的結(jié)構(gòu)化方法——抽象語義表示（Abstract Meaning Representation，AMR）。

2022-09-05 14:22:52

1300

自然語言處理或?qū)⒂瓉硇碌姆妒阶冞w

更好的回復(fù)。這一點(diǎn)上和OpenAI于今年3月份推出的InstructGPT[2]是一致的，即通過引入人工標(biāo)注和反饋，解決了自然語言生成結(jié)果不易評價的問題，從而就可以像玩兒游戲一樣，利用強(qiáng)化學(xué)習(xí)技術(shù)，通過嘗試生成不同的結(jié)果并對結(jié)果進(jìn)行評分，然后鼓勵評分高的策略、懲罰評分低的策略，最終獲得更好的模型。

2022-12-08 16:59:10

509

復(fù)旦大學(xué)NLP實(shí)驗(yàn)室《自然語言處理導(dǎo)論》網(wǎng)絡(luò)初版發(fā)布

復(fù)旦大學(xué)自然語言處理實(shí)驗(yàn)室張奇教授、桂韜研究員以及黃萱菁教授從2020年起著手教材的規(guī)劃，結(jié)合自己對相關(guān)領(lǐng)域的核心問題的理解，和長期教學(xué)、研究以及工程實(shí)踐經(jīng)驗(yàn)，系統(tǒng)梳理了自然語言處理領(lǐng)域發(fā)展至今的關(guān)鍵知識，歷時近三年，終于在近期完成了初版。

2023-02-28 09:30:12

691

ChatGPT在自然語言處理中的局限性和挑戰(zhàn)

隨著人工智能技術(shù)的不斷發(fā)展，自然語言處理已經(jīng)成為人工智能領(lǐng)域中備受矚目的重要研究方向。ChatGPT作為自然語言處理技術(shù)中的一種，已經(jīng)在自然語言理解和生成方面取得了顯著的成就。然而，盡管如此

2023-04-18 16:25:21

934

自然語言處理的優(yōu)缺點(diǎn)有哪些自然語言處理包括哪些內(nèi)容

自然語言處理（Natural Language Processing）是一種人工智能的技術(shù)及領(lǐng)域，它致力于讓計(jì)算機(jī)理解及處理人類語言。它可以幫助計(jì)算機(jī)對人類語言進(jìn)行處理、理解和生成，使得計(jì)算機(jī)可以像人類一樣與人們進(jìn)行交互，如智能語音助手、自動翻譯器、智能問答系統(tǒng)等。

2023-08-23 17:26:51

2060

自然語言處理的概念和應(yīng)用自然語言處理屬于人工智能嗎

　　自然語言處理(Natural Language Processing)是一種人工智能技術(shù)，它是研究自然語言與計(jì)算機(jī)之間的交互和通信的一門學(xué)科。自然語言處理旨在研究機(jī)器如何理解人類語言，并使機(jī)器能夠利用自然語言與人類進(jìn)行交互、執(zhí)行任務(wù)等。

2023-08-23 17:31:14

689

自然語言處理和人工智能的概念及發(fā)展史自然語言處理和人工智能的區(qū)別

自然語言處理(Natural Language Processing, NLP)的定義是通過電腦軟件程序?qū)崿F(xiàn)人們?nèi)粘?b class="flag-6" style="color: red">語言的機(jī)器自動處理。為了幫助計(jì)算機(jī)理解，掌握自然語言處理的基本原理，需要涉及到自然語言處理的發(fā)展史和人工智能的概念和發(fā)展史，以及自然語言處理和人工智能之間的區(qū)別。

2023-08-23 18:22:37

475

自然語言處理和人工智能的區(qū)別

　　自然語言處理(Natural Language Processing，NLP)是人工智能(AI)中的一個分支，它利用計(jì)算機(jī)技術(shù)對自然語言進(jìn)行處理，使得電腦能夠理解和操作人類語言。自然語言處理技術(shù)包括文本分析、語音識別和機(jī)器翻譯等，這些技術(shù)已經(jīng)廣泛應(yīng)用于在線客服、文本分類、語音助手等領(lǐng)域。

2023-08-28 17:32:09

782