深入機器學習之自然語言處理 - 全文

由龍騎士于星期二, 2018-09-18 15:13 發(fā)表

自然語言處理（NLP）是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法。隨著深度學習在圖像識別、語音識別領域的大放異彩，人們對深度學習在NLP的價值也寄予厚望。自然語言處理作為人工智能領域的認知智能，成為目前大家關注的焦點。

基本概念

? 自然語言處理既是一門技術也是一門學科。
? 自然語言指人類使用的語言，如漢語、英語等
? 語言是思維的載體，是人類交流的工具
? 語言的兩種屬性：文字和聲音
? 人類歷史上以文字形式記載和流傳的知識占80%以上。

自然語言處理的定義：
"自然語言處理又稱為自然語言理解，就是利用計算機為工具對人類特有的書面形式和又頭形式的自然語言的信息進行各種類型處理和加工的技術?！?—— 馮志偉《自然語言的計算機處理》

研究的基本問題

1. 語音學

語音學(Phonetics)問題：研究詞及其語音的關聯(lián)

2. 形態(tài)學

形態(tài)學(Morphology)問題:研究詞是如何由有意義的基本單位-詞素(Morphemes)構詞的。

詞素是從詞或者詞干的直接成分的角度來確定的音義結合體。字和詞素不是一一對應的：
一、有的漢字實際上代表不同的詞素。如“副”這個字代表多種詞素：“第二的、次級的”、“相配、相稱”、某種計量單位。
二、同一詞素可以由不同的漢字來表示。如：“來吧”中的“吧”可以由“罷”代替。三、有些漢字在某些場合屬于詞素，某些場合不是。如：“沙”在“泥沙”里面是詞素，在“沙發(fā)”里面不代表意義。詞素與詞的關系是“詞素的功能是構詞詞”。
詞素構詞有兩種情況：
一、一個詞素單獨構詞一個詞。如:人、魚、書、蜈蚣等。
二、兩個或兩個以上的詞素構詞一個詞。如：人+民，機+器等。

3. 語法學

語法學(Syntax)問題：研究句子結構成分之間的相互關系和組成句子的序列。

為什么一句話可以這么說也可以那么說?

4. 語義學

語義學(Sementics)問題：研究如何從一個語句中詞的意義，以及這些詞在該語句中句法結構中的作用來推導出該語句的意義。
下面的話說了什么?
(1)蘋果不吃了
(2)這個人真牛
(3)火燒圓明園/火燒驢肉

5. 語用學

語用學(Pragmatics)問題:研究在不同上下文中的語句的應用，以及上下文對語句理解所產(chǎn)生的影響。從狹義的語言學觀點看，語用學處理的是語言結構中有形式體現(xiàn)的那些語境。相反，語用學最寬泛的定義是研究語義學未能涵蓋的那些意義。
在語用學中最基本的一個概念是語境，它是專門研究語言的理解和使用的學問，它研究在特定場景中的特定話語，研究如何通明朝這個朝代更過語境來理解和使用。
下面話為什么這樣說?
(1)火，火!
(2)A：看看魚怎么樣了?
B：我剛才翻了一下。

研究的主要內容

1. 機器翻譯

? 基于規(guī)則的機器翻譯方法
認為翻譯的過程是需要對源語言的分析和源語言意義的表示，然后再生成等價的標語言的過程。根據(jù)翻譯過程的不同，規(guī)則方法可分為兩種主要方法：基于轉換的方法的翻譯過程包括三個階段：分析得到一種源語言的抽象表示；把源語言的抽象表示轉換為目標語言的抽象表示；由目標語言的抽象表示生成目標語言。基于中間語言的方法在對源語言分析后產(chǎn)生的是中間語言,而目標語言的生成是直接由這種中間語言開始的。

? 基于實例的機器翻譯
本質是“以翻譯實例為基礎,基于相似原理的機器翻譯”,其利用的主要知識源是預處理過的雙語語料和翻譯詞典?；趯嵗姆g過程通常包括三步: 在翻譯實例庫中搜索匹配片段;確定相應的譯文片段;重新組合譯文片段以得到最終翻譯。

? 統(tǒng)計機器翻譯
也是基于雙語語料庫的,但與基于實例的方法在翻譯過程中直接使用翻譯實例不同,統(tǒng)計方法通過事先的訓練過程將雙語語料庫中隱含的翻譯知識抽象成統(tǒng)計模型, 而翻譯過程通常就是基于這些統(tǒng)計模型的解碼過程。

? 神經(jīng)機器翻譯
神經(jīng)機器翻譯與傳統(tǒng)的統(tǒng)計機器翻譯不同,神經(jīng)機器翻譯的目的是建立一個單一的神經(jīng)網(wǎng)絡,可以聯(lián)合調整,以最大限度地提高翻譯性能。最近提出的用于神經(jīng)機器翻譯的模型通常屬于編碼器-解碼器族，且將源語句編碼成固定長度向量，解碼器從該向量生成翻譯。

2. 信息檢索

? 信息檢索(Information retrieval):信息檢索也稱為情報檢索,就是利用計算機從大量文檔中找到符合用戶需要的相關信息。

? 面向多語言的信息檢索稱為跨語言的信息檢索,如google,baidu等。

? 早期的信息檢索系統(tǒng)采用“布爾查詢”的方法來進行全文檢索。這種方法無疑將構造一個合適的查詢的責任推到用戶身上。用戶必須詳細的規(guī)劃自己的查詢，其復雜程度不亞于編程語言。這種檢索方式并不提供任何的文檔相關性測度，對于文檔與查詢的評價就只有“匹配“、“不匹配”兩種而已。這兩點問題決定了布爾查詢不能被廣泛應用。但是，由于布爾檢索能夠給用戶提供更多的可控制性，今天我們仍然可以在搜索引擎的“高級搜索”中找到布爾查詢的身影。

? 對于大規(guī)模的語料庫，任何檢索都可能返回數(shù)量眾多的結果，因此對檢索結果進行排序是必須的。因此，一個好的信息檢索模型必須提供文檔相關性測度。一個好的測度應該使與用戶查詢需求最相關的那些結果，排在最前面，同時允許盡可能多的，與用戶查詢有一定關系的結果被包括進來。目前，最為常用的信息檢索模型有三種：
    -  向量空間模型 (Vector Space Model, VSM)
    -  概率模型 (Probabilistic Model)
    -  推理網(wǎng)絡模型 (Inference Network Model)

3. 自動文摘

? TextRank 算法是一種用于文本的基于圖的排序算法。其基本思想來源于谷歌的 PageRank算法，通過把文本分割成若干組成單元(單詞、句子)并建立圖模型, 利用投票機制對文本中的重要成分進行排序，僅利用單篇文檔本身的信息即可實現(xiàn)關鍵詞提取、文摘。

? 傳統(tǒng)的摘要生成系統(tǒng)大部分都是抽取型的，這類方法從給定的文章中，抽取關鍵的句子或者短語, 并重新拼接成一小段摘要，而不對原本的內容做創(chuàng)造性的修改。深度學習是一個生成方法，它會創(chuàng)造性的生成摘要。最新的方法是神經(jīng)注意力模型(Neural attention model)。

4. 文檔分類

? 文檔分類：其目的就是利用計算機系統(tǒng)對大量的文檔按照一定的分類標準實現(xiàn)自動歸類。
? 文檔分類的方法有基于機器學習的方法(如svm,decision tree)和基于深度學習(如cnn,rnn)的方法。
? 流程：樣本處理 — 特征選擇 — 分類。
? 應用：圖書管理、內容管理、情感分析等。

5. 問答系統(tǒng)

? 問答系統(tǒng)(Question answer system)：通過計算機對人提出的問題的理解，利用自動推理等手段，在有關知識資源中自動求解答案并作出相應的回答。問答技術有時與語音技術、人機交互技術等相結合，構成人機對話系統(tǒng)。
? 問答系統(tǒng)模型通常分為基于檢索的模型和基于生成的模型。
? 基于檢索的模型回答是提前定義的，使用規(guī)則引擎、正則匹配或者深度學習訓練好的分類器從數(shù)據(jù)庫中挑選一個最佳的回復。
? 基于生成的模型多使用深度學習的方法。最流行的方法是seq2seq attention model。

6. 文字識別

? 文字識別(Character Recognition)：通過計算機系統(tǒng)對印刷體或手寫體等文字進行自動識別，將其轉換為計算機可以出來的電子文本。
? 傳統(tǒng)的文字識別方法就是特征工程+分類器的方法。深度學習的方法主要有rcnn,yolo等。
? 流程：預處理—特征提取和降維—分類器—后處理。

7. 語音識別

? 語音識別(Speech Recognition):將輸入計算機的語音信號轉換成書面語表示。
? 應用：文字錄入、人機通訊、語音翻譯等
? 難點：大量存在同音詞、近音詞、集外詞、又音等等。
? 輸入：美中貿(mào)易摩擦升級
? 識別結果：美中貿(mào)易摩擦生機
? 早期的語音識別系統(tǒng)主要采用隱馬爾科夫模型來建模。
? 現(xiàn)在的語音識別系統(tǒng)多采用end2end的方法。

8. 語音生成

? 語音生成(speech generate)：利用計算機將書面語轉換為語音信號。
? 語音生成有兩個主要目標：可理解性(intelligibility)和自然感(naturalness)?？衫斫庑允侵负铣梢纛l的清晰度，特別是聽話人能夠在多大程度上提取出原信息。自然感則描述了無法被可理解性直接獲取的信息，比如聽的整體容易程度、全局的風格一致性、地域或語言層面的微妙差異等等。
? 百度的 Deep Voice、Yoshua Bengio 團隊提出的 Char2Wav以及谷歌的 Tacotron均在語音生成方面表現(xiàn)突出。

面臨的困難

1. 語義歧義
如：他說：“她這個真有意思 (funny)”。她說：“他這個怪有意思的 (funny)”。于是他們以為他們有意思 (wish)，并讓他向她意思意思 (express)。他說：“我根本沒有那個意思 (thought)”！她也說：“你們這么說是什么意思 (intention)”？事后有人說：“真有意思 (funny)”。也有人說:“真沒意思 (nonsense)”。

2. 存在未知的語言現(xiàn)象
? 新的詞匯，如專業(yè)術語、外來語、人名、機構名等
? 新的含義，如打醬油、漲姿勢、藍瘦香菇、吃棗藥丸等
? 新的用法和語句結構。在又語和網(wǎng)絡語中出現(xiàn)的“非規(guī)范”的語句結構。如“這屆人民不行”、“扎心了老鐵”。

發(fā)展趨勢

目前，人們主要通過兩種思路來進行自然語言處理，一種是基于規(guī)則的理性主義，另外一種是基于統(tǒng)計的經(jīng)驗主義。現(xiàn)實的情況是，統(tǒng)計學習方法越來越受到重視，自然語言處理中更多地使用機器自動學習的方法來獲取語言知識。

深度學習在自然語言處理中的應用極大的促進了行業(yè)的發(fā)展。但是，即使使用深度學習，仍然有許多問題只能達到基本的要求，如問答系統(tǒng)、對話系統(tǒng)、對話翻譯等。

結語

如今，如何有效利用海量信息已成為信息技術發(fā)展的一個關鍵性問題。自然語言處理則無可避免地成為該領域長期發(fā)展的一個新的戰(zhàn)略制高點。路漫漫其修遠兮，NLP作為一個高度交叉的新興學科，不論是探究語言本質還是付諸實際應用，必定還會有令人期待的驚喜和異?？焖俚陌l(fā)展。

閱讀全文

上一頁 1 2 3全文

百度提出交互式學習方法：讓機器在對話中學會自然語言

電子發(fā)燒友早八點訊：自然語言處理一直是人工智能發(fā)展道路上面臨的巨大挑戰(zhàn)。此前，大多數(shù)研究都是讓機器學習模型在大量已標記數(shù)據(jù)集上進行訓練的。最近，百度研究院人員提出了一種全新的方法，研究人員讓人工智能系統(tǒng)通過與「教師」的口語對話來學習自然語言和知識。

2017-06-09 06:00:00

2414

深度學習在自然語言處理方面的研究進展

要是關注深度學習在自然語言處理方面的研究進展，我相信你一定聽說過Attention Model（后文有時會簡

2018-07-19 09:20:32

7237

如何開始使用PyTorch進行自然語言處理

隨著人工智能和深度學習程序在未來幾年的蓬勃發(fā)展，自然語言處理（NLP）將日益普及，而且必要性也與日俱增。PyTorch 自然語言處理是實現(xiàn)這些程序的不錯選擇。

2022-07-07 10:01:31

2138

自然語言處理包括哪些內容自然語言處理技術包括哪些

自然語言處理(Natural Language Processing, NLP)一般包括以下內容：語音識別(Speech Recognition)：將人類語言轉換為計算機可以理解的形式。語音合成

2023-08-03 16:22:33

3390

2023年科技圈熱詞“大語言模型”，與自然語言處理有何關系

電子發(fā)燒友網(wǎng)報道（文/李彎彎）大語言模型（LLM）是基于海量文本數(shù)據(jù)訓練的深度學習模型。它不僅能夠生成自然語言文本，還能夠深入理解文本含義，處理各種自然語言任務，如文本摘要、問答、翻譯

2024-01-02 09:28:33

1263

自然語言處理之66參數(shù)學習

自然語言處理——66參數(shù)學習

2020-07-16 09:43:33

自然語言處理之：搭建基于HanLP的開發(fā)環(huán)境

CharType.dat.yes 即可。相對比較簡單。嘗試HanLP主要處于各個開源自然語言處理工具包之間的差異，尋找一個適合學習的開源工具包。 HanLP調用方法HanLP幾乎所有的功能都可以通過工具類

2018-11-09 10:15:23

自然語言處理——總結、習題

自然語言處理——79 總結、習題

2020-06-19 11:22:23

自然語言處理怎么最快入門？

`本文整理自知乎上的一個問答，分享給正在學習自然然語言處理的朋友們！一、自然語言處理是什么？自然語言處理說白了，就是讓機器去幫助我們完成一些語言層面的事情，典型的比如：情感分析、文本摘要、自動

2018-11-28 10:02:37

自然語言處理技術介紹

。3.1. 工程應用自然語言處理技術為我們解決了語義的形式化表達的問題，但要進行生產(chǎn)應用，在工程上要考慮更多的因素3.1.1. 準確性基于統(tǒng)計機器自學習的自然語言處理的各個層次（分詞、詞性標注

2018-09-27 09:57:14

自然語言處理的語言模型

自然語言處理——53 語言模型（數(shù)據(jù)平滑）

2020-04-16 11:11:25

自然語言處理的分詞方法

自然語言處理——75 自動分詞基本算法

2020-03-19 11:46:48

自然語言處理的功能合一文法

自然語言處理——82 功能合一文法(Function Unification Grammar, FUG)

2020-03-25 11:19:20

自然語言處理的未登錄詞識別

自然語言處理——76 未登錄詞識別

2019-10-23 17:00:22

自然語言處理的詞性標注方法

自然語言處理——78 詞性標注方法

2020-04-21 11:38:38

NLPIR語義分析是對自然語言處理的完美理解

、語義挖掘、文本的機器學習等諸多應用領域基礎且關鍵的研究問題，它影響著上層信息服務與信息共享的質量和水平。NLPIR大數(shù)據(jù)語義智能技術將對中文數(shù)據(jù)挖掘技術進行深入研究，必將提供出高質量、多功能的中文數(shù)據(jù)挖掘算法并促進自然語言理解系統(tǒng)的廣泛應用。

2018-10-19 11:34:47

Python自然語言處理學習筆記：建立基于特征的文法

《Python自然語言處理（第二版）-Steven Bird等》學習筆記：第09章建立基于特征的文法

2020-04-26 12:38:11

hanlp漢語自然語言處理入門基礎知識介紹

`自然語言處理定義：自然語言處理是一門計算機科學、人工智能以及語言學的交叉學科。雖然語言只是人工智能的一部分（人工智能還包括計算機視覺等），但它是非常獨特的一部分。這個星球上有許多生物擁有超過

2019-01-02 14:43:15

python自然語言

學和人工智能，但同樣受到諸如機器學習，計算統(tǒng)計學和認知科學這些相對新興的學科影響。python下面只要安裝自然語言工具包nltk，下面版主開始正式進入學習。Natural Language

2018-05-02 13:50:17

【推薦體驗】騰訊云自然語言處理

`相信大家對NLP自然語言處理的技術都不陌生，它是計算機科學領域和AI領域中的一個分支，它與計算機和人類之間使用自然語言進行交互密切相關，而NLP的最終目標是使計算機能夠像人類一樣理解語言。目前

2019-10-09 15:28:44

中文自然語言處理之商品評論情感判別

中文自然語言處理——商品評論情感判別

2020-05-27 12:50:35

什么是自然語言處理

什么是自然語言處理？自然語言處理任務有哪些？自然語言處理的方法是什么？

2021-09-08 06:51:28

什么是自然語言處理？

會識別出我們正確說的話。我們使用免費服務將在線遇到的外語短語翻譯成英語，有時它們可以為我們提供準確的翻譯。盡管自然語言處理取得了長足的進步，但仍有很大的改進空間。[理...

2021-07-23 10:22:52

什么是人工智能、機器學習、深度學習和自然語言處理？

領域，包括機器學習、深度學習、數(shù)據(jù)挖掘、計算機視覺、自然語言處理和其他幾個學科。首先，人工智能涉及使計算機具有自我意識，利用計算機視覺、自然語言理解和模仿其他感官。其次，人工智能涉及模仿人類的認知功能

2022-03-22 11:19:16

關于自然語言處理之54 語言模型(自適應)

自然語言處理——54 語言模型(自適應)

2020-04-09 08:20:30

常用python機器學習庫盤點

用的機器學習庫有哪些呢？1.NLTK自然語言處理里面赫赫有名的就是NLTK全稱叫自然語言工具包(Natural Language Tookit),里面包含了大量的函數(shù)模塊,可以獲取語料庫，字符串的處理

2018-05-10 15:20:21

求自然語言處理筆記

自然語言處理筆記9-哈工大關毅

2020-06-04 16:34:18

目前常用的自然語言處理開源項目/開發(fā)包大匯總

總結詳細介紹HanLP：HanLP是由一系列模型與算法組成的Java工具包，目標是普及自然語言處理在生產(chǎn)環(huán)境中的應用。HanLP具備功能完善、性能高效、架構清晰、語料時新、可自定義的特點。開發(fā)語言

2018-11-26 10:31:45

語義理解和研究資源是自然語言處理的兩大難題

兩方面，語義理解和資源問題。語義理解包括對自然語言知識和常識的學習，如果只是要學習機器的知識，對于人類來說并不難，但是如果讓機器掌握人的思考模式和處理方法模式，其模式構建和具體實施則存在困難，也就是說

2019-09-19 14:10:38

#硬聲創(chuàng)作季機器學習自然語言處理：16-9. CNN - Section Summary

人工智能自然語言處理

Mr_haohao發(fā)布于 2022-09-24 23:00:21

#硬聲創(chuàng)作季機器學習自然語言處理：16-6. CNN Architecture （上）

人工智能自然語言處理

Mr_haohao發(fā)布于 2022-09-24 23:05:38

#硬聲創(chuàng)作季機器學習自然語言處理：16-2. What is Convolution 上

人工智能自然語言處理

Mr_haohao發(fā)布于 2022-09-24 23:11:12

#硬聲創(chuàng)作季機器學習自然語言處理：15-10. Embeddings

人工智能自然語言處理

Mr_haohao發(fā)布于 2022-09-24 23:17:48

#硬聲創(chuàng)作季機器學習自然語言處理：9-2. Logistic Regression Intuition

人工智能自然語言處理

Mr_haohao發(fā)布于 2022-09-25 07:03:21

#硬聲創(chuàng)作季機器學習自然語言處理：6-8. Code pt 3

人工智能自然語言處理

Mr_haohao發(fā)布于 2022-09-25 07:16:27

#硬聲創(chuàng)作季機器學習自然語言處理：4-2. The Markov Property

人工智能自然語言處理

Mr_haohao發(fā)布于 2022-09-25 07:38:28

#硬聲創(chuàng)作季機器學習自然語言處理：2-20. Text Summarization Preview

人工智能自然語言處理

Mr_haohao發(fā)布于 2022-09-25 07:42:00

#硬聲創(chuàng)作季機器學習自然語言處理：2-11. Vector Similarity

人工智能自然語言處理

Mr_haohao發(fā)布于 2022-09-25 07:52:01

#硬聲創(chuàng)作季機器學習自然語言處理：2-3. What is a Vector

人工智能自然語言處理

Mr_haohao發(fā)布于 2022-09-25 08:02:31

基于自然語言處理的知識檢索算法研究

基于自然語言處理的知識檢索算法研究_賈潤亮

2017-01-07 21:39:44

從語言學到深度學習NLP，一文概述自然語言處理

本文從兩篇論文出發(fā)先簡要介紹了自然語言處理的基本分類和基本概念，再向讀者展示了深度學習中的 NLP。這兩篇論文都是很好的綜述性入門論文，希望詳細了解自然語言處理的讀者可以進一步閱讀這兩篇論文。

2017-08-22 14:56:36

6051

深度學習在自然語言處理方面的應用打造智能聊天機器人

學習在自然語言處理方面的應用。責編：周建?。▃houjd@csdn.net）本文為《程序員》原創(chuàng)文章，未經(jīng)允許不得轉載，更多內容請訂閱2016年《程序員》聊天機器人（也可以稱為語音助手、聊天助手、對話機器人等）是目前非常熱的一個

2017-10-10 11:05:25

深度學習與自然語言處理的工作概述及未來發(fā)展

深度學習是機器學習的一個領域，研究復雜的人工神經(jīng)網(wǎng)絡的算法、理論、及應用。自從2006年被Hinton等提出以來［1］，深度學習得到了巨大發(fā)展，已被成功地應用到圖像處理、語音處理、自然語言處理等多個

2017-10-13 10:59:20

RNN在自然語言處理中的應用

。深度學習的興起又讓人們重新開始研究循環(huán)神經(jīng)網(wǎng)絡（Recurrent Neural Network），并在序列問題和自然語言處理等領域取得很大的成功。本文將從循環(huán)神經(jīng)網(wǎng)絡的基本結構出發(fā)，介紹RNN在自然語言處理中的應用及其PyTorch 實現(xiàn)。

2017-11-28 11:41:58

5493

深度視頻自然語言描述方法

針對計算機對視頻進行自動標注和描述準確率不高的問題，提出一種基于多特征融合的深度視頻自然語言描述的方法。該方法提取視頻幀序列的空間特征、運動特征、視頻特征，進行特征的融合，使用融合的特征訓練基于長短

2017-12-04 14:07:08

自然語言處理常用模型解析

自然語言處理常用模型使用方法一、N元模型二、馬爾可夫模型以及隱馬爾可夫模型及目前常用的自然語言處理開源項目/開發(fā)包有哪些？

2017-12-28 15:42:30

5382

什么是自然語言處理_自然語言處理常用方法舉例說明

自然語言處理是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言處理是一門融語言學、計算機科學、數(shù)學于一體的科學。

2017-12-28 16:56:28

18016

自然語言處理怎么最快入門_自然語言處理知識了解

自然語言處理就是實現(xiàn)人機間自然語言通信，實現(xiàn)自然語言理解和自然語言生成是十分困難的，造成困難的根本原因是自然語言文本和對話的各個層次上廣泛存在的各種各樣的歧義性或多義性。用自然語言與計算機進行通信，這是人們長期以來所追求的。因為它既有明顯的實際意義，同時也有重要的理論意義。

2017-12-28 17:10:09

5073

淺談自然語言處理技術的應用領域

以下七種自然語言處理的常見應用：1. 文本分類2. 語言建模3. 語音識別4. 說明生成5. 機器翻譯6.文檔總結7. 問題回答

2017-12-28 17:37:55

25347

自然語言處理的技術難點與挑戰(zhàn)_發(fā)展現(xiàn)狀分析

人工智能已經(jīng)是大部分普通人都耳熟能詳?shù)脑~匯，而人們對自然語言處理技術的了解程度卻大部分還停留在表面階段。本文通過回顧自然語言處理的發(fā)展歷史，解讀2015年整個自然語言處理行業(yè)的重大變化，進而提出新的時代下自然語言處理技術的發(fā)展難點、以及對于自然語言處理所提出的挑戰(zhàn)、自然語言處理未來的發(fā)展方向。

2017-12-29 09:25:21

38573

國內有哪些自然語言處理的牛人或團隊以及公司

借助移動互聯(lián)網(wǎng)技術、機器學習領域深度學習技術的發(fā)展，以及大數(shù)據(jù)語料的積累，自然語言處理技術發(fā)生了突飛猛進的變化。越來越多的科技巨頭開始看到了這塊潛在的“大蛋糕”中蘊藏的價值，通過招兵買馬、合作、并購

2017-12-29 09:34:29

22165

自然語言處理的優(yōu)點有哪些_自然語言處理的5大優(yōu)勢

在自然語言處理領域，深度學習的承諾是：給新模型帶來更好的性能，這些新模型可能需要更多數(shù)據(jù)，但不再需要那么多的語言學專業(yè)知識。

2017-12-29 13:52:39

27280

閑談深度學習在自然語言處理領域的5大關鍵優(yōu)勢

在自然語言處理領域，深度學習將給予最大的幫助，深度學習方法主要依靠一下這五個關鍵優(yōu)勢，閱讀本文將進一步了解自然語言處理的重要深度學習方法和應用。

2018-01-12 16:00:54

4122

翻譯機器人可“領會”使用意圖河南首個自然語言處理實驗室發(fā)布新成果

還記得歷史上首個獲得公民身份的人工智能機器人Sophia么？驚人的口才和語言自主學習能力讓全世界所折服，儼然成為人工智能領域中的網(wǎng)紅。當然，伴隨著Sophia的走紅，自然語言處理這一人工智能領域

2018-07-04 10:11:00

1105

自然語言處理方法和應用

2018CCAI大會邀請到國內NLP領域頂尖學者，蘇州大學特聘教授，計算機學院副院長，人類語言技術研究所所長、國家杰出青年科學基金獲得者的張民教授將以《自然語言處理方法和應用》為題做專題講座。

2018-06-25 15:44:48

5203

人工智能時代下，NLP技術賦予了機器自然語言識別能力

語言是人類特有的技能，是人類智慧的體現(xiàn)。在人工智能時代，自然語言處理（NLP）技術為機器賦予了這樣的語言功能，讓機器有了自然語言識別能力，為用戶體驗開辟了新路徑。

2018-08-07 16:27:00

1421

人工智能開啟自然語言處理新時代

2018-08-09 11:19:22

3892

淺析自然語言處理知識體系結構

自然語言處理知識太龐大了，網(wǎng)上也都是一些零零散散的知識，比如單獨講某些模型，也沒有來龍去脈，學習起來較為困難，于是總結了一份知識體系結構。

2018-08-18 09:57:43

4636

如何成為一名自然語言處理工程師

自然語言處理和大部分的機器學習或者人工智能領域的技術一樣，是一個涉及到多個技能、技術和領域的綜合體。所以自然語言處理工程師會有各種各樣的背景，大部分都是在工作中自學或者是跟著項目一起學習的，這其中

2018-08-27 09:43:01

2846

自然語言處理（NLP）知識結構總結

自然語言處理知識太龐大了，網(wǎng)上也都是一些零零散散的知識，比如單獨講某些模型，也沒有來龍去脈，學習起來較為困難，于是我自己總結了一份知識體系結構，不足之處，歡迎指正。內容來源主要參考黃志洪老師

2018-08-29 09:58:53

4388

自然語言處理研究的基本問題及發(fā)展趨勢

自然語言處理（NLP）是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法。隨著深度學習在圖像識別、語音識別領域的大放異彩，人們對深度學習在NLP的價值也寄予厚望。

2018-09-21 14:22:57

8231

自然語言處理發(fā)展中不得不知的8件大事紀要

自然語言是人類獨有的智慧結晶。自然語言處理（Natural Language Processing，NLP）是計算機科學領域與人工智能領域中的一個重要方向，旨在研究能實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法。

2018-10-21 09:52:20

4340

自然語言處理的ELMO使用

word embedding 是現(xiàn)在自然語言處理中最常用的 word representation 的方法，常用的word embedding 是word2vec的方法，然而word2vec本質上是一個靜態(tài)模型，也就是說利用word2vec訓練完每個詞之后，詞的表示就固定了，

2019-05-02 14:32:00

3042

采用深度學習對自然語言處理進行分類

用深度學習對自然語言處理（NLP）進行分類

2018-11-05 06:51:00

2944

盤點自然語言處理發(fā)展史上的8個轉折點

2018-11-02 17:34:39

8197

自然語言處理入門基礎之hanlp詳解

自然語言處理定義：自然語言處理是一門計算機科學、人工智能以及語言學的交叉學科。雖然語言只是人工智能的一部分（人工智能還包括計算機視覺等），但它是非常獨特的一部分。這個星球上有許多生物擁有超過

2018-11-29 14:33:45

522

淺談自然語言處理中的注意力機制

本文深入淺出地介紹了近些年的自然語言中的注意力機制包括從起源、變體到評價指標方面。

2019-01-25 16:51:17

6042

面向自然語言處理的神經(jīng)網(wǎng)絡遷移學習的答辯PPT

現(xiàn)實中的自然語言處理面臨著多領域、多語種上的多種類型的任務，為每個任務都單獨進行數(shù)據(jù)標注是不大可行的，而遷移學習可以將學習的知識遷移到相關的場景下

2019-03-02 09:16:24

2885

如何學習自然語言處理NLP詳細學習方法說明

這篇文章是一名自然語言處理（nlp）的初學者，在nlp里摸爬滾打了許久的一些心得，推薦了nlp的學習路線和資料合集，本站極力推薦。

2019-03-03 11:05:05

5400

自然語言處理有明顯和知識圖譜結合的趨勢

對于新型的深度學習框架，目前在自然語言處理中的應用還有待進一步加深和提高。比如對抗學習、對偶學習等雖然在圖像處理領域得到了比較好的效果，但是在自然語言處理領域的效果就稍微差一些。形。

2019-04-05 17:07:00

5647

多個視角對自然語言處理領域進行全面梳理

接著，對自然語言處理面臨的技術挑戰(zhàn)進行了分析，包括自然語言中大量存在的未知語言現(xiàn)象、歧義詞匯和結構、隱喻表達、以及翻譯問題中不同語言之間概念的不對等性等，語義概念的表示和計算、說話人意圖的理解和推理、以及語用場景的分析是當前面臨的核心挑戰(zhàn)。

2019-05-19 09:33:34

3292

斯坦福AI Lab主任、NLP大師Manning：將深度學習應用于自然語言處理領域的領軍者

像Alexa和Siri那樣的對話助手對自然語言處理產(chǎn)生了巨大的影響。最開始這些變化跟深度學習和自然語言處理關系不大，因為基本上用的都是人工編輯的腳本。所以這些積極的影響是得益于基于規(guī)則的自然語言處理的再度出現(xiàn)，跟機器學習和我從1995年到2010年主要研究的那種概率自然語言處理關系都不是很大。

2019-07-07 07:47:00

3962

解讀人工智能理解的自然語言的原理和概念

人工智能理解自然語言的原理是什么？要有針對性地回答該問題，需先將它的議題邊界進行明確定義。如果將該問題理解為如何利用計算機工具處理和分析自然語言，以實現(xiàn)人與計算機通過自然語言進行的有效溝通，那么可以得到一個相對狹義的回答。

2019-08-09 14:43:19

5582

如何利用人工智能和大數(shù)據(jù)來處理自然語言

學術領域叫自然語言，其實指的就是人類語言。自然語言處理可以說是從人工智能這個詞尚未出現(xiàn)前，就是一個重要研究對象。

2019-10-31 16:30:00

3322

自然語言處理與人工智能有著怎樣的關系

要想理解自然語言處理，讓我們先來看什么是“自然語言”。通常認為，語言是人類區(qū)別其他動物的本質特性。在所有生物中，只有人類才具有語言能力。

2019-11-04 22:22:24

10303

自然語言處理是極有吸引力的研究領域

　最早的自然語言處理研究工作是機器翻譯;美國知名科學家沃倫?韋弗先生在1949年首先提出了機器翻譯設計方案。在60年代，許多科學家對機器翻譯曾有大規(guī)模的研究工作，投入了大量的人力物力財力。

2020-04-20 14:50:30

5206

自然語言處理如何為全球抗疫

隨著互聯(lián)網(wǎng)的普及和海量信息的涌現(xiàn)，作為人工智能領域中的一個重要方向，自然語言處理（NLP）正在人們的日常生活中扮演著越來越重要的角色，并將在科技創(chuàng)新的過程中發(fā)揮越來越重要的作用。

2020-04-23 09:15:27

1263

用在自然語言處理上的業(yè)務應用有哪一些

自然語言處理（NLP）對于企業(yè)來說已經(jīng)不僅僅是一種新興的技術，它還是一種每天都在廣泛使用的技術。

2020-04-23 09:19:05

1785

自然語言處理的前景是怎樣的

機器翻譯是更好的自然語言處理（NLP）應用程序之一，但它并不是最常用的一種。

2020-04-24 15:12:38

5434

自然語言處理的發(fā)展簡史

自然語言處理是一門融語言學、計算機科學、數(shù)學于一體的科學。因此，這一領域的研究將涉及自然語言，即人們日常使用的語言，所以它與語言學的研究有著密切的聯(lián)系，但又有重要的區(qū)別。

2020-05-11 17:22:02

9227

自然語言處理（NLP）的學習方向

自然語言處理（Natural Language Processing，NLP）是計算機科學領域與人工智能領域中的一個重要方向。它研究人與計算機之間用自然語言進行有效通信的理論和方法。融語言學、計算機

2020-07-06 16:30:24

12423

淺析自然語言處理在人工智能領域中的重要性

自然語言處理（NLP）使聊天機器人能夠理解我們的會話信息并相應地作出響應。

2020-11-05 10:27:59

5306

自然語言處理已成為聊天機器人的核心工具

自然語言處理（NLP）使聊天機器人能夠理解我們的會話信息并相應地作出響應。

2020-11-05 14:24:44

2195

自然語言處理是人工智能領域中的一個重要方向

作為未來科技發(fā)展的前沿領域，人工智能在技術應用方面有很多細分領域，比如深度學習、推薦引擎、計算機視覺、智能機器人、自然語言處理、實時語音翻譯、視覺內容自動識別等。其中的自然語言處理，是人工智能領域

2020-12-17 11:07:21

4082

AI：計算機視覺與自然語言處理融合的研究進展

導讀通過語言給予智能體指示使其完成通用性的任務是人工智能領域的愿景之一。近年來有越來越多的學者試圖通過融合計算機視覺與自然語言處理領域的相關技術以期實現(xiàn)此目標。近年來，深度學習方法已經(jīng)在計算機

2020-12-26 09:46:04

3161

視覺信號輔助的自然語言文法學習

長久以來，自然語言的文法學習（Grammar Learning）只考慮純文本輸入數(shù)據(jù)。我們試圖探究視覺信號（Visual Groundings），比如圖像，對自然語言文法學習是否有幫助。為此，我們

2021-01-05 14:14:34

1816

自然語言處理是什么？有什么用？

“自然語言處理” （Natural Language Processing，簡稱NLP）是近年來科技界最熱門的詞語之一，也是當下人工智能研究最熱門的領域之一。自然語言處理推動著語言智能的持續(xù)發(fā)展

2021-02-08 16:00:00

5697

自然語言處理是人工智能重要的一項底層技術

自然語言處理是人工智能非常重要的一項底層技術，它指的是通過終端采集人類的語音或識別文本，并對其進行分析，最終使機器理解人類要表達的含義的技術。目前我們經(jīng)常見到的翻譯機器人、客服機器人等均將自然語言處理作為了核心技術。

2021-01-26 10:41:30

4860

基于深度學習的自然語言處理對抗樣本模型

深度學習模型被證明存在脆弱性并容易遭到對抗樣本的攻擊，但目前對于對抗樣本的研究主要集中在計算機視覺領域而忽略了自然語言處理模型的安全問題。針對自然語言處理領域冋樣面臨對抗樣夲的風險，在闡明對抗樣本

2021-04-20 14:36:57

淺談圖神經(jīng)網(wǎng)絡在自然語言處理中的應用簡述

近幾年，神經(jīng)網(wǎng)絡因其強大的表征能力逐漸取代傳統(tǒng)的機器學習成為自然語言處理任務的基本模型。然而經(jīng)典的神經(jīng)網(wǎng)絡模型只能處理歐氏空間中的數(shù)據(jù)，自然語言處理領域中，篇章結構，句法甚至句子本身都以圖數(shù)據(jù)的形式存在。

2021-04-26 14:57:07

2952

自然語言分析(NLA)是什么

連續(xù)多年入選 “Gartner增強分析代表廠商”的Smartbi正是看到了自然語言查詢的趨勢，自主研發(fā)了增強分析 NLA，希望能夠利用自然語言查詢、知識圖譜、推薦算法、智能問答等智能技術來了解使用者對數(shù)據(jù)的需求，從而幫助使用者更快地進行分析，獲取更多的資料。

2022-05-24 17:35:38

456

一窺AMR圖譜在自然語言處理中的應用

TreeBank 作為自然語言語法的結構化表示可謂廣為人知，其實在語義層面也有一種類似的結構化方法——抽象語義表示（Abstract Meaning Representation，AMR）。

2022-09-05 14:22:52

1299

自然語言處理或將迎來新的范式變遷

更好的回復。這一點上和OpenAI于今年3月份推出的InstructGPT[2]是一致的，即通過引入人工標注和反饋，解決了自然語言生成結果不易評價的問題，從而就可以像玩兒游戲一樣，利用強化學習技術，通過嘗試生成不同的結果并對結果進行評分，然后鼓勵評分高的策略、懲罰評分低的策略，最終獲得更好的模型。

2022-12-08 16:59:10

509

ChatGPT在自然語言處理中的局限性和挑戰(zhàn)

隨著人工智能技術的不斷發(fā)展，自然語言處理已經(jīng)成為人工智能領域中備受矚目的重要研究方向。ChatGPT作為自然語言處理技術中的一種，已經(jīng)在自然語言理解和生成方面取得了顯著的成就。然而，盡管如此

2023-04-18 16:25:21

933

自然語言處理的優(yōu)缺點有哪些自然語言處理包括哪些內容

自然語言處理（Natural Language Processing）是一種人工智能的技術及領域，它致力于讓計算機理解及處理人類語言。它可以幫助計算機對人類語言進行處理、理解和生成，使得計算機可以像人類一樣與人們進行交互，如智能語音助手、自動翻譯器、智能問答系統(tǒng)等。

2023-08-23 17:26:51

2060

自然語言處理的概念和應用自然語言處理屬于人工智能嗎

　　自然語言處理(Natural Language Processing)是一種人工智能技術，它是研究自然語言與計算機之間的交互和通信的一門學科。自然語言處理旨在研究機器如何理解人類語言，并使機器能夠利用自然語言與人類進行交互、執(zhí)行任務等。

2023-08-23 17:31:14

689

自然語言處理和人工智能的概念及發(fā)展史自然語言處理和人工智能的區(qū)別

自然語言處理(Natural Language Processing, NLP)的定義是通過電腦軟件程序實現(xiàn)人們日常語言的機器自動處理。為了幫助計算機理解，掌握自然語言處理的基本原理，需要涉及到自然語言處理的發(fā)展史和人工智能的概念和發(fā)展史，以及自然語言處理和人工智能之間的區(qū)別。

2023-08-23 18:22:37

475

自然語言處理和人工智能的區(qū)別

　　自然語言處理(Natural Language Processing，NLP)是人工智能(AI)中的一個分支，它利用計算機技術對自然語言進行處理，使得電腦能夠理解和操作人類語言。自然語言處理技術包括文本分析、語音識別和機器翻譯等，這些技術已經(jīng)廣泛應用于在線客服、文本分類、語音助手等領域。

2023-08-28 17:32:09

781

自然語言處理的研究內容

自然語言處理（NLP）的最新發(fā)展改變了我們與AI系統(tǒng)的交互方式： 1. 預訓練模型：像 GPT-3 這樣的模型已經(jīng)進步，使人工智能能夠在聊天機器人和虛擬助手中生成更連貫的上下文感知響應。 2.

2024-01-18 16:39:21

129

已全部加載完成

搜索歷史

深入機器學習之自然語言處理 - 全文

評論