0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用自然語言處理NPL可以使人工智能工具與人類進行交流

mK5P_AItists ? 2018-01-02 10:26 ? 次閱讀

現(xiàn)如今,在更多情況下,我們是以比特和字節(jié)為生,而不是依靠交換情感。我們使用一種稱之為計算機的超級智能機器在互聯(lián)網(wǎng)上進行交易和溝通。因此,我們覺得有必要讓機器明白我們在說話時是如何對其進行理解的,并且試圖用人工智能,一種稱之為NLP——自然語言處理技術(shù)為它們提供語言。作為一種研究結(jié)果,聊天機器人正在成為一種可靠的聊天工具,使用這種非人為依賴的智能工具與人類進行交流。

我強烈的感受到:

直到我們的機器學會了解行為和情緒,數(shù)據(jù)科學家和工程師的工作才完成了一半。與深度學習(ML學科領(lǐng)域)融合的NLP將對這種計算機語言的使用起到關(guān)鍵作用。
利用自然語言處理NPL可以使人工智能工具與人類進行交流

什么是NLP

這是一種人工智能方法,給定機器一些人類語言從而使得它們能夠與人類進行溝通交流。它涉及使用NLP技術(shù)對書面語言進行智能分析,以獲取對一組文本數(shù)據(jù)的見解,如:

1.情緒分析

2.信息提取和檢索

3.智能搜索等

它是人工智能和計算語言學的交匯點,能夠處理機器和人類自然語言之間的交互,即計算機需要對其進行分析、理解、改變或生成自然語言。NLP幫助計算機機器以各種形式使用自然人類語言進行交流,包括但不限于語音、印刷、寫作和簽名。

NLP機器學習和深度學習:它們是如何連接的

利用自然語言處理NPL可以使人工智能工具與人類進行交流

NLP與機器學習和深度學習密切相關(guān),所有這些都是人工智能領(lǐng)域的分支,如下圖所示:它是一個致力于使機器智能化的計算機科學領(lǐng)域。深度學習是一種流行的機器學習技術(shù)之一,如回歸,K-means等。

機器學習的類型很多,像無監(jiān)督機器學習這樣的經(jīng)常用于NLP技術(shù)中,如LDA(潛在狄利克雷分布,一種主題模型算法)。

為了能夠執(zhí)行任何一個NLP,我們需要深入理解人類使如何處理語言的情感和分析方面。還有各種各樣像社交媒體這樣的語言數(shù)據(jù)源,人們直接或間接地分享他們感受到的內(nèi)容,而這必須通過使用NLP的機器進行智能分析。NLP機器需要建立一個人類推理系統(tǒng),借助ML技術(shù),它們可以自動執(zhí)行NLP過程并對其進行擴展。

簡而言之,“深度學習與自然語言處理”是相互聯(lián)系、相互依存的,以構(gòu)建一個能夠像人類一樣思考、說話和行動的智能計算機。

Meltwater Group的NLP專家John Rehling在《自然語言處理是如何幫助揭示社交媒體情緒》一文中說,

“通過分析語言的含義,NLP系統(tǒng)扮演著非常重要的角色,如糾正語法,將語音轉(zhuǎn)換為文本,以及在多語言之間自動翻譯。”

NLP如何工作

理解NLP的工作原理是非常重要的,因為這樣的話,我們就可以將NLP作為一個整體來理解。NLP一般有兩個主要組成部分:

1.NLU:自然語言理解

2.NLG:自然語言生成

讓我們深入理解NLU

自然語言理解:它涉及的是一種方法論,試圖了解如何對饋送給計算機的自然語言賦予一定的相關(guān)意義。

在開始時,計算機獲得自然語言的輸入(自然語言可以是任何語言,它們通過使用和重復在人類中自然進化,而不是有意識的計劃或預謀,自然語言可以采用不同的形式,例如語音或簽名)。

計算機之后將它們轉(zhuǎn)換成人工語言,如語音識別和/或語音轉(zhuǎn)換文本。在這里我們把數(shù)據(jù)轉(zhuǎn)換成一個文本形式, NLU過程來理解其中的含義。

HMM:隱馬爾可夫模型(NLU示例)

利用自然語言處理NPL可以使人工智能工具與人類進行交流

它是一種統(tǒng)計語音識別模型,它可以在預先構(gòu)建的數(shù)學技術(shù)的幫助下,將你的語音轉(zhuǎn)換成文本,并試圖推斷出你所說的語言。

它試圖理解你所說的,通過將語音數(shù)據(jù)分解成一小段特定的時間段,大多數(shù)情況下時間是20-20 ms。這些數(shù)據(jù)集將進一步與預饋語音進行比較,從而進一步解讀你在每個語音單位中所說的內(nèi)容。這里的目的是找到音素(一個最小的語音單位)。然后,機器對一系列這樣的音素進行觀察,并統(tǒng)計了最可能說出的單詞和句子。

不僅如此,NLU會深刻理解每個單詞,試圖理解它是一個名詞還是動詞,什么是時態(tài)(過去或未來)等。這個過程被定義為POS:詞性標注部分(Part Of Speech Tagging)。NLP具有內(nèi)置的詞典和一套與語法預編碼相關(guān)的協(xié)議,這些協(xié)議被預編碼到它們的系統(tǒng)中,并在處理自然語言數(shù)據(jù)集時使用它,從而在NLP系統(tǒng)處理人類語音時,編譯所說的內(nèi)容。

NLP系統(tǒng)也有一個詞典(詞匯表)和一套編碼到系統(tǒng)中的語法規(guī)則。現(xiàn)代NLP算法使用統(tǒng)計機器,學習將這些規(guī)則應用于自然語言,并推斷所說話語背后最可能的含義。在考慮諸如具有多個含義的詞語(多義詞)或具有相似含義的詞語(同義詞)時,存在一些挑戰(zhàn),但軟件開發(fā)者在他們的NLU系統(tǒng)中建立了自己的規(guī)則,可以通過適當?shù)挠柧毢蛯W習來處理這類問題。

自然語言生成:

與第一階段(NLU做了大量的努力以理解人類的話語)相比,NLG可以很容易的進行翻譯工作,即將計算機的人工語言翻譯為有意義的文本,并可以通過文字轉(zhuǎn)語音(tex-to-speech)技術(shù)將其轉(zhuǎn)化為可聽語音。文本轉(zhuǎn)語音((tex-to-speech))技術(shù)通過韻律模型(prosody model)來分析文本,從而確定語言的斷句、長短和音調(diào)。然后,利用語音數(shù)據(jù)庫,將記錄的所有音素匯集在一起,形成一個連貫的語音串。

簡而言之,NLP采用NLU和NLG來處理人類自然語言,尤其是處理語音識別領(lǐng)域的人類自然語言,并試圖將傳遞字符串或可聽語言作為輸出,來理解、編譯并推斷所說的內(nèi)容。

NLP在現(xiàn)代語境中的應用:

在這個處于數(shù)字革命的電腦時代中,大部分任務(wù)需要由人類利用鏈接物聯(lián)網(wǎng)的機器來完成。NLP在為媒體、出版、廣告、醫(yī)療、銀行和保險等行業(yè)領(lǐng)域建立強大的軟件工具方面,發(fā)揮了重要作用,從而幫助他們高效快捷地運作。

NLP的一些現(xiàn)代用法:

1.聊天機器人

這是一個被稱為機器人的成熟軟件,它可以處理任何場景的人物對話。api.ai、微軟語音理解智能服務(wù)(LUIS)等一些熱門的NLP和機器學習平臺,可用于研發(fā)你的商業(yè)聊天機器人。

2.垃圾郵件過濾

你們中的大多數(shù)人一定對垃圾郵件并不陌生。Google使用基于NLP的技術(shù)來保障你的收件箱清潔、無垃圾郵件。貝葉斯垃圾郵件過濾(Bayesian spam filtering)是一種備受矚目的技術(shù),它是一種統(tǒng)計技術(shù),基于此,電子郵件中詞語的審核通過率根據(jù)其在垃圾和非垃圾郵件語料庫中的典型事例來確定。

3.機器翻譯

NLP被越來越多的應用于機器翻譯程序當中,這使得一種語言被自動翻譯成另一種語言,谷歌是一個將你的文本翻譯為所需語言的先驅(qū)者。

機器翻譯技術(shù)所面臨的挑戰(zhàn)不在于翻譯單詞,而在于保留句子的含義,這是一個復雜的技術(shù)問題,也是NLP的核心。

4.命名實體提?。∟amed entity extraction)

它用于從給定的項目集合中分離出具有相似性質(zhì)和屬性的項目。例如名字、姓氏、年齡、地理位置、地址、電話號碼、電子郵件地址和公司名稱等等。命名實體提?。ㄒ喾Q命名實體識別)使挖掘數(shù)據(jù)變得更加容易。

5.自動匯總

自然語言處理可用于從大段文本中提取可讀摘要。例如,我們可以自動總結(jié)出一份長篇學術(shù)文章的簡短摘要。

接下來我們將深入介紹一些NLP的技術(shù)細節(jié)。

當自然界與人工相逢的時候,機器就像是一個真正具有生命力的人類一樣進入了生活中。

NLP技術(shù)術(shù)語

NLP術(shù)語

?語音體系——關(guān)于系統(tǒng)性地組織語音的研究。

?形態(tài)學——這是一個從基本意義單位中進行單詞構(gòu)建的研究。

?語素——語言中意義的基本單位。

?語法——它是指單詞經(jīng)過組合排列構(gòu)成句子,它還涉及在句子和短語中確定單詞結(jié)構(gòu)的作用。

?語義——它涉及的是單詞的含義,以及該如何將單詞組合成有意義的短語和句子。

?語用學——它涉及的是在不同情況下使用和理解句子以及對句子的解釋是如何受到影響的。

?話語——它指的是前面的句子如何影響對于下一句的解釋的。

?常識性知識——它涉及的是對于世界的一般性認識。

自然語言處理庫(對于開發(fā)者而言)

NLP庫:

有許多通用的第三方開源庫,開發(fā)人員可以使用它們來構(gòu)建基于NLP的Projects Viz .。

?自然語言工具包(NLTK)

?Apache OpenNLP

?斯坦福大學NLP套件

?Gate NLP庫

自然語言工具包(NLTK)是最通用的自然語言處理(NLP)庫。它是用Python編寫的,背后有一個很大的社區(qū)。

NLP實施所涉及的步驟:

它涵蓋了5個主要步驟:

?詞法分析——它對給定單詞的結(jié)構(gòu)進行識別和分析,其中整個文本數(shù)據(jù)塊在詞法分析中被分解成段落、句子和詞匯。

?解析(句法分析)——它涉及以一種顯示單詞之間的關(guān)系的方式對分析句子中的單詞進行語法和單詞排列分析,在這個階段,任何不符合語法正確的句子都被拒絕,例如,“building lives in sita”將不會被語法分析器所接受

?語義分析——對給定的文本進行分析以從中提取意義。它通過對任務(wù)域中的語法結(jié)構(gòu)和目標進行分析來完成。語義分析器拒絕不相關(guān)的句子,如“hot banana”。

?話語整合——正如我們所知,每個句子都與前一句話相互聯(lián)系,基于倒數(shù)第二句的意義而言,任何句子都變得有意義。同樣,它也使得后一句話變得有意義。

?語用分析——在此期間,常識性知識被重新定義了,解釋了它們的真實意義到底是什么,它涉及到那些需要常識性知識的語言方面。

用圖片來解讀NLP(點擊圖片放大):

NLP應用程序:

1.光學字符識別

2.語音識別

3.機器翻譯

4.自然語言生成

5.情緒分析

6.語義搜索

7.自然語言編程

8.情感計算

9.開發(fā)聊天機器人

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46652

    瀏覽量

    237085
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5463

    瀏覽量

    120890
  • 自然語言處理
    +關(guān)注

    關(guān)注

    1

    文章

    596

    瀏覽量

    13483
  • npl
    npl
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    2352

原文標題:「自然語言處理」如何快速理解?有這篇文章就夠了!

文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    python自然語言

    學和人工智能,但同樣受到諸如機器學習,計算統(tǒng)計學和認知科學這些相對新興的學科影響。python下面只要安裝自然語言工具包nltk,下面版主開始正式進入學習。Natural Language
    發(fā)表于 05-02 13:50

    hanlp漢語自然語言處理入門基礎(chǔ)知識介紹

    `自然語言處理定義:自然語言處理是一門計算機科學、人工智能以及語言學的交叉學科。雖然
    發(fā)表于 01-02 14:43

    語義理解和研究資源是自然語言處理的兩大難題

    、情感分析、文檔去重、全文檢索和編碼轉(zhuǎn)換十三項獨立功能,針對自然語言的研究,也為軟件工程師提供了二次開發(fā)接口。 自然語言處理是計算機科學和人工智能領(lǐng)域的重要演講方向。主要涉及人機相互的
    發(fā)表于 09-19 14:10

    【推薦體驗】騰訊云自然語言處理

    自然語言處理技術(shù)的功勞。可以說,只要有大量文本數(shù)據(jù)的應用場景,幾乎都涉及到NLP技術(shù),也都可以使用相關(guān)自然語言
    發(fā)表于 10-09 15:28

    什么是人工智能、機器學習、深度學習和自然語言處理

    領(lǐng)域,包括機器學習、深度學習、數(shù)據(jù)挖掘、計算機視覺、自然語言處理和其他幾個學科。首先,人工智能涉及使計算機具有自我意識,利用計算機視覺、自然語言
    發(fā)表于 03-22 11:19

    什么是自然語言處理_自然語言處理常用方法舉例說明

    自然語言處理是計算機科學領(lǐng)域與人工智能領(lǐng)域中的一個重要方向。它研究能實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法。
    發(fā)表于 12-28 16:56 ?1.8w次閱讀
    什么是<b class='flag-5'>自然語言</b><b class='flag-5'>處理</b>_<b class='flag-5'>自然語言</b><b class='flag-5'>處理</b>常用方法舉例說明

    解讀人工智能理解的自然語言的原理和概念

    人工智能理解自然語言的原理是什么?要有針對性地回答該問題,需先將它的議題邊界進行明確定義。如果將該問題理解為如何利用計算機工具處理和分析
    的頭像 發(fā)表于 08-09 14:43 ?6088次閱讀

    如何利用人工智能和大數(shù)據(jù)來處理自然語言

    學術(shù)領(lǐng)域叫自然語言,其實指的就是人類語言。自然語言處理可以說是從
    發(fā)表于 10-31 16:30 ?3513次閱讀

    自然語言處理人工智能重要的一項底層技術(shù)

    自然語言處理人工智能非常重要的一項底層技術(shù),它指的是通過終端采集人類的語音或識別文本,并對其進行分析,最終使機器理解
    的頭像 發(fā)表于 01-26 10:41 ?5377次閱讀

    自然語言處理的優(yōu)缺點有哪些 自然語言處理包括哪些內(nèi)容

    自然語言處理(Natural Language Processing)是一種人工智能的技術(shù)及領(lǐng)域,它致力于讓計算機理解及處理人類
    發(fā)表于 08-23 17:26 ?4090次閱讀

    自然語言處理的概念和應用 自然語言處理屬于人工智能

      自然語言處理(Natural Language Processing)是一種人工智能技術(shù),它是研究自然語言與計算機之間的交互和通信的一門學科。
    發(fā)表于 08-23 17:31 ?1256次閱讀

    自然語言處理人工智能的概念及發(fā)展史 自然語言處理人工智能的區(qū)別

    自然語言處理(Natural Language Processing, NLP)的定義是通過電腦軟件程序?qū)崿F(xiàn)人們?nèi)粘?b class='flag-5'>語言的機器自動處理。為了幫助計算機理解,掌握
    發(fā)表于 08-23 18:22 ?801次閱讀

    自然語言處理人工智能的區(qū)別

      自然語言處理(Natural Language Processing,NLP)是人工智能(AI)中的一個分支,它利用計算機技術(shù)對自然語言
    發(fā)表于 08-28 17:32 ?1448次閱讀

    自然語言處理屬于人工智能的哪個領(lǐng)域

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能(Artificial Intelligence,簡稱AI)領(lǐng)域的一個重要分支。它涉及到計算機與人類
    的頭像 發(fā)表于 07-03 14:09 ?1031次閱讀

    自然語言處理包括哪些內(nèi)容

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能領(lǐng)域的一個重要分支,它涉及到計算機與人類語言之間
    的頭像 發(fā)表于 07-03 14:15 ?678次閱讀