電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)如今大火的ChatGPT,得益于AIGC 背后的關(guān)鍵技術(shù)NLP(Natural LanguageProcessing,自然語言處理)得到突破。
NLP技術(shù)是一種自然語言處理技術(shù),用于計(jì)算機(jī)中模擬人類的對話和文本理解。主要源于AI大模型化的NLP技術(shù)突破是將深度學(xué)習(xí)技術(shù)與傳統(tǒng)的NLP方法結(jié)合在一起,從而更好地提高NLP技術(shù)的準(zhǔn)確性和效率。大模型化的NLP技術(shù)能夠更好地支持企業(yè)進(jìn)行大規(guī)模的語料內(nèi)容分析,并為企業(yè)更好地進(jìn)行文本分析提供幫助。
語言是人類區(qū)別其他動(dòng)物的本質(zhì)特性。在所有生物中,只有人類才具有語言能力。人類的多種智能都與語言有著密切的關(guān)系。人類的邏輯思維以語言為形式,人類的絕大部分知識(shí)也是以語言文字的形式記載和流傳下來的。因而,它也是人工智能的一個(gè)重要,甚至核心部分。
用自然語言與計(jì)算機(jī)進(jìn)行通信,這是人們長期以來所追求的。因?yàn)樗扔忻黠@的實(shí)際意義,同時(shí)也有重要的理論意義:人們可以用自己最習(xí)慣的語言來使用計(jì)算機(jī),而無需再花大量的時(shí)間和精力去學(xué)習(xí)不很自然和習(xí)慣的各種計(jì)算機(jī)語言;人們也可通過它進(jìn)一步了解人類的語言能力和智能的機(jī)制。
自然語言處理是指利用人類交流所使用的自然語言與機(jī)器進(jìn)行交互通訊的技術(shù)。通過人為的對自然語言的處理,使得計(jì)算機(jī)對其能夠可讀并理解。自然語言處理的相關(guān)研究始于人類對機(jī)器翻譯的探索。雖然自然語言處理涉及語音、語法、語義、語用等多維度的操作,但簡單而言,自然語言處理的基本任務(wù)是基于本體詞典、詞頻統(tǒng)計(jì)、上下文語義分析等方式對待處理語料進(jìn)行分詞,形成以最小詞性為單位,且富含語義的詞項(xiàng)單元。
自然語言理解的發(fā)展經(jīng)歷了幾個(gè)階段。在20世紀(jì)60年代,隨著計(jì)算機(jī)技術(shù)的發(fā)展,自然語言處理技術(shù)也進(jìn)一步提升。當(dāng)時(shí),美國國家科學(xué)基金會(huì)(NSF)成立了“自然語言處理研究計(jì)劃”,專門用于支持自然語言處理技術(shù)的研究。同時(shí),英國也成立了“自然語言處理研究室(Natural Language Processing Research Laboratory)”,專門致力于自然語言處理技術(shù)的研究與應(yīng)用。
在20世紀(jì)70年代,自然語言處理技術(shù)又迎來了一個(gè)新的發(fā)展階段。這一時(shí)期,自然語言處理技術(shù)發(fā)展到了語言學(xué)理論與計(jì)算機(jī)科學(xué)相結(jié)合的階段。其中,語義學(xué)和句法學(xué)等語言學(xué)理論成為自然語言處理技術(shù)研究的重要基礎(chǔ)。
在20世紀(jì)80年代,隨著人工智能技術(shù)的進(jìn)一步發(fā)展,自然語言處理技術(shù)也進(jìn)入了一個(gè)新的階段。這一時(shí)期,自然語言處理技術(shù)得到了廣泛應(yīng)用,并取得了一系列突破性成果。例如,英國語言工程研究所(LEL)在1983年成功開發(fā)出了世界上第一個(gè)基于人工智能的翻譯系統(tǒng),該系統(tǒng)能夠?qū)⒂⒄Z翻譯成法語。
在20世紀(jì)90年代,自然語言處理技術(shù)進(jìn)一步發(fā)展壯大。隨著互聯(lián)網(wǎng)的普及,自然語言處理技術(shù)在搜索引擎、社交媒體、客服機(jī)器人等領(lǐng)域得到廣泛應(yīng)用。此外,自然語言處理技術(shù)還進(jìn)入了深度學(xué)習(xí)階段,開始使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行語言模型的建立和訓(xùn)練,從而提升自然語言處理技術(shù)的準(zhǔn)確性和效率。如今,自然語言處理技術(shù)已經(jīng)成為人工智能領(lǐng)域的重要組成部分,并在多個(gè)領(lǐng)域得到廣泛應(yīng)用。
比如,醫(yī)療健康面臨的困難之一是難以獲得。打醫(yī)生辦公室電話并一直等待的情況十分常見,與索賠代表聯(lián)系可能同樣困難。通過實(shí)施 NLP來訓(xùn)練聊天機(jī)器人是醫(yī)療健康行業(yè)的一項(xiàng)新興技術(shù),可以解決醫(yī)療專業(yè)人員的短缺問題,并開創(chuàng)與患者的溝通渠道。
NLP的另一個(gè)重要的醫(yī)療健康應(yīng)用程序是生物醫(yī)學(xué)文本挖掘。鑒于生物文獻(xiàn)數(shù)量眾多,以及生物醫(yī)學(xué)出版速度不斷提高,自然語言處理是一個(gè)關(guān)鍵的工具,可以在已發(fā)表的研究中提取信息,推動(dòng)生物醫(yī)學(xué)領(lǐng)域的知識(shí)進(jìn)步。這非常有助于藥物研發(fā)和疾病診斷。
NLP是為金融服務(wù)公司構(gòu)建更好的聊天機(jī)器人和AI助理的關(guān)鍵組成部分。在眾多用于基于 NLP的應(yīng)用程序的語言模型中,BERT已成為機(jī)器學(xué)習(xí)領(lǐng)域 NLP 的領(lǐng)軍者及語言模型。例如,銀行可以使用NLP來評估信用記錄很少或沒有信用記錄的客戶信譽(yù)。
自然語言處理應(yīng)用在過去十年呈爆炸式增長,預(yù)計(jì)自然語言處理未來仍有望以幾何級數(shù)增長。據(jù)相關(guān)調(diào)查顯示,在全球市場中,與自然語言處理相關(guān)的產(chǎn)品和服務(wù)將在2025年增長到430億美元,而2017年時(shí),這一數(shù)字為30億美元。
-
AI
+關(guān)注
關(guān)注
87文章
28877瀏覽量
266239 -
nlp
+關(guān)注
關(guān)注
1文章
481瀏覽量
21935 -
ChatGPT
+關(guān)注
關(guān)注
28文章
1517瀏覽量
6940
發(fā)布評論請先 登錄
相關(guān)推薦
評論