0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

換個角度來聊機器翻譯

電子工程師 ? 來源:lq ? 2019-04-24 13:55 ? 次閱讀

公元652年,玄奘在慈恩寺西院建造了大雁塔,用于收藏他從天竺帶回來的657部佛經(jīng)經(jīng)卷,之后的12年里玄奘一直在此翻譯佛經(jīng)。

當(dāng)巴別塔出現(xiàn)的時候,人類開始有了不同的語言,而大雁塔出現(xiàn)的時候,人類已經(jīng)在不同的語言中開始翻譯。

這周的課程,我們來講一個同學(xué)們都比較熟悉的知識點——機器翻譯。

之前咱們AI大學(xué)劉俊華導(dǎo)師從“三大核心翻譯技術(shù)”的角度,給大家普及了基于規(guī)則的翻譯方法(RMT)、基于統(tǒng)計的翻譯方法(SMT)、基于神經(jīng)網(wǎng)絡(luò)的翻譯方法(NMT)的三種翻譯技術(shù)的相應(yīng)原理。

今天我們換個角度來聊機器翻譯,從歷史角度來看看這個比人工智能概念誕生還早的自然語言處理任務(wù)。

機器翻譯發(fā)展歷史圖譜

一、從傳說開始的故事

《圣經(jīng)》中記載了這樣一個故事:

人類曾經(jīng)聯(lián)合起來興建能通往天堂的高塔——巴別塔,為了阻止人類的計劃,上帝讓人類說不同的語言,使人類相互之間不能溝通,計劃因此失敗,人類自此各散東西。

實現(xiàn)不同語種之間的無障礙溝通,一直都是人類終極夢想之一。

在認(rèn)識到不眠不休窮盡人類一生的力量,也只能掌握幾十種語言時,很多科學(xué)家開始思考,是不是可以用機器來幫助人們?nèi)ソ鉀Q溝通問題?

這一問題在1933年首次得到了答案,蘇聯(lián)科學(xué)家Peter Troyanskii向蘇聯(lián)科學(xué)院介紹了能將一種語言翻譯成另一種語言的機器。

這個法明很簡單,在當(dāng)時并未受到蘇聯(lián)政府的重視,他們覺得這臺擁有各種語言卡片的機器沒有實際作用。

Troyanskii用20多年的時間將這臺翻譯機器發(fā)明出來,后死于心絞痛。

我們今天能如此清晰的復(fù)述這段故事,是因為在1956年蘇聯(lián)2位科學(xué)家發(fā)現(xiàn)了Troyanskii所創(chuàng)造的翻譯機器,并將它公之于世。

如果不是這樣,或許我們到現(xiàn)在都不會知道,早在1933年就有人想過將語言卡片、打字機、老式膠片組合在一起,發(fā)明一臺翻譯機器。

Troyanskii發(fā)明的翻譯機器簡化圖

二、萌芽于冷戰(zhàn)中的軍備競賽

正像計算機是被戰(zhàn)爭催生出一樣,機器翻譯技術(shù)的萌芽也與軍事有關(guān)。

1947年杜魯門主義出臺,美蘇冷戰(zhàn)正式開始,對于俄文情報資料的翻譯,需求量很大。

1954年,美國喬治敦大學(xué)在IBM公司協(xié)同下用IBM-701計算機首次完成了英俄機器翻譯試驗,拉開了機器翻譯研究的序幕。

當(dāng)時的系統(tǒng),僅能容納250個單詞,遵循6條語法規(guī)則,翻譯49個句子。

但這一切已足以點燃科學(xué)家們的激情,機器翻譯成功引起了蘇聯(lián)、日本和歐洲國家的研究興趣。一時間,各國政府紛紛撥款,全球機器翻譯熱潮興起。

然而,技術(shù)的發(fā)展都是曲折艱難的,和這種狂熱的關(guān)注相比機器翻譯的研究進(jìn)展著實緩慢,美國科學(xué)院成立了語言自動處理咨詢委員會(ALPAC)于1966年公布了一份名為《語言與機器》的報告,該研究否認(rèn)機器翻譯可行性,機器翻譯研究進(jìn)入蕭條期。

雖然這一階段的機器翻譯發(fā)展并不順利,但還是為現(xiàn)代自然語言處理技術(shù)打下了堅實的基礎(chǔ)。

三、20世紀(jì)末的又一次興起

20世紀(jì)70年代IBM沃森實驗室的賈里尼克,他提出了基于統(tǒng)計的語音識別框架,這個框架對語音和語言處理都有著深遠(yuǎn)影響,它從根本上使得語音識別有實用的可能。從此,自然語言處理開始走上統(tǒng)計方法之路。

1993年,IBM的Brown等提出基于詞對齊的統(tǒng)計翻譯模型,基于語料庫的方法開始盛行,標(biāo)志著第二代機器翻譯技術(shù)——「基于統(tǒng)計的機器翻譯」開始興起,其核心在于設(shè)計概率模型對翻譯過程建模。

統(tǒng)計機器翻譯避開了語言規(guī)則,使用大量的雙語文本,建立兩種語言的平行語料庫,雖然避開了繁雜的語法規(guī)則,但需要大規(guī)模的語料庫,這在當(dāng)時非常難以實現(xiàn)。

2014年谷歌和蒙特利爾大學(xué)提出的第三代機器翻譯技術(shù),也就是基于端到端的神經(jīng)機器翻譯,標(biāo)志著第三代機器翻譯技術(shù)的到來。

2016年月28日,谷歌發(fā)布新的神經(jīng)機器翻譯系統(tǒng)GNMT,同時支持PC端和移動端,這項服務(wù)背后的核心算法是基于短語的機器翻譯。

同時期國內(nèi)科技企業(yè)在機器翻譯上的進(jìn)展也非常迅速,以語音和語義理解見長的科大訊飛在2014年國際口語翻譯大賽IWSLT上獲得中英和英中兩個翻譯方向的全球第一名,在2015年又在由美國國家標(biāo)準(zhǔn)技術(shù)研究院組織的機器翻譯大賽中取得全球第一的成績。

自此,神經(jīng)機器翻譯開始大規(guī)模走向應(yīng)用。

四、重建巴別塔之路

從1993年到2019年,機器翻譯技術(shù)發(fā)展了80多年,巴別塔的傳說已經(jīng)成了過去,我們今天重溫機器翻譯的發(fā)展歷史,并不是為了再去修建一座真的「通天塔」,而是想讓同學(xué)們更加深刻地了解機器翻譯這門學(xué)科。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46060

    瀏覽量

    234951
  • 機器翻譯
    +關(guān)注

    關(guān)注

    0

    文章

    139

    瀏覽量

    14835
  • 自然語言處理
    +關(guān)注

    關(guān)注

    1

    文章

    585

    瀏覽量

    13418

原文標(biāo)題:A.I.公開課預(yù)告 | 機器翻譯的光榮與夢想

文章出處:【微信號:iFLYTEK1999,微信公眾號:科大訊飛】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    谷景科普工字電感換個比原來大的行嗎

    就想更換個比原來的工字電感,希望通過這種方式改善電路的性能。那么,可以直接更換比原來大的嗎?更換更大尺寸的工字電感的確是具有一些優(yōu)勢的,比如大尺寸的工字電感通常
    發(fā)表于 09-16 23:11 ?0次下載

    方向角度傳感器壞了有什么影響

    方向角度傳感器是一種用于測量物體方向和角度變化的傳感器,廣泛應(yīng)用于航空、航天、航海、機器人、汽車、無人機等領(lǐng)域。當(dāng)方向角度傳感器出現(xiàn)故障時,會對相關(guān)設(shè)備的正常運行產(chǎn)生嚴(yán)重影響。 一、方
    的頭像 發(fā)表于 07-22 16:06 ?235次閱讀

    DeepL推出新一代翻譯編輯大型語言模型

    在人工智能與語言處理領(lǐng)域,DeepL再次以其創(chuàng)新實力引領(lǐng)潮流,宣布成功推出新一代面向翻譯與編輯應(yīng)用的大型語言模型。這一里程碑式的進(jìn)展,不僅鞏固了DeepL作為頂尖語言人工智能公司的地位,更標(biāo)志著機器翻譯技術(shù)向更高質(zhì)量、更智能化方向邁出了堅實的一步。
    的頭像 發(fā)表于 07-19 15:56 ?474次閱讀

    nlp自然語言處理的應(yīng)用有哪些

    的應(yīng)用。以下是一些NLP的主要應(yīng)用領(lǐng)域,以及它們在各個領(lǐng)域的具體應(yīng)用。 機器翻譯 機器翻譯是NLP的一個重要應(yīng)用領(lǐng)域。它利用計算機自動將一種語言的文本翻譯成另一種語言。這在全球化的今天尤為重要,因為它可以幫助人們跨越語言障礙,進(jìn)
    的頭像 發(fā)表于 07-05 09:55 ?1958次閱讀

    機器學(xué)習(xí)怎么進(jìn)入人工智能

    ,人工智能已成為一個熱門領(lǐng)域,涉及到多個行業(yè)和領(lǐng)域,例如語音識別、機器翻譯、圖像識別等。 在編程中進(jìn)行人工智能的關(guān)鍵是使用機器學(xué)習(xí)算法,這是一類基于樣本數(shù)據(jù)和模型訓(xùn)練進(jìn)行預(yù)測和判斷的算法。下面將介紹使用
    的頭像 發(fā)表于 04-04 08:41 ?145次閱讀

    從老板角度解讀工廠物料流轉(zhuǎn)機器

    從老板角度解讀工廠物料流轉(zhuǎn)機器人傳統(tǒng)的AGV主要是重載/大規(guī)格且針對大型/超大型具有規(guī)范化管理能力(已使用ERP系統(tǒng))的工廠用于物料高效流轉(zhuǎn)轉(zhuǎn)。其優(yōu)勢就是多臺AGV同時使用,具有調(diào)度控制功能且物料
    的頭像 發(fā)表于 03-30 08:13 ?374次閱讀
    從老板<b class='flag-5'>角度</b><b class='flag-5'>來</b>解讀工廠物料流轉(zhuǎn)<b class='flag-5'>機器</b>人

    Transformer壓縮部署的前沿技術(shù):RPTQ與PB-LLM

    隨著人工智能技術(shù)的迅速發(fā)展,Transformer在自然語言處理、機器翻譯、問答系統(tǒng)等領(lǐng)域取得了顯著的性能提升。
    的頭像 發(fā)表于 01-24 14:05 ?988次閱讀
    Transformer壓縮部署的前沿技術(shù):RPTQ與PB-LLM

    工字電感換個比原來大的行嗎

    電子發(fā)燒友網(wǎng)站提供《工字電感換個比原來大的行嗎.docx》資料免費下載
    發(fā)表于 01-23 10:07 ?0次下載

    電機電角度和機械角度的關(guān)系

    ,以及它們在電機控制和應(yīng)用中的重要性。 首先,讓我們來了解一下電機電角度和機械角度的定義。 電角度: 電機電角度是指電機旋轉(zhuǎn)一周的角度,通常
    的頭像 發(fā)表于 12-27 18:03 ?3287次閱讀

    基于機器翻譯增加的跨語言機器閱讀理解算法

    近日,阿里云人工智能平臺 PAI 與華南理工大學(xué)朱金輝教授團隊、達(dá)摩院自然語言處理團隊合作在自然語言處理頂級會議 EMNLP2023 上發(fā)表基于機器翻譯增加的跨語言機器閱讀理解算法 X-STA。通過
    的頭像 發(fā)表于 12-12 10:28 ?486次閱讀
    基于<b class='flag-5'>機器翻譯</b>增加的跨語言<b class='flag-5'>機器</b>閱讀理解算法

    消息隊列技術(shù)選型的7種消息場景

    我們在做消息隊列的技術(shù)選型時,往往會結(jié)合業(yè)務(wù)場景進(jìn)行考慮。今天消息隊列可能會用到的 7 種消息場景。
    的頭像 發(fā)表于 12-09 17:50 ?1149次閱讀
    <b class='flag-5'>聊</b>一<b class='flag-5'>聊</b>消息隊列技術(shù)選型的7種消息場景

    芯片設(shè)計的NDR是什么?

    今天突然想route相關(guān)的問題,講一講NDR是什么,我也梳理總結(jié)一下我對NDR的認(rèn)識。
    的頭像 發(fā)表于 12-06 15:14 ?1358次閱讀

    簡單DPT技術(shù)-double pattern technology

    今天想來簡單DPT技術(shù)-double pattern technology,也就是雙層掩模版技術(shù),在目前先進(jìn)工藝下,這項技術(shù)已經(jīng)應(yīng)用的很普遍了。
    的頭像 發(fā)表于 12-05 14:26 ?1024次閱讀

    焊接機器人焊槍角度怎么調(diào)

    焊接機器人在現(xiàn)代制造業(yè)中扮演著重要的角色,它們能夠高效地完成焊接任務(wù),提高生產(chǎn)效率,減少勞動力成本,同時確保焊接質(zhì)量的一致性。其中,焊槍角度的調(diào)整對焊接質(zhì)量至關(guān)重要。創(chuàng)想焊縫跟蹤將探討如何正確地調(diào)整
    的頭像 發(fā)表于 11-07 14:38 ?688次閱讀
    焊接<b class='flag-5'>機器</b>人焊槍<b class='flag-5'>角度</b>怎么調(diào)

    仿真人類的微軟AI翻譯系統(tǒng)

    從歷史上看,曾經(jīng)主流的機器學(xué)習(xí)技術(shù)在行業(yè)中應(yīng)用是統(tǒng)計機器翻譯 (SMT)。SMT 使用先進(jìn)的統(tǒng)計分析,從一句話中上下文的幾個詞中估計最佳可能的翻譯。SMT自20 世紀(jì)中期以來的為所有
    的頭像 發(fā)表于 10-11 15:27 ?823次閱讀