(文章來源:教育新聞網(wǎng))
通信技術的進步對各種行業(yè)都產(chǎn)生了重大影響,但也許沒有比教育更大的影響了?,F(xiàn)在,來自世界各地的任何人都可以現(xiàn)場收聽諾貝爾獎獲得者的演講,也可以通過互聯(lián)網(wǎng)訪問最知名的大學而獲得學分。但是,如果聽眾聽不懂講師的語言,將從在線觀看和收聽中獲得的可能的信息丟失。為了解決這個問題,日本奈良科學技術學院(NAIST)的科學家在日本信息處理學會(IPSJ SIG-)的自然語言處理特別興趣小組第240次會議上提出了一種新的機器學習解決方案。 NL)。
機器翻譯系統(tǒng)使某人以以前從未聽說過的語言向酒店詢問路線變得非常簡單。有時,系統(tǒng)可能會犯出有趣和無辜的錯誤,但總體上實現(xiàn)了連貫的交流,至少對于短時間的交流(通常只有一兩個句子)。如果演示文稿可能持續(xù)一個小時以上,例如學術講座,那么它們的魯棒性就差很多。
主持這項研究的NAIST教授中村聰解釋說:“ NAIST有20%的外國學生,盡管英語課程的數(shù)量在增加,但這些學生的選擇受到他們?nèi)照Z能力的限制。”Nakamura的研究小組從NAIST獲得了46.5個小時的存檔演講視頻及其轉(zhuǎn)錄和英語翻譯,并開發(fā)了基于深度學習的系統(tǒng)來轉(zhuǎn)錄日語演講語音并將其翻譯成英語。在觀看視頻時,用戶會看到與講師的口語相匹配的日語和英語字幕。
有人可能希望理想的輸出是可以通過現(xiàn)場演示進行的同步翻譯。但是,實時翻譯會限制處理時間,從而限制準確性。
他說:“由于我們將帶字幕的視頻保存在檔案中,因此,通過創(chuàng)建處理時間更長的字幕,我們發(fā)現(xiàn)了更好的翻譯?!庇糜谠u估的存檔素材包括機器人技術,語音處理和軟件工程的演講。有趣的是,語音識別中的單詞錯誤率與講師語音中的不愉快程度相關。錯誤率不同的另一個因素是不停頓說話的時間長度。用于訓練的語料仍然不足,應進一步發(fā)展以進一步改進。
他繼續(xù)說:“日本希望增加其國際學生,而NAIST則有很大的機會成為這項工作的領導者。我們的項目不僅將改善機器翻譯,還將為日本帶來光明的頭腦?!?br /> (責任編輯:fqj)
-
通信技術
+關注
關注
20文章
1113瀏覽量
92172 -
翻譯
+關注
關注
0文章
47瀏覽量
10744
發(fā)布評論請先 登錄
相關推薦
評論