0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook的AI研究團(tuán)隊(duì)開發(fā)了一種神經(jīng)轉(zhuǎn)編譯器

倩倩 ? 來(lái)源:文財(cái)網(wǎng) ? 2020-07-22 15:23 ? 次閱讀

僅一周多的時(shí)間,您中的大多數(shù)人就會(huì)聽說(shuō)Facebook的AI研究團(tuán)隊(duì)(FAIR)開發(fā)了一種神經(jīng)轉(zhuǎn)編譯器,該代碼使用“無(wú)監(jiān)督翻譯 ” 將高級(jí)編程語(yǔ)言(如C ++,PythonJava,Cobol)的代碼轉(zhuǎn)換為另一種語(yǔ)言。傳統(tǒng)的方法是標(biāo)記源語(yǔ)言并將其轉(zhuǎn)換為抽象語(yǔ)法樹(AST),反編譯器將根據(jù)定義翻譯的手寫規(guī)則(例如抽象或上下文)將其用于轉(zhuǎn)換為所選的目標(biāo)語(yǔ)言。沒(méi)有丟失。

在過(guò)去的幾十年中,神經(jīng)語(yǔ)言翻譯取得了如此重大的進(jìn)步,以至于盡管只有足夠的并行語(yǔ)料庫(kù)才是唯一的限制,但是這些神經(jīng)模型往往要比硬編碼的手寫規(guī)則好得多。

這已通過(guò)“無(wú)監(jiān)督的ML翻譯”方法得到了更大程度的解決,其中Facebook的研究團(tuán)隊(duì)使用了來(lái)自Github的不同編程語(yǔ)言的大量單語(yǔ)源代碼庫(kù)來(lái)訓(xùn)練模型。

這使許多組織感到寬慰,尤其是在保險(xiǎn),政府和銀行部門,他們繼續(xù)使用舊版應(yīng)用程序,而這些應(yīng)用程序幾乎沒(méi)有增強(qiáng)或微調(diào)的空間,因?yàn)樗鼈兪怯烧嬲炀毜?a href="http://ttokpm.com/v/tag/1730/" target="_blank">程序員在過(guò)去的美好時(shí)光中編寫的— COBOL ,Pascal,F(xiàn)ortran等。

盡管編程語(yǔ)言已經(jīng)隨著時(shí)間的流逝而發(fā)展,但是從一種代碼庫(kù)移植到更高效或更現(xiàn)代的語(yǔ)言(如Java,Swift,Ruby,python)卻是真正的痛苦,因?yàn)樗枰凑Z(yǔ)言和目標(biāo)語(yǔ)言方面的專業(yè)知識(shí)。例如,有報(bào)道稱,澳大利亞聯(lián)邦銀行花費(fèi)了高達(dá)7.5億美元,并在五年內(nèi)將其核心軟件從大型機(jī)上的COBOL遷移到了現(xiàn)代平臺(tái)上。

基于規(guī)則的翻譯實(shí)現(xiàn)起來(lái)很復(fù)雜,靈活性和解釋性較差。Facebook的Transcoder可以解決長(zhǎng)期存在的問(wèn)題。

FAIR代碼轉(zhuǎn)換器的主要組件

FAIR轉(zhuǎn)碼器基于一種變壓器架構(gòu),包括一個(gè)編碼器和一個(gè)解碼器,基于“注意就是您所需要的”論文。FAIR轉(zhuǎn)碼器依賴于單個(gè)模型進(jìn)行編碼和解碼,并且基于3個(gè)原理:

屏蔽語(yǔ)言模型預(yù)訓(xùn)練

去噪自動(dòng)編碼

回譯

1. 屏蔽語(yǔ)言模型預(yù)訓(xùn)練

掩蔽語(yǔ)言預(yù)訓(xùn)練模型基于BERT論文,該模型訓(xùn)練編碼器從源代碼中識(shí)別出掩蔽標(biāo)記。訓(xùn)練編碼器以理解編程構(gòu)造,以便在屏蔽某些令牌時(shí)識(shí)別丟失的令牌并對(duì)其進(jìn)行重構(gòu)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編程語(yǔ)言
    +關(guān)注

    關(guān)注

    10

    文章

    1916

    瀏覽量

    34390
  • 源代碼
    +關(guān)注

    關(guān)注

    96

    文章

    2942

    瀏覽量

    66448
  • ML
    ML
    +關(guān)注

    關(guān)注

    0

    文章

    143

    瀏覽量

    34447
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    SemiDrive X9 AI 開發(fā)環(huán)境搭建

    SemiDrivex9AI開發(fā)環(huán)境搭建分開發(fā)機(jī)端,開發(fā)板端。主要的工具是SDNN,它是個(gè)基于開源編譯器
    的頭像 發(fā)表于 08-03 08:27 ?203次閱讀
    SemiDrive X9 <b class='flag-5'>AI</b> <b class='flag-5'>開發(fā)</b>環(huán)境搭建

    AI編譯器技術(shù)剖析

    隨著人工智能技術(shù)的飛速發(fā)展,AI編譯器作為一種新興的編譯技術(shù)逐漸進(jìn)入人們的視野。AI編譯器不僅具
    的頭像 發(fā)表于 07-17 18:28 ?1213次閱讀

    人工智能編譯器與傳統(tǒng)編譯器的區(qū)別

    人工智能編譯器AI編譯器)與傳統(tǒng)編譯器在多個(gè)方面存在顯著的差異。這些差異主要體現(xiàn)在設(shè)計(jì)目標(biāo)、功能特性、優(yōu)化策略、適用范圍以及技術(shù)復(fù)雜性等方面。以下是對(duì)兩者區(qū)別的詳細(xì)探討,旨在全面解析
    的頭像 發(fā)表于 07-17 18:19 ?1285次閱讀

    日本九州大學(xué)開發(fā)了名為QDyeFinder的人工智能(AI)工具

    在探索大腦這宇宙中最復(fù)雜結(jié)構(gòu)的征途中,科學(xué)家們不斷突破技術(shù)的邊界,以更精細(xì)、更高效的方式揭示其奧秘。近期,日本九州大學(xué)的研究團(tuán)隊(duì)在《自然·通訊》雜志上發(fā)表了項(xiàng)革命性的
    的頭像 發(fā)表于 07-03 14:43 ?337次閱讀

    Meta發(fā)布基于Code Llama的LLM編譯器

    近日,科技巨頭Meta在其X平臺(tái)上正式宣布推出了款革命性的LLM編譯器,這模型家族基于Meta Code Llama構(gòu)建,并融合了先進(jìn)的代碼優(yōu)化和編譯器功能。LLM
    的頭像 發(fā)表于 06-29 17:54 ?1314次閱讀

    C語(yǔ)言:嵌入式開發(fā)中的關(guān)鍵編譯器角色

    嵌入式程序開發(fā)跟硬件密切相關(guān),需要使用C語(yǔ)言來(lái)讀寫底層寄存、存取數(shù)據(jù)、控制硬件等,C語(yǔ)言和硬件之間由編譯器來(lái)聯(lián)系,些C標(biāo)準(zhǔn)不支持的硬件特性操作,由
    發(fā)表于 04-26 14:53 ?419次閱讀
    C語(yǔ)言:嵌入式<b class='flag-5'>開發(fā)</b>中的關(guān)鍵<b class='flag-5'>編譯器</b>角色

    怎么在NanoEdge AI Studio設(shè)定交叉編譯器呢?

    我使用的是NanoEdge AI Studio v4.3.1,跟著官方交教程生成了庫(kù)libneai.a,我通過(guò)metadata.json文件得知生成這個(gè)庫(kù)的交叉編譯器版本是\"
    發(fā)表于 03-07 06:28

    QT開發(fā)學(xué)習(xí)筆記1(安裝交叉編譯器

    QT安裝交叉編譯器
    的頭像 發(fā)表于 02-18 10:02 ?696次閱讀
    QT<b class='flag-5'>開發(fā)</b>學(xué)習(xí)筆記1(安裝交叉<b class='flag-5'>編譯器</b>)

    韓國(guó)研究團(tuán)隊(duì)開發(fā)了一種在石墨烯層上生長(zhǎng)柔性GaN LED陣列的方法

    外媒消息,韓國(guó)首爾國(guó)立大學(xué)與成均館大學(xué)的研究團(tuán)隊(duì)聯(lián)合開發(fā)了一種在石墨烯層上生長(zhǎng)柔性GaN LED陣列的方法,通過(guò)該技術(shù)研究
    的頭像 發(fā)表于 12-18 10:07 ?792次閱讀

    Triton編譯器的原理和性能

    Triton是一種用于編寫高效自定義深度學(xué)習(xí)原語(yǔ)的語(yǔ)言和編譯器。Triton的目的是提供個(gè)開源環(huán)境,以比CUDA更高的生產(chǎn)力編寫快速代碼,但也比其他現(xiàn)有DSL具有更大的靈活性。Triton已被采用
    的頭像 發(fā)表于 12-16 11:22 ?2240次閱讀
    Triton<b class='flag-5'>編譯器</b>的原理和性能

    韓國(guó)開發(fā)了一種在石墨烯層上生長(zhǎng)柔性GaN LED陣列的方法

    12月11日,外媒消息,韓國(guó)首爾國(guó)立大學(xué)與成均館大學(xué)的研究團(tuán)隊(duì)聯(lián)合開發(fā)了一種在石墨烯層上生長(zhǎng)柔性GaN LED陣列的方法,通過(guò)該技術(shù)研究
    的頭像 發(fā)表于 12-13 16:06 ?651次閱讀
    韓國(guó)<b class='flag-5'>開發(fā)了</b><b class='flag-5'>一種</b>在石墨烯層上生長(zhǎng)柔性GaN LED陣列的方法

    編譯器的優(yōu)化選項(xiàng)

    個(gè)程序首先要保證正確性,在保證正確性的基礎(chǔ)上,性能也是個(gè)重要的考量。要編寫高性能的程序,第,必須選擇合適的算法和數(shù)據(jù)結(jié)構(gòu);第二,應(yīng)該編寫編譯器能夠有效優(yōu)化以轉(zhuǎn)換成高效可執(zhí)行代碼的
    的頭像 發(fā)表于 11-24 15:37 ?756次閱讀
    <b class='flag-5'>編譯器</b>的優(yōu)化選項(xiàng)

    小到個(gè)分子!研究人員開發(fā)一種微小的壓電電阻

    使用壓阻的電子傳感在許多設(shè)備中都很常見(jiàn),包括汽車、醫(yī)療可穿戴設(shè)備和智能手機(jī)?,F(xiàn)在,澳大利亞的研究人員開發(fā)了一種微小的壓電電阻,小到
    的頭像 發(fā)表于 10-31 16:52 ?756次閱讀

    新版編譯器的設(shè)計(jì)思路和優(yōu)化方法

    小程序編譯器在小程序開發(fā)、預(yù)覽、發(fā)布各個(gè)階段都需要使用,因此編譯器性能會(huì)直接影響到開發(fā)開發(fā)效率,也會(huì)影響到
    發(fā)表于 10-13 11:21 ?259次閱讀
    新版<b class='flag-5'>編譯器</b>的設(shè)計(jì)思路和優(yōu)化方法

    嵌入式開發(fā)中的C語(yǔ)言編譯器設(shè)置

    編譯器的語(yǔ)義檢查很弱小,甚至還會(huì)“掩蓋”錯(cuò)誤?,F(xiàn)代的編譯器設(shè)計(jì)是件浩瀚的工程,為了讓編譯器設(shè)計(jì)簡(jiǎn)單些,目前幾乎所有編譯器的語(yǔ)義檢查都比較弱
    發(fā)表于 10-11 12:43 ?582次閱讀