Uber 宣布開源 Ludwig,一個(gè)基于 TensorFlow 的工具箱,該工具箱特點(diǎn)是不用寫代碼就能夠訓(xùn)練和測(cè)試深度學(xué)習(xí)模型。
Uber 官方表示,對(duì)于AI開發(fā)者來(lái)說(shuō),Ludwig 可以幫助他們更好地理解深度學(xué)習(xí)方面的能力,并能夠推進(jìn)模型快速迭代。另一方面,對(duì)于 AI 專家來(lái)說(shuō),Ludwig 可以簡(jiǎn)化原型設(shè)計(jì)和數(shù)據(jù)處理過(guò)程,從而讓他們能夠?qū)W⒂陂_發(fā)深度學(xué)習(xí)模型架構(gòu)。
Ludwig 提供了一套 AI 架構(gòu),可以組合起來(lái),為給定的用例創(chuàng)建端到端的模型。開始模型訓(xùn)練,只需要一個(gè)表格數(shù)據(jù)文件(如 CSV)和一個(gè) YAML 配置文件——用于指定數(shù)據(jù)文件中哪些列是輸入特征,哪些列是輸出目標(biāo)變量。如果指定了多個(gè)輸出變量,Ludwig 將學(xué)會(huì)同時(shí)預(yù)測(cè)所有輸出。使用 Ludwig 訓(xùn)練模型,在模型定義中可以包含附加信息,比如數(shù)據(jù)集中每個(gè)特征的預(yù)處理數(shù)據(jù)和模型訓(xùn)練參數(shù), 也能夠保存下來(lái),可以在日后加載,對(duì)新數(shù)據(jù)進(jìn)行預(yù)測(cè)。
對(duì)于 Ludwig 支持的數(shù)據(jù)類型(文本、圖像、類別等),其提供了一個(gè)將原始數(shù)據(jù)映射到張量的編碼器,以及將張量映射到原始數(shù)據(jù)的解碼器(張量是線性代數(shù)中使用的數(shù)據(jù)結(jié)構(gòu))。內(nèi)置的組合器,能夠自動(dòng)將所有輸入編碼器的張量組合在一起,對(duì)它們進(jìn)行處理,并將其返回給輸入解碼器。
Uber 表示,通過(guò)組合這些特定于數(shù)據(jù)類型的組件,用戶可以將 Ludwig 用于各種任務(wù)。比如,組合文本編碼器和類別解碼器,就可以獲得一個(gè)文本分類器。
每種數(shù)據(jù)類型有多個(gè)編碼器和解碼器。例如,文本可以用卷積神經(jīng)網(wǎng)絡(luò)(CNN),循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)或其他編碼器編碼。用戶可以直接在模型定義文件中指定要使用的參數(shù)和超參數(shù),而無(wú)需編寫單行代碼。
Ludwig 采用的這種靈活的編碼器-解碼器架構(gòu),即使是經(jīng)驗(yàn)較少的深度學(xué)習(xí)開發(fā)者,也能夠輕松地為不同的任務(wù)訓(xùn)練模型。比如文本分類、目標(biāo)分類、圖像字幕、序列標(biāo)簽、回歸、語(yǔ)言建模、機(jī)器翻譯、時(shí)間序列預(yù)測(cè)和問(wèn)答等等。
此外,Ludwig 還提供了各種工具,且能夠使用開源分布式培訓(xùn)框架 Horovod。目前,Ludwig 有用于二進(jìn)制值,浮點(diǎn)數(shù),類別,離散序列,集合,袋(bag),圖像,文本和時(shí)間序列的編碼器和解碼器,并且支持選定的預(yù)訓(xùn)練模型。未來(lái)將支持更多資料的種類。
-
人工智能
+關(guān)注
關(guān)注
1787文章
46060瀏覽量
234981 -
Uber
+關(guān)注
關(guān)注
0文章
408瀏覽量
36154
原文標(biāo)題:不寫代碼也能玩轉(zhuǎn)人工智能!Uber開源AI工具箱Ludwig
文章出處:【微信號(hào):TheBigData1024,微信公眾號(hào):人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論