英偉達待發(fā)布最新研究成果,通過現(xiàn)有數(shù)據(jù)集模擬新圖像,以期突破人工智能訓(xùn)練的潛力。
英偉達展示了其最新的人工智能模型,該模型使用了一個小數(shù)據(jù)集生成式對抗網(wǎng)絡(luò)通常使用的數(shù)據(jù)集的一小部分,據(jù)了解,這些數(shù)據(jù)集的對象是來自大都會藝術(shù)博物館的藝術(shù)品。
從數(shù)據(jù)集中,英偉達開發(fā)的人工智能能夠創(chuàng)建新的圖像,復(fù)制原始藝術(shù)家的作品,這些圖像可以用來幫助進一步升級人工智能模型。
人工智能通過應(yīng)用一種突破性的神經(jīng)網(wǎng)絡(luò)訓(xùn)練技術(shù)取得了這一重要的成就,這種技術(shù)類似于流行的NVIDIA StyleGAN2模型。
該技術(shù)被稱為自適應(yīng)識別器增強技術(shù)(ADA), 英偉達稱該技術(shù)可以將所需的訓(xùn)練圖像數(shù)量減少10-20倍,同時仍能獲得良好的效果。
英偉達圖形研究副總裁David Luebke說:
這些結(jié)果意味著人們可以使用生成式對抗網(wǎng)絡(luò)來解決耗時太長或難以獲取大量數(shù)據(jù)的問題,我迫不及待地想看看藝術(shù)家、醫(yī)學(xué)專家和研究人員用它來做什么。
醫(yī)療保健是英偉達的研究可以應(yīng)用的一個特別令人興奮的領(lǐng)域。例如,它可以幫助創(chuàng)建癌癥組織學(xué)圖像來訓(xùn)練其他AI模型,這項突破將有助于解決當前大多數(shù)數(shù)據(jù)集的問題。
人工智能訓(xùn)練通常需要大型數(shù)據(jù)集,但并不是一直有效可用的。另一方面,大型數(shù)據(jù)集很難確保其內(nèi)容是否合適,不會無意中導(dǎo)致算法偏差。
今年早些時候,麻省理工學(xué)院被迫刪除了一個名為8000萬小圖像的大型數(shù)據(jù)集。該數(shù)據(jù)集在訓(xùn)練人工智能方面很流行,但被發(fā)現(xiàn)包含帶有種族主義、厭惡女性和其他不可接受的標簽的圖像。
麻省理工學(xué)院網(wǎng)站上的一份聲明稱,他們并不知道這些冒犯性的標簽,它們是“使用來自WordNet的名詞進行自動數(shù)據(jù)收集的結(jié)果”。
該聲明還解釋了數(shù)據(jù)集中包含的8000萬張圖片大小只有32×32像素意味著手工檢查幾乎是不可能的,也不能保證所有冒犯性的圖片都會被刪除。
從一個可以手動檢查的小數(shù)據(jù)集開始,像英偉達ADA這樣的技術(shù)可以用來創(chuàng)建新的圖像來模擬原始圖像,并可以放大到訓(xùn)練人工智能模型所需的大校
在一篇博文中,英偉達寫道:
“通常需要5萬到10萬張訓(xùn)練圖像來訓(xùn)練高質(zhì)量的生成式對抗網(wǎng)絡(luò)。但在許多情況下,研究人員根本沒有可供他們使用的數(shù)萬或數(shù)十萬張樣本圖像。
由于只有幾千張圖像可供訓(xùn)練,許多生成式對抗網(wǎng)絡(luò)在產(chǎn)生真實的結(jié)果時會不準確。當鑒別器僅僅記住了訓(xùn)練圖像而不能向生成器提供有用的反饋時,就會出現(xiàn)這種問題,稱為過擬合?!?br /> 責(zé)任編輯:YYX
-
人工智能
+關(guān)注
關(guān)注
1791文章
46671瀏覽量
237142 -
ada
+關(guān)注
關(guān)注
0文章
16瀏覽量
21591 -
英偉達
+關(guān)注
關(guān)注
22文章
3721瀏覽量
90702
發(fā)布評論請先 登錄
相關(guān)推薦
評論