Keras之父、谷歌大腦人工智能和深度學習研究員Fran?ois Chollet最新撰寫了一本深度學習Python教程實戰(zhàn)書籍《Python深度學習》,書中介紹了深度學習使用Python語言和強大Keras庫,詳實新穎。
近日,F(xiàn)ran?ois Chollet接受了采訪,就“深度學習到底是什么”、“Python為何如此廣受歡迎”、“目前深度學習面臨的主要挑戰(zhàn)”等議題進行了回答。他認為,目前很多深度學習領(lǐng)域的論文都是無意義的,因為這些研究使用了不科學、不規(guī)范的研究方法。
關(guān)于本人
問:您主要的工作內(nèi)容是什么?
答:我在谷歌大腦團隊工作,花了很多時間開發(fā)Keras。我也參加TensorFlow的工作。最近我主要在寫機器學習、計算機視覺、將深度學習應(yīng)用于定理證明等方面的論文。我的主要研究興趣是理解AI中的抽象和推理問題,如何從感知得到抽象的、高度概括的模型。
深度學習的本質(zhì)、挑戰(zhàn)、和未來
問:深度學習到底是什么?
答:深度學習是機器學習的一種具體方法。與以前的方法相比,它更加強大和靈活。在大多數(shù)應(yīng)用程序中,我們所說的“深度學習”是指一種把大量由人類注釋的數(shù)據(jù)轉(zhuǎn)換為以與人類相似的方式自動注釋新數(shù)據(jù)的軟件。您可以通過這種方式自動完成很多不同的任務(wù)。深度學習尤其擅長理解“感知”數(shù)據(jù),如圖像、視頻或聲音。
我來舉例說明。假設(shè)有很多圖片都帶有相關(guān)聯(lián)標簽(如“貓”、“狗”)。深度學習可以讓你自動將數(shù)據(jù)轉(zhuǎn)換到一個“了解”如何把圖片映射到標簽的系統(tǒng),只需從示例中學習,無需任何手動調(diào)整或自定義工程。然后這種系統(tǒng)可以被應(yīng)用到新的數(shù)據(jù),將標記圖片任務(wù)有效自動化。
同樣,你可以將深度學習應(yīng)用于機器翻譯、語音識別、文本到語音轉(zhuǎn)換,光學字符識別等問題。
問:深度學習社區(qū)現(xiàn)在面臨的主要挑戰(zhàn)是什么?
答:打擊炒作、發(fā)展倫理意識、獲得科學嚴謹性。
炒作:對人工智能的大肆炒作正在危害這個領(lǐng)域。一些人正荒謬地夸大目前AI取得的進展,還說人工智能已把人類逼到了絕境。但事實并非如此。如果我們把目標設(shè)得極高,卻又不能實現(xiàn),就是逼著公眾站在我們的對立面上。而且,炒作AI這件事,本質(zhì)上是不誠實的,對公眾討論也產(chǎn)生了危害。
倫理: 現(xiàn)在部署人工智能系統(tǒng)的大多數(shù)人來自單一背景,他們往往沒有意識到自己所構(gòu)建的系統(tǒng)給人們帶來了道德影響和副作用。這將成為一個問題,因為這個群體所擁有的權(quán)力會越來越大。我們需要更多地討論這些問題,并提高人們對不道德使用AI的潛在行為的覺察力,例如具有偏見性的預測模型會影響公眾生活,或以危險的方式操縱AI。
科學:每天都有大量的深度學習論文發(fā)表,其中大多數(shù)并沒有真正產(chǎn)生任何有意義的新知識,因為這些論文沒有遵循科學的研究方法。他們以模糊的方式“評估”模型,或者在他們的訓練數(shù)據(jù)上測試過度擬合模型(尤其是生成模型和強化學習,這是深度學習研究中發(fā)展最快的兩個主題),僅在MNIST上評估模型等。深度學習簡直是科學的重災(zāi)區(qū)。同行評審通常不會以有意義的方式解決這些問題,也許部分原因是大多數(shù)同行評審員進入這個領(lǐng)域最多才一兩年。如果想要取得更快的進展,那么當涉及研究可重復性、基線、模型評估和統(tǒng)計顯著性時,我們需要更加嚴謹。我們目前的激勵機制是與科學相對立的:發(fā)表論文是被鼓勵的。如果你的研究聽起來既復雜又神秘,很難被正確評估研究重要性,那么發(fā)表論文就容易多了。
問:你認為深度學習的未來是什么?
答:我期望AI未來能把“直觀的”模式識別模塊與正式推理模塊相結(jié)合。我也希望AI能夠演變得更像自動化軟件開發(fā)的形式,借用目前軟件工程中的很多模式和實踐。
寫書動機
問:你出版了一本新書《Python深度學習》。為什么要寫這本書呢?
答:寫這本書的原因是,我想推出一個課程,來教那些已有Python編程能力,但沒有機器學習背景的人。
Python為何廣受歡迎
問:Python應(yīng)該是目前發(fā)展最快的編程語言,至少在高收入國家是這樣。為什么Python如此受歡迎?
答:我愛Python。學習Python很容易上手,當你習慣使用它之后,會越來越高效。與我使用過的大多數(shù)其他語言相比,Python非常直觀和優(yōu)雅。但是Python真正的殺手锏并不在于語言本身,而是周圍的生態(tài)系統(tǒng)和社區(qū)。無論你需要做什么,比如解析特定的文件格式或與特定系統(tǒng)連接,幾乎有一個Python庫在做這件事,你不必花時間去做。在數(shù)據(jù)科學和機器學習方面尤其如此,有很多很棒的工具:numpy,pandas,scikit-learn,plotting libraries等,這使得Python成為一種非常高效的語言。
我喜歡Python的另一個原因是,它并不是一個領(lǐng)域特定的語言,而是多領(lǐng)域的交叉點,從網(wǎng)站開發(fā)到數(shù)據(jù)科學和系統(tǒng)管理。這意味著無需切換到新語言來將Keras模型部署為Web API。無論你需要做什么,無論是啟動一個web應(yīng)用程序,查詢一個REST API,還是解析一些文件,訓練最先進的深度學習模型,Python通常都會是一個很好的選擇。
給初學者的建議
問:有些聲音認為進入機器學習有壁壘。您如何看待?
答:我不同意。在過去的5年中,進入機器學習領(lǐng)域變得非常容易。當然,5-7年前這很艱難。你可能需要研究生教育。你需要用C ++或Matlab來編寫大量的低級算法。我經(jīng)歷過這些。而現(xiàn)在不一樣了。你只需要Python,很容易上手,你有權(quán)限訪問高級和易于使用的工具(如Keras)。另外,你可以在網(wǎng)上學到很多非常高質(zhì)量的資源,你可以在Kaggle上練習現(xiàn)實世界的問題。學習從未如此簡單。
問:對于初學者來說,最重要的是什么?
答:最重要的是要深刻了解深度學習能做什么,不能做什么。去感受一些best practice,比如如何正確評估模型,如何防止過度擬合。這需要把正式解釋(formal explanations)和對現(xiàn)實問題的廣泛實踐結(jié)合起來。
-
人工智能
+關(guān)注
關(guān)注
1789文章
46652瀏覽量
237063 -
python
+關(guān)注
關(guān)注
55文章
4767瀏覽量
84375 -
深度學習
+關(guān)注
關(guān)注
73文章
5463瀏覽量
120889
原文標題:Keras之父:大多數(shù)深度學習論文都是垃圾,炒作AI危害很大
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論