您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

AI時代Python 語言的優(yōu)勢

大?。?/span>0.8 MB 人氣: 2017-09-28 需要積分:1

  誰會成為AI 和大數(shù)據(jù)時代的第一開發(fā)語言?這本已是一個不需要爭論的問題。如果說三年前,Matlab、Scala、R、JavaPython還各有機(jī)會,局面尚且不清楚,那么三年之后,趨勢已經(jīng)非常明確了,特別是 Facebook 開源了 PyTorch 之后,Python 作為 AI 時代頭牌語言的位置基本確立,未來的懸念僅僅是誰能坐穩(wěn)第二把交椅。

  不過聲音市場上還有一些雜音。最近一個有意學(xué)習(xí)數(shù)據(jù)科學(xué)的姑娘跟我說,她的一個朋友建議她從 Java 入手,因為 Hadoop 等大數(shù)據(jù)基礎(chǔ)設(shè)施是用 Java 寫的。無獨(dú)有偶,上個月 IBM developerWorks 發(fā)表的一篇個人博客(https://www.ibm.com/developerworks/community/blogs/jfp/entry/What_Language_Is_Best_For_Machine_Learning_And_Data_Science?lang=en),用職位招聘網(wǎng)站indeed 上的數(shù)據(jù)做了一個統(tǒng)計。這篇文章本身算得上是客觀公正,實事求是,但傳到國內(nèi)來,就被一些評論者曲解了本意,說 Python 的優(yōu)勢地位尚未確立,鹿死誰手尚未可知,各位學(xué)習(xí)者不可盲目跟風(fēng)啊,千萬要多方押寶,繼續(xù)撒胡椒面不要停。

  在這里我要明確表個態(tài),對于希望加入到 AI 和大數(shù)據(jù)行業(yè)的開發(fā)人員來說,把雞蛋放在 Python 這個籃子里不但是安全的,而且是必須的?;蛘邠Q個方式說,如果你將來想在這個行業(yè)混,什么都不用想,先閉著眼睛把 Python 學(xué)會了。當(dāng)然,Python不是沒有它的問題和短處,你可以也應(yīng)該有另外一種甚至幾種語言與 Python 形成搭配,但是Python 將坐穩(wěn)數(shù)據(jù)分析和 AI 第一語言的位置,這一點(diǎn)毫無疑問。

  我甚至認(rèn)為,由于 Python 坐穩(wěn)了這個位置,由于這個行業(yè)未來需要大批的從業(yè)者,更由于Python正在迅速成為全球大中小學(xué)編程入門課程的首選教學(xué)語言,這種開源動態(tài)腳本語言非常有機(jī)會在不久的將來成為第一種真正意義上的編程世界語。

  

  討論編程語言的優(yōu)劣興衰一直被認(rèn)為是一個口水戰(zhàn)話題,被資深人士所不屑。但是我認(rèn)為這次 Python 的上位是一件大事。請設(shè)想一下,如果十五年之后,所有40歲以下的知識工作者,無分中外,從醫(yī)生到建筑工程師,從辦公室秘書到電影導(dǎo)演,從作曲家到銷售,都能使用同一種編程語言進(jìn)行基本的數(shù)據(jù)處理,調(diào)用云上的人工智能 API,操縱智能機(jī)器人,進(jìn)而相互溝通想法,那么這一普遍編程的協(xié)作網(wǎng)絡(luò),其意義將遠(yuǎn)遠(yuǎn)超越任何編程語言之爭。目前看來,Python 最有希望擔(dān)任這個角色。

  Python 的勝出令人意外,因為它缺點(diǎn)很明顯。

  它語法上自成一派,讓很多老手感到不習(xí)慣。

  “裸” Python 的速度很慢,在不同的任務(wù)上比C 語言大約慢數(shù)十倍到數(shù)千倍不等。

  由于全局解釋器鎖(GIL)的限制,單個Python 程序無法在多核上并發(fā)執(zhí)行;Python 2 和 Python 3 兩個版本長期并行,很多模塊需要同時維護(hù)兩個不同的版本,給開發(fā)者選擇帶來了很多不必要的混亂和麻煩。

  由于不受任何一家公司的控制,一直以來也沒有一個技術(shù)巨頭肯死挺 Python ,所以相對于 Python 的應(yīng)用之廣泛,其核心基礎(chǔ)設(shè)施所得到的投入和支持其實是非常薄弱的。直到今天,26歲的Python 都還沒有一個官方標(biāo)配的 JIT 編譯器,相比之下, Java 語言在其發(fā)布之后頭三年內(nèi)就獲得了標(biāo)配 JIT 。

  另一個事情更能夠說明問題。Python 的 GIL 核心代碼 1992 年由該語言創(chuàng)造者 Guido van Rossum 編寫,此后十八年時間沒有一個人對這段至關(guān)重要的代碼改動過一個字節(jié)。十八年!直到2010年,Antoine Pitrou才對 GIL 進(jìn)行了近二十年來的第一次改進(jìn),而且還僅在 Python 3.x 版本中使用。這也就是說,今天使用 Python 2.7 的大多數(shù)開發(fā)者,他們所寫的每一段程序仍然被26年前的一段代碼牢牢制約著。

  說到 Python 的不足,我就想起發(fā)生在自己身上的一段小小的軼事。我多年前曾經(jīng)在一篇文章里聲明自己看好 Python,而不看好 Ruby。大概兩年多以前,有一個網(wǎng)友在微博里找到我,對我大加責(zé)備,說因為當(dāng)年讀了我這篇文章,誤聽讒言,鬼迷心竅,一直專攻 Python,而始終對 Ruby 敬而遠(yuǎn)之。結(jié)果他Python 固然精通,但最近一學(xué) Ruby,如此美好,如此甜蜜,喜不自勝,反過來憤然意識到,當(dāng)年完全被我誤導(dǎo)了,在最美的年華錯過了最美的編程語言。我當(dāng)時沒有更多的與他爭辯,也不知道他今天是否已經(jīng)從Python后端、大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)和 AI 工程師成功轉(zhuǎn)型為Rails快速開發(fā)高手。我只是覺得,想要真正認(rèn)識一件事物的價值,確實也不是一件容易的事情。

  Python 就是這樣一個帶著各種毛病沖到第一方陣的賽車手,但即便到了幾年前,也沒有多少人相信它有機(jī)會摘取桂冠,很多人認(rèn)為 Java 的位置不可動搖,還有人說一切程序都將用 Java重寫。但今天我們再看,Python 已經(jīng)是數(shù)據(jù)分析和 AI的第一語言,網(wǎng)絡(luò)攻防的第一黑客語言,正在成為編程入門教學(xué)的第一語言,云計算系統(tǒng)管理第一語言。Python 也早就成為Web 開發(fā)、游戲腳本、計算機(jī)視覺、物聯(lián)網(wǎng)管理和機(jī)器人開發(fā)的主流語言之一,隨著 Python 用戶可以預(yù)期的增長,它還有機(jī)會在多個領(lǐng)域里登頂。

  而且不要忘了,未來絕大多數(shù)的 Python 用戶并不是專業(yè)的程序員,而是今天還在使用 Excel、PowePoint、SAS、Matlab和視頻編輯器的那些人。

  就拿 AI 來說,我們首先要問一下,AI 的主力人群在哪里?如果我們今天靜態(tài)的來談這個話題,你可能會認(rèn)為 AI 的主力是研究機(jī)構(gòu)里的 AI 科學(xué)家、擁有博士學(xué)位的機(jī)器學(xué)習(xí)專家和算法專家。

  但上次我提到李開復(fù)的“”明確告訴我們,只要稍微把眼光放長遠(yuǎn)一點(diǎn),往后看三至五年,你會看到整個 AI 產(chǎn)業(yè)的從業(yè)人口將逐漸形成一個巨大的金字塔結(jié)構(gòu),上述的 AI 科學(xué)家僅僅是頂端的那么一點(diǎn)點(diǎn),95% 甚至更多的 AI 技術(shù)人員,都將是AI 工程師、應(yīng)用工程師和AI 工具用戶。

  我相信這些人幾乎都將被Python 一網(wǎng)打盡,成為 Python 陣營的龐大后備軍。這些潛在的 Python 用戶至今仍然在技術(shù)圈子之外,但隨著 AI 應(yīng)用的發(fā)展,數(shù)百萬之眾的教師、公司職員、工程師、翻譯、編輯、醫(yī)生、銷售、管理者和公務(wù)員將裹挾著各自領(lǐng)域中的行業(yè)知識和數(shù)據(jù)資源,涌入 Python 和 AI 大潮之中,深刻的改變整個 IT,或者說 DT (數(shù)據(jù)科技)產(chǎn)業(yè)的整體格局和面貌。

  為什么 Python 能夠后來居上呢?

  如果泛泛而論,我很可以列舉 Python 的一些優(yōu)點(diǎn),比如語言設(shè)計簡潔優(yōu)雅,對程序員友好,開發(fā)效率高。但我認(rèn)為這不是根本原因,因為其他一些語言在這方面表現(xiàn)得并不差。

  還有人認(rèn)為 Python 的優(yōu)勢在于資源豐富,擁有堅實的數(shù)值算法、圖標(biāo)和數(shù)據(jù)處理基礎(chǔ)設(shè)施,建立了非常良好的生態(tài)環(huán)境,吸引了大批科學(xué)家以及各領(lǐng)域的專家使用,從而把雪球越滾越大。但我覺得這是倒因為果。為什么偏偏是 Python 能夠吸引人們使用,建立起這么好的基礎(chǔ)設(shè)施呢?為什么世界上最好的語言 PHP 里頭就沒有 numpy 、NLTK、sk-learn、pandas 和 PyTorch 這樣級別的庫呢?為什么 Java 極度繁榮之后就搞得各種程序庫層次不齊,一地雞毛,而 Python 的各種程序庫既繁榮又有序,能夠保持較高水準(zhǔn)呢?

  我認(rèn)為最根本的原因只有一點(diǎn):Python 是眾多主流語言中唯一一個戰(zhàn)略定位明確,而且始終堅持原有戰(zhàn)略定位不動搖的語言。

  相比之下,太多的語言不斷的用戰(zhàn)術(shù)上無原則的勤奮去侵蝕和模糊自己的戰(zhàn)略定位,最終只能等而下之。

  Python 的戰(zhàn)略定位是什么?

  其實很簡單,就是要做一種簡單、易用但專業(yè)、嚴(yán)謹(jǐn)?shù)耐ㄓ媒M合語言,或者叫膠水語言,讓普通人也能夠很容易的入門,把各種基本程序元件拼裝在一起,協(xié)調(diào)運(yùn)作。

  正是因為堅持這個定位,Python 始終把語言本身的優(yōu)美一致放在奇技妙招前面,始終把開發(fā)者效率放在CPU效率前面,始終把橫向擴(kuò)張能力放在縱向深潛能力之前。長期堅持這些戰(zhàn)略選擇,為 Python 帶來了其他語言望塵莫及的豐富生態(tài)。

  比如說,任何一個人,只要愿意學(xué)習(xí),可以在幾天的時間里學(xué)會Python基礎(chǔ)部分,然后干很多很多事情,這種投入產(chǎn)出比可能是其他任何語言都無法相比的。再比如說,正是由于 Python 語言本身慢,所以大家在開發(fā)被頻繁使用的核心程序庫時,大量使用 C 語言跟它配合,結(jié)果用 Python 開發(fā)的真實程序跑起來非??欤驗楹苡锌赡艹^ 80% 的時間系統(tǒng)執(zhí)行的代碼是 C 寫的。相反,如果 Python 不服氣,非要在速度上較勁,那么結(jié)果很可能是裸速提高個幾倍,但這樣就沒人有動力為它開發(fā) C 模塊了,最后的速度遠(yuǎn)不如混合模式,而且很可能語言因此會變得更復(fù)雜,結(jié)果是一個又慢又丑陋的語言。

  更重要的是,Python 的包裝能力、可組合性、可嵌入性都很好,可以把各種復(fù)雜性包裝在 Python 模塊里,暴露出漂亮的接口。

  很多時候,一個程序庫本身是用 C/C++ 寫的,但你會發(fā)現(xiàn),直接使用 C 或者 C++ 去調(diào)用那個程序庫,從環(huán)境配置到接口調(diào)用,都非常麻煩,反而隔著一層,用其python 包裝庫更加清爽整潔,又快又漂亮。這些特點(diǎn)到了 AI 領(lǐng)域中,就成了 Python 的強(qiáng)大優(yōu)勢。Python 也借助 AI 和數(shù)據(jù)科學(xué),攀爬到了編程語言生態(tài)鏈的頂級位置。Python 與 AI綁在一起,對它們來說,無論是電子商務(wù)、搜索引擎、社交網(wǎng)絡(luò)還是智能硬件,未來都只是生態(tài)鏈下游的數(shù)據(jù)奶牛、電子神經(jīng)和執(zhí)行工具,都將聽命于自己。

  對編程語言發(fā)展歷史缺乏了解的人可能會覺得,Python 的戰(zhàn)略定位是犬儒主義和缺乏進(jìn)取心的。但事實證明,能同時做到簡單而嚴(yán)謹(jǐn)、易用而專業(yè),是很難的,而能夠堅守膠水語言的定位,更是難上加難。

  有的語言,從一開始就是出于學(xué)術(shù)而非實用的目的,學(xué)習(xí)曲線過于陡峭,一般人很難接近。有的語言,過于依賴背后金主的商業(yè)支持,好的時候風(fēng)光無限,一旦被打入冷宮,連生存下去都成問題。有的語言,設(shè)計的時候有明確的假想場景,要么是為了解決大規(guī)模并發(fā),要么是為了解決矩陣運(yùn)算,要么是為了做網(wǎng)頁渲染模板,一旦離開這個場景,就各種不爽。更多的語言,剛剛?cè)〉靡稽c(diǎn)成功,就迫不及待的想成為全能冠軍,在各個方向上拼命的伸展觸角,特別是在增強(qiáng)表達(dá)能力和提升性能方面經(jīng)常過分積極,不惜將核心語言改得面目全非,最后變成誰都無法掌控的龐然大物。相比之下,Python 是現(xiàn)代編程語言設(shè)計和演化當(dāng)中的一個成功典范。

  Python 之所以在戰(zhàn)略定位上如此清晰,戰(zhàn)略堅持上如此堅定,歸根結(jié)底是因為其社區(qū)構(gòu)建了一個堪稱典范的決策和治理機(jī)制。這個機(jī)制以 Guido van Rossum (BDFL,Pythoners 都知道這是什么意思), DavidBeazley, Raymond Hettinger 等人為核心,以 PEP 為組織平臺,民主而有序,集中而開明。只要這個機(jī)制本身得以維系,Python 在可見的未來里仍將一路平穩(wěn)上行。

  最有可能向 Python 發(fā)起挑戰(zhàn)的,當(dāng)然是Java。Java 的用戶存量大,它本身也是一種戰(zhàn)略定位清晰而且非常堅定的語言。但我并不認(rèn)為 Java 有很大的機(jī)會,因為它本質(zhì)上是為構(gòu)造大型復(fù)雜系統(tǒng)而設(shè)計的。什么是大型復(fù)雜系統(tǒng)?就是由人清清楚楚描述和構(gòu)造出來的系統(tǒng),其規(guī)模和復(fù)雜性是外生的,或者說外界賦予的。而 AI 的本質(zhì)是一個自學(xué)習(xí)、自組織的系統(tǒng),其規(guī)模和復(fù)雜性是一個數(shù)學(xué)模型在數(shù)據(jù)的喂養(yǎng)下自己長出來的,是內(nèi)生的。因此,Java大多數(shù)的語言結(jié)構(gòu)對于大數(shù)據(jù)的處理和 AI 系統(tǒng)的開發(fā)顯得使不上勁,你強(qiáng)的東西這里用不上,這里需要的東西你做起來又別扭。而 Python 在數(shù)據(jù)處理方面的簡潔強(qiáng)悍早就盡人皆知。對比兩個功能相同的 Java 和 Python 機(jī)器學(xué)習(xí)程序,正常人只要看兩眼就能做出判斷,一定是 Python 程序更加清爽痛快。

  大概在 2003 或者 2004 年的時候,我買過一本 Python 的書,作者是一位巴西人。他說自己之所以堅定的選擇 Python,是因為他小時候經(jīng)常夢到未來世界將由一條大蟒蛇(蟒蛇的英文為python)統(tǒng)治。我當(dāng)時覺得這哥們好可憐,做個夢都能夢到這么恐怖的場景。但今天來看,也許他只是像黑客帝國里的程序員安德森一樣,不小心穿越到未來,并且窺探到了世界的真相。

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?