0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何比較兩種截然不同的編程語言的性能

Q4MP_gh_c472c21 ? 來源:博客 ? 作者:Nibble Stew ? 2021-09-02 14:55 ? 次閱讀

自從編程語言誕生以來,人們常常就哪種語言速度最快的問題爭論不休。無論是嚴(yán)肅的科學(xué)研究,還是深夜酒吧的喧囂,都不乏關(guān)于這個話題的爭執(zhí)。文本不打算就這個問題展開討論,我們不妨從一個更高的層面來看一看這個問題:

如何比較兩種截然不同的編程語言的性能。為了進行有意義的比較,我們必須使用兩種編程語言實現(xiàn)一系列測試程序,運行基準(zhǔn)測試,然后再比較最后的結(jié)果。

實際上,這種比較的難度很大,有時甚至非常費時費力。盡管問題本身看起來很簡單,但大量可能出現(xiàn)錯誤的地方會導(dǎo)致一無所知的性能測試員遭遇坎坷,有時即使非常了解也無濟于事。

01 等效的實現(xiàn)?

為了公平地比較兩種語言的實現(xiàn),編寫出來的程序的質(zhì)量應(yīng)該達(dá)到同等水平。也就是說,必須由某位對兩種編程語言以及領(lǐng)域知識的掌握程度大致相同的人來編寫程序。這本身就很難。如果由不同的人來編寫實現(xiàn),那么他們可能會選擇不同的算法來解決問題,這樣的性能比較就不再是編程語言本身的問題,而是每位程序員選擇的編程方法的問題。

即使兩個實現(xiàn)都是由同一個人使用相同的算法編寫的,仍然存在其他問題。通常,每個人都有自己擅長的語言。因此,他們會選擇自己喜歡的語言提供更快的實現(xiàn)。這就會引發(fā)偏差,因為這樣的性能比較衡量的不是編程語言本身,而更多的是程序員。這類的測試適合尋找易用性與生產(chǎn)力的差異,但對比較性能而言則不合適。

因此,你可能需要評估許多專業(yè)程序員已經(jīng)編寫好的程序。這是一個很好的方法,但有時即使是經(jīng)驗豐富的研究也會出錯。有一篇論文試圖通過這種方法比較不同的編程語言的性能和效率。

他們的測試結(jié)果表明,某個程序用C實現(xiàn)比C++實現(xiàn)快30%。這個測試結(jié)果影響了整個論文的基調(diào)。按照這個論斷,假設(shè)將所有 C 源代碼的文件擴展名 .c 改為.cpp并重新編譯,應(yīng)該能得到大致相同的結(jié)果(可能會有幾個百分點的誤差)。所以我們只能得出以下結(jié)論(按照可能性從高到低排列):

C++版本的代碼比較差;

測試方法有明顯的瑕疵;

與C相比,該編譯器對C++的性能有重大的負(fù)面影響。換句話說,上述呈現(xiàn)的差異并非來自編程語言本身。

02 測量的難度

還有一個很大的問題是,如何測量某個程序的性能。一種常見的方法是連續(xù)運行多次測試,然后執(zhí)行如下操作:

處理異常值:去掉兩個極值(即最慢和最快的測量值);

計算剩余數(shù)據(jù)點的平均值和/或中位數(shù);

比較不同程序之間的結(jié)果,速度最快的程序獲勝。上過統(tǒng)計課程的人可能還記得如何計算標(biāo)準(zhǔn)差。這種方法看似合理且嚴(yán)謹(jǐn),但其實包含多個系統(tǒng)誤差。其中最大的問題涉及測量中的噪聲。

大多數(shù)基本的統(tǒng)計工具都會假設(shè)誤差呈正態(tài)分布,平均值為零。如果測量的是溫度或速度之類,則這個假設(shè)是合理的。然而,對于編程語言的性能測量來說,這個假設(shè)并不合理。程序的運行時間包括實際上花費在解決問題上的時間,以及來自操作系統(tǒng)中斷、磁盤訪問等方面的開銷。如果我們假設(shè)噪聲為平均值為零的高斯噪聲,那么這意味著計算機有一些未知的過程,可以讓程序的運行速度超過完全無噪聲時的情況。這當(dāng)然是不可能的。這里的噪聲肯定不是高斯噪聲,因為它永遠(yuǎn)不會出現(xiàn)負(fù)值。

事實上,最接近柏拉圖式理想答案的測量結(jié)果就是最快的,因為這種情況下來自系統(tǒng)噪聲的干擾最少。這樣的測量結(jié)果會被上述第一步操作“處理異常值”刪除。有時,采用合理的、現(xiàn)成的措施只會讓事情變得更糟。

03 統(tǒng)計的難度更大

暫時撇開這一點不談,我們假設(shè)我們獲得了兩個程序的性能測試結(jié)果,且這個結(jié)果看似確實“很高斯”。數(shù)值分析表明,1號語言的運行花費了10秒,而2號語言花費了9秒。二者的差異為10%,因此我們就可以得出結(jié)論:2號語言的速度更快。這個結(jié)果正確嗎?

很遺憾,不正確。

右邊的那個更快,對不對?也許?大概?可能?為了正確回答這個問題,我們需要回顧一下大學(xué)學(xué)習(xí)的統(tǒng)計知識。首先,提出零假設(shè),即假設(shè)兩個程序沒有性能差異。接著,計算這兩次測量結(jié)果來自同一個概率分布的概率。

如果概率非常小(通常為5%),則可以推翻零假設(shè),從而證明其中一個程序比另一個快。這種方法叫做學(xué)生t檢驗,常用于大量數(shù)據(jù)的統(tǒng)計。請注意,測試的某些實現(xiàn)會假設(shè)數(shù)據(jù)符合高斯分布,如果你的數(shù)據(jù)呈現(xiàn)其他形狀,則結(jié)果可能并不可靠。

這種方式適用于一個程序,但嚴(yán)格的測試需要包含多個程序。這些評估也有一些統(tǒng)計方法,但會非常復(fù)雜。具體的做法留給讀者自行查閱。

04 所有計算機的對齊都是雙刃劍

雖然統(tǒng)計非常難,但幸運的是計算機很簡單,因為它們具有確定性、可靠,而且合乎邏輯。例如,如果在一個程序中添加一條NOP指令,則結(jié)果可能只是多了一個指令周期,對性能的影響小到無法測量。

但是,如果你非要測量,那么結(jié)果可能會讓你陷入不解和困惑。這個小小的改動有時會讓程序的運行時間增加10%(甚至更長),但也有可能縮短10%。你沒看錯,這類看似無意義的工作可以加快程序的運行速度。如果是第一次遇到這樣的問題,你可能壓根不會相信。

那么,問題在于,是否有可能讓CPU加倍努力,讓程序更快地運行呢?答案為否。實際的指令根本無關(guān)緊要。重點在于代碼的對齊。代碼在內(nèi)存中的不同位置會影響其性能特征。

如果一段經(jīng)常被執(zhí)行的循環(huán)跨越了緩存邊界,它就會變慢。將其移動到不跨越邊界的地方就能加快其速度。NOP指令并不一定要放在循環(huán)內(nèi),只要它能將整個代碼塊向上或向下移動,就可能導(dǎo)致這種差異。

假設(shè)你以非常嚴(yán)謹(jǐn)?shù)慕y(tǒng)計方式測量了兩個程序。如果二者之間的性能差異低于10%,則我們就無法斷言哪個程序更快,除非你使用的測量方式能夠消除對齊效應(yīng)。

05 這是關(guān)于機器的性能測量,而不是語言

隨著程序的運行速度越來越快,優(yōu)化經(jīng)歷了一個有趣的階段轉(zhuǎn)變。一旦性能達(dá)到一定水平,系統(tǒng)就不再關(guān)心編譯器和CPU如何才能加快程序的運行速度。相反,變成了程序員如何盡可能有效地利用CPU,例如將數(shù)據(jù)排列成方便處理器處理的布局等。

這意味著用基于硬件的原語替換基于語言的原語。某些圈子采用的優(yōu)化方式非常奇怪,程序員甚至知道他們的循環(huán)應(yīng)該被優(yōu)化成哪些SIMD指令,然后他們會不停地修改代碼,直到實現(xiàn)這種優(yōu)化。其實,這種優(yōu)化已經(jīng)與編程語言本身的功能沒有絲毫關(guān)系了。

這就是為什么C和Fortran之類的語言仍在許多性能基準(zhǔn)測試中名列前茅的主要原因,但這些技巧并不限于這些語言。幾年前,我開發(fā)了一款規(guī)模非常大的Java應(yīng)用程序,該應(yīng)用程序經(jīng)過了非常徹底的優(yōu)化。

其內(nèi)部由整數(shù)數(shù)組組成。最常執(zhí)行的路徑中沒有類,甚至沒有Integer對象,基本上就形同于在Java語言內(nèi)部重塑了C語言。其實,幾乎任何編程語言都可以有類似的實現(xiàn)。

它們之間的性能差異主要取決于每個編譯器的優(yōu)化器。即便使用相同的編程語言,也會產(chǎn)生截然不同的性能結(jié)果,更不用說不同的編程語言了。因此,聲稱某一種編程語言在性能上有明顯的優(yōu)勢都是不合理的,因為說到底都是內(nèi)聯(lián)匯編程序。

原文鏈接:

https://nibblestew.blogspot.com/2021/02/why-most-programming-language.html?m=1

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編程
    +關(guān)注

    關(guān)注

    88

    文章

    3524

    瀏覽量

    93285
  • C++
    C++
    +關(guān)注

    關(guān)注

    21

    文章

    2085

    瀏覽量

    73310
  • 源代碼
    +關(guān)注

    關(guān)注

    96

    文章

    2942

    瀏覽量

    66448
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1602

    瀏覽量

    48898

原文標(biāo)題:為什么大多數(shù)編程語言性能對比都有問題?

文章出處:【微信號:gh_c472c2199c88,微信公眾號:嵌入式微處理器】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    比較分析兩種不同的可提高柵極驅(qū)動電流的方法

    電子發(fā)燒友網(wǎng)站提供《比較分析兩種不同的可提高柵極驅(qū)動電流的方法.pdf》資料免費下載
    發(fā)表于 09-23 11:13 ?0次下載
    <b class='flag-5'>比較</b>分析<b class='flag-5'>兩種</b>不同的可提高柵極驅(qū)動電流的方法

    紅石比較兩種模式的作用

    紅石比較器是Minecraft中的一非常重要的紅石元件,它用于比較個紅石信號的強度,并根據(jù)比較結(jié)果輸出不同的信號強度。
    的頭像 發(fā)表于 09-05 09:17 ?171次閱讀

    opa695用示波器探頭與sma轉(zhuǎn)bnc線觀察出現(xiàn)截然不同的結(jié)果,為什么?

    觀察射頻信號 用示波器探頭與sma轉(zhuǎn)bnc線觀察出現(xiàn)截然不同的結(jié)果 一個示波器探頭在40M時衰減了0.8 sma增大了倍 示波器探頭帶寬100 示波器帶寬300 負(fù)載50歐 695輸出50歐
    發(fā)表于 08-26 06:24

    地物光譜儀的兩種天空光測量方法比較

    地物光譜儀的兩種天空光測量方法比較天空光是指太陽光經(jīng)過大氣分子及大氣氣溶膠散射后經(jīng)任意方向到達(dá)地面的輻射。
    的頭像 發(fā)表于 07-29 14:40 ?179次閱讀
    地物光譜儀的<b class='flag-5'>兩種</b>天空光測量方法<b class='flag-5'>比較</b>

    無線電路的超外差式接收和超再生式接收有何區(qū)別?

    無線電路中的超外差式接收和超再生式接收是兩種截然不同的接收方式,它們在原理、性能、應(yīng)用等方面均存在顯著差異。
    的頭像 發(fā)表于 04-08 18:13 ?1253次閱讀

    fpga用的是什么編程語言 fpga用什么語言開發(fā)

    fpga用的是什么編程語言 FPGA(現(xiàn)場可編程邏輯門陣列)主要使用的編程語言是硬件描述語言(H
    的頭像 發(fā)表于 03-14 17:09 ?2852次閱讀

    fpga芯片用什么編程語言

    FPGA芯片主要使用的編程語言包括Verilog HDL和VHDL。這兩種語言都是硬件描述語言,用于描述數(shù)字系統(tǒng)的結(jié)構(gòu)和行為。
    的頭像 發(fā)表于 03-14 16:07 ?1302次閱讀

    編程語言之間的區(qū)別和聯(lián)系

    編程語言是一人與計算機之間進行交流的方式,不同的編程語言有著不同的特點和用途。本文將對四常見
    的頭像 發(fā)表于 02-05 14:16 ?1097次閱讀

    vb語言和c++語言的區(qū)別

    VB語言和C++語言兩種不同的編程語言,雖然它們都屬于高級編程
    的頭像 發(fā)表于 02-01 10:20 ?1565次閱讀

    分享兩種簡單的平衡電橋設(shè)備設(shè)計

    本文給出了兩種簡單的平衡電橋設(shè)備設(shè)計,借此即可對個電感進行高精度的比較。LED指示器或高阻抗電話耳機用作不平衡指示器。
    的頭像 發(fā)表于 01-05 09:31 ?662次閱讀
    分享<b class='flag-5'>兩種</b>簡單的平衡電橋設(shè)備設(shè)計

    兩種常見EMC整改流程!

    兩種常見EMC整改流程!|深圳比創(chuàng)達(dá)電子EMC
    的頭像 發(fā)表于 11-23 10:10 ?840次閱讀

    sqlite數(shù)據(jù)插入的兩種方式比較

    sqlite工具包提供兩種數(shù)據(jù)插入方式,全部使用Execute SQL(Ploy)函數(shù)
    的頭像 發(fā)表于 11-13 09:33 ?938次閱讀

    單端反激式變換器在兩種工作模式下特性比較

    電子發(fā)燒友網(wǎng)站提供《單端反激式變換器在兩種工作模式下特性比較.pdf》資料免費下載
    發(fā)表于 11-01 14:25 ?1次下載
    單端反激式變換器在<b class='flag-5'>兩種</b>工作模式下特性<b class='flag-5'>比較</b>

    高壓大功率變頻器的兩種冷卻方式比較

    電子發(fā)燒友網(wǎng)站提供《高壓大功率變頻器的兩種冷卻方式比較.doc》資料免費下載
    發(fā)表于 11-01 10:00 ?0次下載
    高壓大功率變頻器的<b class='flag-5'>兩種</b>冷卻方式<b class='flag-5'>比較</b>

    兩種保護用電流采樣電路的比較及應(yīng)用

    電子發(fā)燒友網(wǎng)站提供《兩種保護用電流采樣電路的比較及應(yīng)用.pdf》資料免費下載
    發(fā)表于 10-25 10:19 ?3次下載
    <b class='flag-5'>兩種</b>保護用電流采樣電路的<b class='flag-5'>比較</b>及應(yīng)用