a11處理器內(nèi)部圖
蘋(píng)果A11仿生芯片內(nèi)置一系列為特定任務(wù)設(shè)計(jì)的處理核心和強(qiáng)大的控制器。對(duì)于這個(gè)處理器我們目前了解的不多,而隨著新iPhone的上市,今天我們終于可以對(duì)它的GPU、神經(jīng)引擎、6核CPU、NVMe SSD控制器和新的定制視頻編碼器進(jìn)行更深入的了解。
新的3核GPU
這是蘋(píng)果首次在旗下A系列芯片中整合自主定制的GPU,相比iPhone 7中本就是智能手機(jī)圖形架構(gòu)佼佼者的Imagination GPU,前者的速度提升了30%。
蘋(píng)果的新款GPU不僅速度更快了,能效也更高了,相同的工作量下它的能耗只是A10 Fusion處理器的一半。
當(dāng)初行業(yè)開(kāi)發(fā)GPU是為了給圖形加速,可多年來(lái)它也開(kāi)始承擔(dān)其他具有相似重復(fù)性質(zhì)的數(shù)學(xué)運(yùn)算任務(wù),所以也被稱為“通用GPU(General Purpose GPU)”。蘋(píng)果當(dāng)初開(kāi)發(fā)OpenCL作為API去執(zhí)行GPGPU,不過(guò)后來(lái)他們已經(jīng)將GPGPU計(jì)算整合到Metal API中,后者專為iOS和Mac設(shè)備中的GPU優(yōu)化。在今年6月份的WWDC上,Metal API已經(jīng)更新到Metal 2版本。
現(xiàn)在蘋(píng)果同時(shí)自主設(shè)計(jì)圖形芯片及管理它的芯片,那我們可以期待GPU和GPGPU的發(fā)展會(huì)更快。另外蘋(píng)果也同時(shí)在研究機(jī)器學(xué)習(xí),這是GPU最擅長(zhǎng)的任務(wù)之一。機(jī)器學(xué)習(xí)只在一系列已知的東西)上建立模型,然后利用這個(gè)“知識(shí)”模型去尋找識(shí)別出匹配的東西。比如已知的東西是各種花的照片,那它就可以利用模型在新的照片或者相機(jī)取景器中尋找可能是花朵的東西。
蘋(píng)果僅表示新GPU有3個(gè)核心,并沒(méi)有提供其他關(guān)于新GPU設(shè)計(jì)的詳細(xì)技術(shù)信息。不同的GPU設(shè)計(jì)需為特定任務(wù)和戰(zhàn)略優(yōu)化,這些設(shè)計(jì)也讓核心的定義有極大的差別,所以無(wú)法直接將蘋(píng)果的GPU和英特爾、英偉達(dá)、AMD、高通、ARM Mali以及其他廠商的GPU作有意義的對(duì)比。
TBDR
值得指出的是,蘋(píng)果表示A11仿生芯片GPU圖形架構(gòu)基于區(qū)塊延遲渲染(Tile Based Deferred Rendering)。TBDR渲染技術(shù)是專為資源有限的移動(dòng)設(shè)備設(shè)計(jì)的。它能夠有效地僅渲染3D場(chǎng)景中人眼可見(jiàn)的場(chǎng)景。桌面PC GPU(以及高通Adreno和ARM Mali移動(dòng)GPU)的IMR立即渲染模式IMR實(shí)行的是無(wú)差別對(duì)待,那些遮蔽處理的部分依然會(huì)被渲染處理器,這也導(dǎo)致無(wú)意義的讀寫(xiě)操作更多,浪費(fèi)了大量性能和帶寬,移動(dòng)GPU一般無(wú)法接受這種簡(jiǎn)單粗暴的方式。
TBDR則跳過(guò)用戶看不到的東西,將場(chǎng)景分成不同的區(qū)塊,分析哪些區(qū)塊需要渲染,節(jié)省了性能和寬帶,區(qū)塊內(nèi)存速度更快、延遲率低。這種處理流程能讓它異步執(zhí)行頂點(diǎn)和片段,有利于更好地利用整個(gè)GPU。蘋(píng)果指出:執(zhí)行頂點(diǎn)通常需要大量使用固定功能硬件,而執(zhí)行片段時(shí)需要使用數(shù)學(xué)運(yùn)算和帶寬。完全重疊能讓設(shè)備同時(shí)利用GPU上的所有硬件區(qū)塊。
TBDR作為一項(xiàng)技術(shù),和Imagination的PowerVR有著緊密的聯(lián)系。后者選擇了比較與眾不同的方式,與桌面GPU并行開(kāi)發(fā),在第一代iPhone問(wèn)世時(shí)嶄露頭角,是專為移動(dòng)平臺(tái)優(yōu)化的完美GPU架構(gòu),它的能效有著PC GPU無(wú)法企及的優(yōu)勢(shì)。
不過(guò)雖然今年春天Imagination說(shuō)了,蘋(píng)果還沒(méi)有證明他們沒(méi)有侵犯Imagination知識(shí)產(chǎn)品,但是現(xiàn)在Imagination好像已經(jīng)不再絮絮叨叨地稱蘋(píng)果新GPU使用了任何未獲得授權(quán)的PowerVR技術(shù),相反Imagination現(xiàn)在已是自身難保,在沒(méi)有了蘋(píng)果的訂單之后情況急轉(zhuǎn)直下,最近有消息稱他們已經(jīng)把自己賣(mài)出去了。
另外雖然目前成功的GPU架構(gòu)不多(很多嘗試最終都以失敗告終),可TBDR也不是Imagination完全獨(dú)有的。這就跟CPU行業(yè)一樣,雖有很多競(jìng)爭(zhēng)者都嘗試打破現(xiàn)狀,但是目前移動(dòng)設(shè)備CPU還是ARM架構(gòu)主導(dǎo),PC和服務(wù)器還是英特爾的x86架構(gòu)主導(dǎo)。
蘋(píng)果的Metal 2向開(kāi)發(fā)者提供了TBDR的細(xì)節(jié),以便開(kāi)發(fā)者優(yōu)化內(nèi)存使用,提供更細(xì)粒度的同步讓GPU可以完成更多工作。蘋(píng)果還表示新GPU有一些特性能夠極大強(qiáng)化TBDR,能讓第三方應(yīng)用和游戲的性能和功能達(dá)到一個(gè)新的層次。
四核ISP神經(jīng)引擎
開(kāi)發(fā)全新的GPU架構(gòu)“還不是那么具有創(chuàng)造性”,所以A11仿生芯片的圖形信號(hào)處理器ISP中還有全新的神經(jīng)引擎,它能夠解決各種特定任務(wù),比如匹配、分析和計(jì)算攝像頭傳感器圖像數(shù)據(jù)中的數(shù)千個(gè)參照點(diǎn)。
這些任務(wù)其實(shí)可以由GPU來(lái)完成,但是網(wǎng)絡(luò)引擎已特別針對(duì)矩陣乘法和浮點(diǎn)處理進(jìn)行邏輯優(yōu)化,所以它特別擅長(zhǎng)處理這些任務(wù)。
網(wǎng)絡(luò)引擎本身有兩個(gè)平行核心,用于處理實(shí)時(shí)就算,每秒能夠執(zhí)行6000億次運(yùn)算。也就是說(shuō)除了能夠像上一代ISP一樣,在照片上使用復(fù)雜的效果之外,它也能夠?qū)?shí)時(shí)視頻使用效果。除了使用各種效果,它也能夠讓相機(jī)系統(tǒng)識(shí)別場(chǎng)景中的物體及結(jié)構(gòu)構(gòu)成,以追蹤和聚焦用戶當(dāng)前拍攝的物體。
網(wǎng)絡(luò)引擎也是A11仿生芯片的名字來(lái)源?!胺律蓖ǔJ侵溉双@得電機(jī)、電子裝置增強(qiáng)生物功能,即因?yàn)檫@些增強(qiáng)而有了超人能力。而對(duì)于A11仿生芯片,你可以反過(guò)來(lái)理解它。它其實(shí)是機(jī)器獲得類人類功能增強(qiáng)。你還可以這樣理解:對(duì)于使用這塊芯片的人而言,它就是仿生學(xué)增強(qiáng),能讓用戶完成一般機(jī)器人無(wú)法完成的任務(wù)。
6個(gè)新的CPU核心、第二代性能控制器
A11仿生芯片的第三個(gè)重點(diǎn)是蘋(píng)果自助設(shè)計(jì)的ARM架構(gòu)CPU核心。蘋(píng)果自2010年開(kāi)始推出定制A4 SoC,在隨后幾年迅速完善其設(shè)計(jì)。2013年推出首款64位ARM A7芯片,行業(yè)競(jìng)爭(zhēng)對(duì)手一時(shí)之間都傻眼了。
去年的A10 Fusion之名源于一個(gè)新的架構(gòu),它實(shí)際上由2個(gè)高性能核心和2個(gè)高能效核心組成,兩組不同性能的CPU內(nèi)核設(shè)計(jì)就可以很好的解決,每一組內(nèi)核所起到的作用明顯不同,更多是為了在性能和效能之間非常平衡。簡(jiǎn)單的說(shuō),通過(guò)內(nèi)藏于A10內(nèi)部定制的硬件級(jí)別的管理器,可以讓芯片更好地管理、組織、協(xié)調(diào)和分配設(shè)備上的各項(xiàng)任務(wù),根據(jù)最大處理能力或者節(jié)能任務(wù)要求,決定如何分配CPU內(nèi)核的使用。
今年蘋(píng)果指出,他們的第二代性能控制器能夠在更低能耗的核心上執(zhí)行任務(wù),或者在更快的高性能核心上加快流程,甚至能夠讓整個(gè)6核CPU火力全開(kāi)。使用不對(duì)稱多任務(wù)處理設(shè)計(jì),A11仿生芯片就能夠根據(jù)需要處理的任務(wù),按比例單獨(dú)激活任意數(shù)量的內(nèi)核。
在多個(gè)核心上處理多個(gè)任務(wù)需要的不僅僅是SoC上的多個(gè)核心,應(yīng)用和OS特性也需要有針對(duì)性設(shè)計(jì),以充分利用這些核心。而其實(shí)早在iPhone問(wèn)世之前多年,蘋(píng)果在操作系統(tǒng)層面就有這樣的針對(duì)性設(shè)計(jì),蘋(píng)果第三方開(kāi)發(fā)者也是如此。
蘋(píng)果已經(jīng)詳細(xì)介紹過(guò)他們的軟件操作系統(tǒng)戰(zhàn)略:關(guān)閉不必要的處理器單元,對(duì)進(jìn)程進(jìn)行有效定序,這樣它們的調(diào)度運(yùn)行就能在最大程度實(shí)現(xiàn)快速、高效。如今芯片硬件中也采用相似的戰(zhàn)略。其他移動(dòng)設(shè)備廠商,比如三星和LG等則永遠(yuǎn)不要開(kāi)發(fā)自己的PC OS平臺(tái)。
谷歌從一開(kāi)始就是往便攜移動(dòng)平臺(tái)的方向?qū)?a target="_blank">Android進(jìn)行調(diào)整,并不適合那些對(duì)性能有要求的用戶。谷歌并沒(méi)有真正意義上的平板電腦或桌面計(jì)算業(yè)務(wù),手機(jī)平臺(tái)也是針對(duì)平均售價(jià)低于300美元的手機(jī)——Android One價(jià)格是100美元,可以說(shuō)很有競(jìng)爭(zhēng)力了。Android買(mǎi)家其實(shí)是廣告的受眾,而不是對(duì)UI、應(yīng)用性能或多任務(wù)處理支持等復(fù)雜特性要求比較高的用。Android應(yīng)用還是為了便于廣告投放而優(yōu)化。
A11兩個(gè)性能優(yōu)化的通用CPU相比去年A10的,速度有了25%的提升,能效核心則有更大的提高,A11能效核心增加到4個(gè),速度提升了70%。
Geekbench跑分中,同等配置的iPhone 7和iPhone 8在有著明顯的差異,單核速度后者比前者快25%,多核快80%。
這值得特別提出來(lái),因?yàn)樘O(píng)果的這款芯片還有新的神經(jīng)引擎、GPU、相機(jī)ISP以及其他功能,超出了一般處理器跑分測(cè)試有效測(cè)試的范圍。
多年來(lái)三星也在營(yíng)銷他們的八核處理器,然而三星處理器和蘋(píng)果的對(duì)比實(shí)在太鮮明,三星單核其實(shí)很慢,操作系統(tǒng)沒(méi)有優(yōu)化,無(wú)法有效利用多核性能。谷歌甚至還宣稱Nexus 7有16核(CPU和GPU核心總和),然并卵,營(yíng)銷始終只是營(yíng)銷,設(shè)備并不會(huì)因此變得更快一點(diǎn)。其實(shí)設(shè)備不僅一點(diǎn)都沒(méi)有變快,隨著使用時(shí)間越來(lái)越長(zhǎng),設(shè)備的性能不斷減弱。
相比各種吹噓營(yíng)銷,蘋(píng)果則突出產(chǎn)品在實(shí)際應(yīng)用中的表現(xiàn),比如A11仿生芯片為3D游戲和AR體驗(yàn)進(jìn)行了優(yōu)化。
除了CPU,蘋(píng)果在A7中還設(shè)計(jì)了Secure Enclave來(lái)存儲(chǔ)敏感數(shù)據(jù)。蘋(píng)果表示A11仿生芯片在這方面有了提升,不過(guò)沒(méi)有詳細(xì)介紹。
SSD、安全存儲(chǔ)
A11仿生芯片中還有其他特別的特性比如超快SSD存儲(chǔ)控制器集成了定制ECC算法。這不僅僅是為了提升速度。蘋(píng)果硬件技術(shù)高級(jí)副總裁強(qiáng)尼·斯洛基(Johny Srouji)表示:“用戶購(gòu)買(mǎi)設(shè)備,存儲(chǔ)的耐用性和性能應(yīng)該與設(shè)備保持一致?!?/p>
也就是說(shuō)設(shè)備上存儲(chǔ)的數(shù)據(jù)(文件、應(yīng)用和照片)能得到更好的保護(hù),盡量避免錯(cuò)誤或者存儲(chǔ)失敗等問(wèn)題,降低丟失內(nèi)存和文件的風(fēng)險(xiǎn),也避免設(shè)備使用一段時(shí)間之后莫名其妙變慢的問(wèn)題。這是很多Android設(shè)備的通病。
蘋(píng)果在2015年MacBook上首推定制NVMe SSD存儲(chǔ)控制器,在硬件層面優(yōu)化SSD讀寫(xiě)。然后在A9芯片中將這項(xiàng)技術(shù)引入iOS設(shè)備中。當(dāng)初開(kāi)發(fā)NVMe是為了企業(yè)市場(chǎng),而不是消費(fèi)者電子產(chǎn)品。因?yàn)闆](méi)有適合的解決方案可將NVMe控制器添加到手機(jī)上,有比較便宜的、現(xiàn)成的(有一定年代的)協(xié)議可訪問(wèn)SSD存儲(chǔ)。蘋(píng)果就自己開(kāi)發(fā)了。
A11使用的是蘋(píng)果第三代iOS存儲(chǔ)控制器,不過(guò)需要介紹的東西實(shí)在太多,蘋(píng)果在發(fā)布會(huì)上也沒(méi)有對(duì)它進(jìn)行介紹。
新的蘋(píng)果視頻編碼器
兩年前,蘋(píng)果A9帶來(lái)了基于硬件的HEVC解碼器,支持設(shè)備播放H.265 / High Efficiency視頻內(nèi)容。去年A10中引入硬件編碼器,支持iPhone 7以那個(gè)格式創(chuàng)建和保存內(nèi)容。
iOS 11也支持這些新特性,并在相機(jī)設(shè)置中添加了相應(yīng)的“高效視頻捕捉”選項(xiàng)。打開(kāi)這個(gè)選項(xiàng),照片就會(huì)使用HEIF格式,視頻使用HEVC格式壓縮。
這些High Efficiency格式的優(yōu)點(diǎn)在于能夠極大減小高像素照片和視頻占據(jù)的空間。
蘋(píng)果表示,HEVC格式下1分鐘的4K 30fps視頻大小為170MB,H.264格式的話同樣的視頻大小為350MB,后者是前者的2倍。
要播放這些HEVC視頻內(nèi)容自然需要能夠解碼它們的設(shè)備。A9之前的iOS設(shè)備可以軟解,可是相比硬解,軟件需要的時(shí)間更長(zhǎng),而且非常耗電。
HEIF視頻可以轉(zhuǎn)換成H.264視頻,或者用戶可以默認(rèn)“大部分兼容”,從而繼續(xù)以JPG格式保存圖片,以H.264格式來(lái)保存視頻。但這也就意味著禁用4K 60fp(以及24fps電影設(shè)置)來(lái)錄制視頻。
蘋(píng)果為A11開(kāi)發(fā)專屬視頻編碼器,還公開(kāi)了這一點(diǎn),著實(shí)有趣啊!以前在iPod和其他設(shè)備中,蘋(píng)果會(huì)直接使用行業(yè)中已有的標(biāo)準(zhǔn),整合支持各種音頻和視頻編解碼器,包括微軟的WMA、WMV和VC-1等。蘋(píng)果沒(méi)有激活這個(gè)動(dòng)能,而是選擇使用MPEG LA合作伙伴開(kāi)發(fā)的行業(yè)標(biāo)準(zhǔn)。
我們不知道微軟是否獲得Windows Media IP對(duì)蘋(píng)果所購(gòu)買(mǎi)芯片的授權(quán),可還有一個(gè)更大的問(wèn)題就是蘋(píng)果需要問(wèn)他們不想使用的東西付錢(qián)。如今蘋(píng)果自己開(kāi)發(fā)視頻編碼器,他們就只需要針對(duì)支持的格式優(yōu)化,而不是芯片供應(yīng)商選擇的所有編解碼器。
谷歌的YouTube起初是與蘋(píng)果合作為iOS用戶提供H.264視頻內(nèi)容。不過(guò)谷歌有意完善他們從On2收購(gòu)來(lái)的VP8和VP9編解碼器。雖然YouTube還是繼續(xù)為iOS用戶提供H.264視頻,可是YouTube視頻沒(méi)有H.264格式或者更新的H.265/HEVC格式,所以Safari用戶無(wú)法在網(wǎng)頁(yè)上查看4K YouTube視頻。
所以你會(huì)看到Apple TV 4K也無(wú)法播放YouTube 4K內(nèi)容,這其實(shí)還是因?yàn)楣雀璨惶峁〢pple TV 4K可以解碼的內(nèi)容?,F(xiàn)在還不知道蘋(píng)果和谷歌會(huì)如何解決這個(gè)問(wèn)題,谷歌是不是繼續(xù)拒絕對(duì)iOS設(shè)備提供4K支持。
iPhone 7、iPhone 8和iPhone X中整合了高效、專門(mén)優(yōu)化的HEVC編碼器后,用戶存儲(chǔ)更多照片和視頻需要的空間卻更少??梢韵氲降氖?,這也能夠降低SSD存儲(chǔ)磨損,因?yàn)橛写蠹s一半東西會(huì)被寫(xiě)出、移動(dòng)然后突然抹去。
HEVC還支持錄制更高幀率的內(nèi)容。iPhone 8和iPhone X支持錄制4K 60fps視頻。iPhone 7錄制的4K視頻雖然也很清晰,但是如果錄制過(guò)程中攝像頭或拍攝對(duì)象的移動(dòng)速度過(guò)快,畫(huà)面就會(huì)出現(xiàn)抖動(dòng)。支持60fps幀率的話,視頻看起來(lái)就會(huì)更好。
不過(guò)幀率越好,如果沒(méi)有先進(jìn)的壓縮技術(shù),一分鐘的視頻可能會(huì)占據(jù)800MB空間。使用HEVC,4K 60fps視頻相比4K 30fps視頻占據(jù)的空間也沒(méi)有增加很多。在這里要提醒用戶,HEVC 60fps視頻需要強(qiáng)大的處理能力或者專門(mén)的硬件解碼器才能播放。舊款Mac播放iPhone 7錄制的4K視頻已經(jīng)非常吃力了。
雖然我們介紹了這么多關(guān)于A11仿生芯片的內(nèi)容,但是這塊芯片里還有很多未被公開(kāi)的秘密。
拆解iPhone8A11處理器內(nèi)部構(gòu)造
iPhone 8、iPhone 8 Plus和iPhone X均使用Apple A11 Bionic處理器,究竟這個(gè)處理器內(nèi)部有什么構(gòu)造,可以做到2+4核超強(qiáng)性能?最近有專業(yè)芯片拆解研究網(wǎng)站拆解了iPhone 8 Plus,看看A11處理器的構(gòu)造。
TechInsights(在2016年與Chipworks合并的研究機(jī)構(gòu))為iPhone 8 Plus作一次詳細(xì)的拆解,Chipworks過(guò)去多次拆解iPhone解構(gòu)處理器以及其他芯片的構(gòu)造,在2016年9月與TechInsights合并之后,兩者一起繼續(xù)拆解iPhone。在拆解了iPhone 8 Plus后,發(fā)現(xiàn)Apple A11 Bionic處理器的面積比Apple A10 Fusion少足30%,原因是A11用上更先進(jìn)的10nm制程以及遷就iPhone X主板大小,導(dǎo)致面積縮小。
A11處理器擁有6核心,2核高效4核省電,就算面積縮小,處理器仍內(nèi)藏復(fù)雜的結(jié)構(gòu),從TechInsights的圖片顯示A11處理器的6核分布在整體芯片的右方,2個(gè)CPU1是高效處理核心,占用面積較大,4個(gè)CPU2是省電處理核心,面積較小??偨Y(jié)而言處理核心占A11處理器面積的15%。
而A11處理器伺用較大的卻是圖像處理核心,占20%面積,擁有6核心,位置與A10 Fusion處理器相似。
iPhone 8 Plus主板芯片逐一踢爆
除了A11處理器之外,TechInsights也拍下了iPhone 8 Plus的主機(jī)板正反兩面照片,在A11處理器背面就有SK Hynix的3D NAND快閃儲(chǔ)存芯片和BCM59355無(wú)線充電芯片,而A11處理器那一面就分布了Micron 3GB LPDDR4 SDRAM、和NXP,有一點(diǎn)要留意的是因?yàn)樘O(píng)果和高通的官司關(guān)系iPhone 8 Plus嘗試擺脫高通,在Baseband以及LTE部分均用上了Intel芯片。
評(píng)論
查看更多