0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Android ART在玄鐵C910上的移植和性能優(yōu)化

芯片開放社區(qū) ? 來源:芯片開放社區(qū) ? 2023-11-16 09:43 ? 次閱讀

在過去的3年里,我們在玄鐵C910上分別移植了Android 10和Android 12,在ART上我們也做了一些更加深入的優(yōu)化。在今年 RISC-V 美國峰會上,我們介紹了在ART上移植和優(yōu)化過程和最近進展,在本文中也將分享這些工作。

在進入ART優(yōu)化工作介紹前,先簡單看一下ART是什么。在Android中,所有的程序都是基于java來編寫的,Android SDK會把java字節(jié)碼轉(zhuǎn)換成dex字節(jié)碼。那么Android中的程序都離不開dex虛擬機。在Lolipop采用的是dalvikvm,而從Lolipop開始,ART替代了dalvikvm。

ART的執(zhí)行的過程概述

相比于dalvikvm,ART在最開始的時候(Lolipop),引入全新的執(zhí)行模式AHead-Of-Time(AOT)。應(yīng)用程序在安裝過程中,其.dex字節(jié)碼會被編譯成machine code,應(yīng)用程序會以machine code的方式執(zhí)行,大大提高了程序的執(zhí)行效率。

純AOT的方式會使程序的安裝過程變得非常長,因此在Android N的時候,引入新的JIT執(zhí)行流程。在JIT執(zhí)行模式下,應(yīng)用程序的dex字節(jié)碼(cold)會先通過解釋器(interpreter)進行解釋執(zhí)行,當發(fā)現(xiàn)其中的方法是熱點方法(hot)時,ART的JIT編譯器就會開始工作,將熱點方法編譯成machine code。在后續(xù)調(diào)用到該熱點方法時,將會采用machine code進行執(zhí)行。

dbd5a11c-83b3-11ee-939d-92fbcf53809c.png

ARTforRISC-V支持

在介紹完ART在Android上的基礎(chǔ)工作原理后,再來回顧一下玄鐵團隊在兩個Android版本上的支持情況。

Android10支持

2020年的時候,我們就開始了在Android 10上支持 RISC-V 的工作。前期工作主要包括內(nèi)核和驅(qū)動程序的準備,Clang編譯器和build系統(tǒng)的支持,Bionic庫支持,Shell啟動支持。

在此基礎(chǔ)上,ART先實現(xiàn)了JNI calling Convention和一些Runtime接口的支持,可以在20分鐘左右能啟動到Launcher界面。我們先后在ART上采用RV64GC指令集增加了Mterp匯編解釋器以及JIT/AOT編譯器,基于這兩個編譯器的優(yōu)化,極大提高了Launcher啟動時間,分別提高到10分鐘和1分鐘。

dbf018ee-83b3-11ee-939d-92fbcf53809c.png

Android12支持

2022年開始,我們又在Android 12上再一次支持了 RISC-V。有了前一次經(jīng)驗,在Android 12上的支持變得輕車熟路。相比于Android 10的移植工作,這一次有了新的硬件平臺TH1520,同時更新了Clang編譯,并采用玄鐵優(yōu)化的Clang15版本,也更新了Binonic。

在ART上,本次增加Nterp解釋器,用于減少方法調(diào)用的鏈路,提高頻繁方法調(diào)用場景下的性能。由于采用Clang15編譯器支持了玄鐵擴展指令集,因此在ART上也增加這一部分針對玄鐵的特性優(yōu)化。經(jīng)過一系列的優(yōu)化工作以后,Android 12在TH1520上在開啟更多的服務(wù)的情況下,Launcher啟動時間再一次得到提升,達到了47秒。

dc420320-83b3-11ee-939d-92fbcf53809c.png

社區(qū)貢獻

在移植Android的過程中,我們也積極參與社區(qū)的貢獻,避免大家重復(fù)造輪子。自2022年9月,我們在AOSP社區(qū)開始陸續(xù)提交相關(guān)的Porting改動。在ART上,目前貢獻超過了80個Commit。特別感謝來自Google的Vladimir Mark、Ulya Trofimovich和Santiago Aboy Solanes細致的代碼審查工作,完成代碼review、驗證以及修改,保證代碼高質(zhì)量合入。

dc81f52a-83b3-11ee-939d-92fbcf53809c.png

玄鐵擴展指令集優(yōu)化改進

在最近的優(yōu)化工作中,我們在ART中增加了玄鐵擴展指令的支持。玄鐵擴展指令主要分為整數(shù)計算、內(nèi)存讀寫、bit操作以及Vector v0.7指令集?;谶@些指令集,ART中的優(yōu)化內(nèi)容包括編譯器部分的優(yōu)化器、指令生成器,運行時庫的匯編解釋器、Quick Entries等等。除了在ART采用玄鐵擴展指令集進行優(yōu)化以外,還在Bionic中對C庫、數(shù)學庫進行了優(yōu)化。

dca7acb6-83b3-11ee-939d-92fbcf53809c.png

玄鐵擴展指令相比于RV64GC指令集,有較大的性能收益:

CaffeineMark,對于整數(shù)部分有超過15%的性能提升,對于浮點,方法調(diào)用也有4%的提升

SCIMath2,大部分用例都有超過15%的性能提升,小部分SOR/MonteCarlo提升并不明顯

其他一些編程語言上的結(jié)果也有較大的提升,最高的能達到約5倍

dcbe7e46-83b3-11ee-939d-92fbcf53809c.png

結(jié)語

RISC-V 在Android上才剛剛起步,ART上還有很多軟件、硬件的優(yōu)化需要繼續(xù)支持。非常幸運能參與這一歷史性的事情,與全球開發(fā)者共同推動Android在 RISC-V 上的適配。

希望社區(qū)里有興趣的同學可以關(guān)注 RISC-V Android SIG以及Google RISCV64社區(qū),共同討論參與貢獻。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Android
    +關(guān)注

    關(guān)注

    12

    文章

    3903

    瀏覽量

    126606
  • 移植
    +關(guān)注

    關(guān)注

    1

    文章

    375

    瀏覽量

    28011
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1602

    瀏覽量

    48894
  • RISC-V
    +關(guān)注

    關(guān)注

    44

    文章

    2141

    瀏覽量

    45705

原文標題:Android ART在玄鐵C910上的移植和性能優(yōu)化

文章出處:【微信號:芯片開放社區(qū),微信公眾號:芯片開放社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    平頭哥發(fā)布RISC-V處理器910 芯片成本降低一半

    7月25日,阿里巴巴旗下半導(dǎo)體公司平頭哥正式發(fā)布910(XuanTie910)。據(jù)介紹,
    發(fā)表于 07-25 15:30 ?1145次閱讀

    RISC-V生態(tài)大會深圳召開,達摩院引領(lǐng)RISC-V創(chuàng)新應(yīng)用

    :達摩院院長張建鋒RISC-V生態(tài)大會上致詞,RISC即將迎來蝶變進入應(yīng)用爆發(fā)期 ? 從2018年起,阿里巴巴開始投入RISC-V架構(gòu),是國內(nèi)最早涉足RISC-V的技術(shù)團隊之一。2019年
    的頭像 發(fā)表于 03-19 10:02 ?4089次閱讀
    <b class='flag-5'>玄</b><b class='flag-5'>鐵</b>RISC-V生態(tài)大會深圳召開,達摩院引領(lǐng)RISC-V創(chuàng)新應(yīng)用

    轉(zhuǎn)發(fā) Risc-V 平頭哥半導(dǎo)體將910移植至安卓10

    的意義。不禁用就沒有競爭力雖然,平頭哥的 Risc-V支持安卓對于備胎來說意義重大。但是ARM沒有禁止的時候,平頭哥的競爭力就非常有限了。910大致相當于A72的
    發(fā)表于 01-25 22:53

    平頭哥處理器Linux新版本,5大亮點速覽

    軟件形成持續(xù)保障。目前 linux 支持的系列 CPU 有:64位系列 (RISC-V):C910 三發(fā)射,深度亂序,12級流水線,搭載AI向量加速引擎的高性能多核處理器32位系列
    發(fā)表于 09-01 14:46

    阿里平頭哥宣布開源RISC-V系列處理器

    C906、C910等4款量產(chǎn)處理器IP,以及基于的多操作系統(tǒng)的全棧軟件及工具。開發(fā)者可通過平頭哥Github和芯片開放社區(qū)(Open Chip Community)下載
    發(fā)表于 10-20 14:09

    4款RISC-V芯片亮相

    了雙核C906處理器、0.5T NPU和Smart ISP等,是業(yè)內(nèi)同檔產(chǎn)品中集成度最高的產(chǎn)品之一。 晶視智能COO黃群輝介紹稱,平頭哥基于RISC-V視覺AI領(lǐng)域做了大量代碼
    發(fā)表于 03-08 08:16

    CPU調(diào)試系統(tǒng)介紹

    和 Segger 的 JLink。CPU 的調(diào)試模塊:系統(tǒng)調(diào)試的基礎(chǔ) 該模塊允許您控制 CPU 以及讀寫寄存器和內(nèi)存。二、CPU調(diào)試系統(tǒng)概述圖 2.1
    發(fā)表于 03-09 07:20

    軟硬件協(xié)同優(yōu)化,平頭哥斬獲MLPerf四項第一

    4月7日,全球權(quán)威AI基準測試MLPerf發(fā)布最新榜單,聚焦低功耗、高能效的IoT領(lǐng)域Tiny v0.7榜單中,基于平頭哥RISC-V C906處理器的軟硬件聯(lián)合
    發(fā)表于 04-08 14:47

    讀《RISC-V處理器入門與實戰(zhàn)》

    。 全方位的介紹,帶領(lǐng)我們了解RISC-V之性能強大,不再局限于一個跑馬燈、Hello World工程,而是開發(fā)高大的系統(tǒng)級應(yīng)用。未來RISC-V如果能在應(yīng)用碎片化、開發(fā)效率低、軟硬件適配難等問題上不斷優(yōu)化,相信將迎來更大的發(fā)
    發(fā)表于 09-28 11:58

    阿里平頭哥將全面開放910IPCore 對ARM影響幾何

    7月25日,阿里巴巴在上海舉辦了“2019 阿里云峰會”。本次會議,阿里巴巴詳細介紹了阿里的“All in Cloud”戰(zhàn)略,同時阿里旗下的平頭哥半導(dǎo)體還發(fā)布了號稱業(yè)界最強的高性能RISC-V處理器——
    發(fā)表于 07-26 15:58 ?1962次閱讀

    阿里發(fā)布新型910開源芯片

    性能表現(xiàn)910較主流的RISC-V指令性能
    的頭像 發(fā)表于 07-27 08:06 ?7602次閱讀

    阿里發(fā)布“910”芯片!開啟世界芯片歷史的一大步!

    阿里終于出手!國產(chǎn)芯片加速拋棄ARM!阿里此時推出“910”,一方面,是希望該芯片和金庸筆下的“重劍”一樣,重劍無鋒、大巧不工。
    的頭像 發(fā)表于 08-02 09:25 ?5244次閱讀

    阿里旗下半導(dǎo)體公司發(fā)布910嵌入式處理器

    阿里巴巴旗下半導(dǎo)體公司平頭哥今日正式發(fā)布910(XuanTie910)處理器,官方稱,
    發(fā)表于 08-07 17:12 ?1345次閱讀

    RISC-V可以支持Android 10了

    可以支持Android 10了!而千芯科技的tinyAI軟件包,成為了首個支持RISC-V 安卓的AI算法生態(tài)包! tinyAI 對RISC-V的AI強力加速與部署 平頭哥半導(dǎo)體發(fā)布的C9
    的頭像 發(fā)表于 01-29 09:35 ?3778次閱讀

    C910到底什么水平?

    C910采用了最先進的12級無序多問題超標量流水線,具有高頻率、IPC和功率效率的特點。此外,它還支持硬件緩存一致性,每個集群包含1~4個內(nèi)核,支持AXI4總線接口并包括一個設(shè)備一致性端口。
    的頭像 發(fā)表于 03-14 15:57 ?4094次閱讀
    <b class='flag-5'>玄</b><b class='flag-5'>鐵</b><b class='flag-5'>C910</b>到底什么水平?