0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

畢昇JDK8和JDK11首次同時發(fā)布兩個版本

openEuler ? 來源:openEuler ? 作者:openEuler ? 2021-10-28 10:53 ? 次閱讀

2021 年 9 月 30 日,畢昇 JDK update Q3 版本正式發(fā)布,本次發(fā)布將包含 X86_64 版本。此前,畢昇 JDK 只發(fā)布 Aarch64 版本,這可能會對運維產(chǎn)生一定的影響,例如需要根據(jù)架構(gòu)構(gòu)建多個版本以包含不同架構(gòu)的 JDK,此次畢昇 JDK 同時發(fā)布 X86_64 版本以及 Aarch64 版本,將極大的方便用戶進(jìn)行構(gòu)建,降低維護(hù)多個版本的開銷。另外,X86_64 版本和 Aarch64 版本共源,所以 X86_64 版本也包含此前畢昇 JDK 團(tuán)隊在 Aarch64 上的功能和大部分優(yōu)化,在功能和性能方面,兩者幾乎無差異。歡迎用戶安裝使用,為產(chǎn)品帶來核心競爭力。

此次版本在同步 OpenJDK 社區(qū) 8u302/11.0.12 的基礎(chǔ)上,還包含如下更新,為用戶提供高性能、可用于生產(chǎn)環(huán)境的 OpenJDK 發(fā)行版。

PS 優(yōu)化——Introduce UsePSRelaxedForwardee to enable using relaxed CAS in copy_to_survivor_space(畢昇 JDK8,畢昇 JDK11)

G1 GC 優(yōu)化——Parallel Full GC for G1(畢昇 JDK8)

提供鯤鵬硬件加速的 KAEProvider(畢昇 JDK11)

支持按進(jìn)程 id 和時間戳生成 jfr 文件(畢昇 JDK8,畢昇 JDK11)

Bug fixes

1 PS:introduce UsePSRelaxedForwardee to enable using relaxed CAS in copy_to_survivor_space(畢昇 JDK8,畢昇 JDK11)1.1 背景

在 JDK 中 Parallel Scavenge 是一個高吞吐量 GC,使用非常廣泛。在 specjbb 測試中,PSPromotionManager::copy_to_survivor_space 中的 CAS 指令 CPU 占比非常高,主要為 releasebarrier 導(dǎo)致,分析 PS 邏輯后,CAS 沒必要使用 memory barrier,使用 relaxed 可以提高弱內(nèi)存模型架構(gòu)上 PS 的性能。

1.2 實現(xiàn)原理

PS 的主要邏輯如下:

d9a8c0e4-3780-11ec-82a8-dac502259ad0.png

由上述流程圖可以看到,CAS Fail 的線程不會去讀 forwardee 內(nèi)容,因此在弱內(nèi)存模型的 CPU 架構(gòu)上,即使 copy obj 和 CAS 亂序,也不會影響 CAS Fail 線程的正確性。

關(guān)于 work steal 場景,其他線程 steal 到的 obj 能否看到其內(nèi)容,這個是由 CAS 成功的 push 操作保證的,由于 push 操作底層實現(xiàn)有 release 語義,所以無正確性問題。

da19726c-3780-11ec-82a8-dac502259ad0.png

da961bdc-3780-11ec-82a8-dac502259ad0.png

使用參數(shù)

UsePSRelaxedForwardee:試驗特性開關(guān),默認(rèn)為 false,表示 PSPromotionManager::copy_to_survivor_space 中 CAS forwardee 使用 release 語義;打開則表示 CAS forwardee 的時候使用 relaxed(無任何 memory barrier),以在弱內(nèi)存模型 CPU 架構(gòu)上獲取更好性能。

1.3 性能測試

測試環(huán)境:

Architecture: aarch64

Byte Order: Little Endian

CPU(s): 128

On-line CPU(s) list: 0-127

Thread(s) per core: 1

Core(s) per socket: 64

Socket(s): 2

NUMA node(s): 4

Vendor ID: 0x48

Model: 0

Stepping: 0x1

BogoMIPS: 200.00

L1d cache: 64K

L1i cache: 64K

L2 cache: 512K

L3 cache: 65536K

NUMA node0 CPU(s): 0-31

NUMA node1 CPU(s): 32-63

NUMA node2 CPU(s): 64-95

NUMA node3 CPU(s): 96-127

使用 specjbb2015 進(jìn)行測試,除 UsePSRelaxedForwardee 開關(guān)以外的測試參數(shù)如下:

-Xms50g -Xmx50g -XX:+UseParallelGC -XX:ParallelGCThreads=24 -XX:+UseLargePages -XX:LargePageSizeInBytes=2m -XX:+UseBiasedLocking -XX:+AlwaysPreTouch -XX:-UseAdaptiveSizePolicy

測試結(jié)果:

db1f3912-3780-11ec-82a8-dac502259ad0.png

測試結(jié)果:從上圖可以看到,針對 SPECjbb 的 critical,畢昇 JDK8 可以提升 15%,畢昇 JDK11 可以提升 28%

2 Parallel Full GC for G1. (畢昇 JDK8)2.1 概述

G1 Full GC 是完全的 STW,在此期間應(yīng)用程序線程完全沒有機會運行,長時間停頓會造成用戶明顯的感知。因此,使用 G1 過程中應(yīng)盡量避免的 Full GC 的出現(xiàn),如果出現(xiàn)最好能縮短其時間。當(dāng)前 JDK 8u 中 G1 Full GC 完全采用串行,包括:

各階段之間,包括標(biāo)記存活對象、計算目標(biāo)對象的位置、更新引用的位置、移動對象完成壓縮階段;

每個階段內(nèi);

完全的串行導(dǎo)致即使是在多核機器上也無法利用機器的強大性能縮短 Full GC 的(停頓)時間。

由于 G1 Full GC 基本算法的約束,雖然上面提到的四個階段之間無法并行化,但是各個階段內(nèi)卻可以通過優(yōu)化算法做到一定并行化,以達(dá)到縮短整體停頓時間的效果。本特性會將計算目標(biāo)對象的位置、更新引用的位置、移動對象完成壓縮三個階段盡量做到階段內(nèi)的并行化。(標(biāo)記存活對象階段的并行化后續(xù)也會支持)

開啟本特性后,可以明顯降低 G1 Full GC 的平均停頓時間。本特性屬于通用特性,適用于 Aarch64、X86 平臺。

2.2 實現(xiàn)原理

2.2.1 并行 Full GC 基本算法

如下列出了并行 Full GC 算法與串行 Full GC 算法的主要差異點:

將整個堆分成不同的 heap region set 交給各個 GC 線程分別處理,盡量減少 GC 線程間同步、競爭;

G1 Full GC 現(xiàn)有實現(xiàn)是將整個堆向一個方向(目標(biāo)地址)壓縮;要做到并行化,并減少并行 GC 線程間的交互、競爭,有效的方式是每個 GC 線程有自己壓縮的方向(目標(biāo)地址)。

大對象的特殊處理:在計算目標(biāo)對象位置并行階段結(jié)束后,才能釋放 free 的 humongous region;

2.2.2 計算目標(biāo)對象位置階段的并行化

計算目標(biāo)對象位置階段主要負(fù)責(zé)

根據(jù)標(biāo)記信息設(shè)置對象的 forwardee。

釋放沒有被標(biāo)記的 humongous regions。

Forwardee 的設(shè)置需要預(yù)先知道目標(biāo)地址,該目標(biāo)地址是通過 Compaction Point 維護(hù)著。在遍歷 heap region 時每當(dāng)發(fā)現(xiàn)一個新的標(biāo)記的對象,就將 Compaction Point 里記錄的目標(biāo)地址設(shè)置為該對象的 forwardee,然后再將 Compaction Point 里記錄的目標(biāo)地址加上對象的大小,作為下次 forwardee 設(shè)置的值。如此往復(fù),直至每一個標(biāo)記的對象都被 forwarded。

并行地設(shè)置對象的 Forwardee 是通過 1)隔離各個 GC 線程的遍歷的 heap region,2)隔離各個 GC 線程要為 forwardee 設(shè)置的目標(biāo)地址來達(dá)成的。具體實現(xiàn)是,1)通過標(biāo)記 region 來隔離各個 GC 線程遍歷的 heap regions,2)通過為每個 GC 線程維護(hù)一個 Compaction Point 來隔離 forwardee 的設(shè)置??梢岳斫鉃閷⒄麄€ heap 被分成了 N 份(GC 線程個數(shù)為 N),每一份由一個 GC 線程負(fù)責(zé),各個線程盡量互不干擾地工作。

除此之外,每個 GC 線程的 Compaction Point 還負(fù)責(zé)收集屬于該 GC 線程的 regions、humongous regions,以便后續(xù)(壓縮階段)處理。

Free 的大對象在計算目標(biāo)對象位置階段就會被釋放。由于大對象的特殊性(可能包括多個 heap region)加之多個 GC 線程在同時工作,需要對其進(jìn)行一些特殊處理:如,在計算目標(biāo)對象位置并行階段結(jié)束后,才能釋放 free 的 humongous region,以避免多個 GC 線程訪問同一個大對象的不同 region 時可能面臨的數(shù)據(jù)不一致問題。

2.2.3 更新引用位置階段的并行化

更新引用位置階段主要負(fù)責(zé)根據(jù)對象的 forwardee 信息更新所有引用。

此階段的并行化比較簡單,因為需要的所有信息都只在對象頭中(forwardee),并行化和串行化的算法差別很小,不同點只是每個 GC 線程要標(biāo)記屬于自己處理范圍的 heap region。

2.2.4 移動對象完成壓縮階段的并行化

移動對象完成壓縮階段主要負(fù)責(zé)根據(jù)對象的 forwardee 信息進(jìn)行壓縮。

每個 GC 線程都有屬于自己的 Compaction Point,在計算目標(biāo)對象位置階段 Compaction Point 中收集了需要該 GC 線程壓縮的 region 的集合。對于單個 GC 線程來說,整個過程與串行差別不大,只是需要從自己的 Compaction Point 中取出 regions,進(jìn)行壓縮。

使用參數(shù):

本特性需要通過 VM option -XX:+G1ParallelFullGC 顯示打開,默認(rèn)為關(guān)閉。

注意,本特性會帶來如下 JVM 停頓時間上的收益:

降低單次 G1 Full GC 的停頓時間;

降低總的 G1 Full GC 的停頓時間;

但是,有可能會增加 G1 Full GC 的頻率。所以,當(dāng)降低 JVM 的停頓時間是應(yīng)用程序的性能調(diào)優(yōu)目標(biāo)之一時,且 G1 Full GC 是停頓原因之一時,適用于打開 G1ParallelFullGC VM Option,降低單次平均、總的停頓時間。

2.3 性能測試

測試套:Dacapo

測試參數(shù):

JVM:-Xmx1g -Xms1g -XX:ParallelGCThreads=$N

Dacapo:-t 4 --iterations 5 --size huge --no-pre-iteration-gc h2

下面分別給出了并行 GC 線程數(shù)量分別為 4、16 時 Full GC 停頓時間的數(shù)據(jù)

N == 4

N == 16

測試結(jié)果:受益(STW 時間減少)基本在 16%~40%。

3 提供鯤鵬硬件加速的 KAEProvider(畢昇 JDK11)該特性已在早期的畢昇 JDK 8u282 中支持,詳見2021 年畢昇 JDK 的第一個重要更新來了,并在 8u292 版本中對其功能進(jìn)行完善,詳見畢昇 JDK 8u292、11.0.11 發(fā)布!, 此次將在畢昇 JDK11 中對該特性進(jìn)行支持。

3.1 實現(xiàn)原理和性能測試

實現(xiàn)原理和性能測試請參考鯤鵬硬件加解密特性詳解。 但由于 JDK11 引入了模塊系統(tǒng),因此用戶使用時需要將 KAEProvider 所在的模塊(jdk.crypto.kaeprovider)進(jìn)行導(dǎo)出,如下為畢昇 JDK11 中 KAEProvider 相關(guān)的文件:

ddbf7af6-3780-11ec-82a8-dac502259ad0.png

具體導(dǎo)出命令可參考如下格式:

編譯:javac --add-modules jdk.crypto.kaeprovider --add-exports=jdk.crypto.kaeprovider/org.openeuler.security.openssl=ALL-UNNAMED DHTest.java

運行:java --add-modules jdk.crypto.kaeprovider --add-exports=jdk.crypto.kaeprovider/org.openeuler.security.openssl=ALL-UNNAMED DHTest

4 支持按進(jìn)程 id 和時間戳生成 jfr 文件(畢昇 JDK8,畢昇 JDK11)4.1 說明

該特性用來擴展 JFR 文件名,支持在文件名中加入進(jìn)程號或時間戳或兩者都加,當(dāng)用戶在環(huán)境上生成多個 jfr 文件時,該特性可以幫助用戶根據(jù)需要快速定位到所需的文件。

4.2 功能測試

未合入此特性:

java -XX:+UnlockCommercialFeatures -XX:+FlightRecorder -XX:StartFlightRecording=duration=10s,filename=myrecording%t.jfr While

de499916-3780-11ec-82a8-dac502259ad0.png

合入此特性:

java -XX:+UnlockCommercialFeatures -XX:+FlightRecorder -XX:StartFlightRecording=duration=10s,filename=myrecording%t.jfr While

dec45660-3780-11ec-82a8-dac502259ad0.png

5 Bug fixes除了上面介紹的一些特性外,畢昇 JDK 還合入了社區(qū)高版本中的一些 bug fix 和優(yōu)化的 patch,為用戶提供穩(wěn)定、高性能的畢昇 JDK。具體回合 patch 如下:

JDK8

8197387:jcmd started by “root” must be allowed to access all VM processes 允許通過 root 啟動的 jcmd 訪問環(huán)境上任意的 JVM 進(jìn)程,默認(rèn)情況下,進(jìn)程只能被啟動該進(jìn)程的用戶通過 jcmd 訪問。

8069191:moving predicate out of loops may cause array accesses to bypass null check 修復(fù) c2 在 aarch64 上可能會 crash 的 bug

8167014: jdeps: Missing message: warn.skipped.entry 該修復(fù)可以解決通過 jdeps 解析特定的 jar 包出現(xiàn)的 Missing message: warn.skipped.entry 錯誤

8268453: sun/security/pkcs12/EmptyPassword.java fails with Sequence tag error 該修復(fù)可以解決當(dāng)對密碼為空的 KeyStore 進(jìn)行解析時,可能會出現(xiàn)的 java.io.IOException: Sequence tag error 問題

8202142:jfr/event/io/TestInstrumentation is unstable JDK 自帶用例修復(fù)

8143251:HeapRetentionTest.java Test is failing on jdk9/dev 該修復(fù)可以解決 G1 GC 在特定場景下導(dǎo)致進(jìn)程假死的問題

8183543:Aarch64: C2 compilation often fails with “failed spill-split-recycle sanity check” 修復(fù) C2 編譯器在某些場景下編譯方法時報failed spill-split-recycle sanity check錯誤,導(dǎo)致方法被解釋執(zhí)行,進(jìn)而造成應(yīng)用程序性能下降的問題

JDK11

8268427: Improve AlgorithmConstraints:checkAlgorithm performance 該 patch 可以提升 TLS 的握手性能

8257145: Performance regressionwith -XX:-ResizePLABafter JDK-8079555 該 patch 可以修復(fù)使用 G1 GC 后,HBase 性能下降的問題,詳細(xì)原理可參考畢昇 JDK 以前的文章JDK 從 8 升級到 11,使用 G1 GC,HBase 性能下降近 20%。JDK 到底干了什么?

8247691:[aarch64] Incorrect handling of VM exceptions in C1 deopt stub/traps 該修復(fù)可以解決 C1 編譯器生成指令過程中使用錯誤的寄存器,進(jìn)而導(dǎo)致進(jìn)程 Crash 的問題

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • JVM
    JVM
    +關(guān)注

    關(guān)注

    0

    文章

    157

    瀏覽量

    12197
  • CAS
    CAS
    +關(guān)注

    關(guān)注

    0

    文章

    34

    瀏覽量

    15178
  • JDK
    JDK
    +關(guān)注

    關(guān)注

    0

    文章

    81

    瀏覽量

    16567

原文標(biāo)題:畢昇JDK8和JDK11首次同時發(fā)布Aarch64和X86_64兩個版本

文章出處:【微信號:openEulercommunity,微信公眾號:openEuler】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Java CompletableFuture 異步超時實現(xiàn)探索

    簡介 JDK 8 中 CompletableFuture 沒有超時中斷任務(wù)的能力?,F(xiàn)有做法強依賴任務(wù)自身的超時實現(xiàn)。本文提出一種異步超時實現(xiàn)方案,解決上述問題。 前言 JDK 8 是一
    的頭像 發(fā)表于 07-25 14:06 ?291次閱讀

    JDK8升級JDK11最全實踐干貨來了

    1、前言 截至目前(2023年),Java8發(fā)布至今已有9年,2018年9月25日,Oracle發(fā)布了Java11,這是Java8之后的首個
    的頭像 發(fā)表于 06-25 14:51 ?389次閱讀
    <b class='flag-5'>JDK8</b>升級<b class='flag-5'>JDK11</b>最全實踐干貨來了

    JDK11升級JDK17最全實踐干貨來了

    解決你的問題。 上篇文章給大家?guī)砹?b class='flag-5'>JDK8升級JDK11的最全實踐,相信大家閱讀后已經(jīng)對JDK11有了比較深入的了解。2021年9月14日,Oracle發(fā)布了可以長期支持的
    的頭像 發(fā)表于 06-25 14:50 ?651次閱讀
    <b class='flag-5'>JDK11</b>升級<b class='flag-5'>JDK</b>17最全實踐干貨來了

    大模型應(yīng)用開發(fā)平臺+浪潮信息AIStation,讓大模型定制更簡單

    北京2024年6月5日?/美通社/ -- 近日,大模型應(yīng)用開發(fā)平臺與浪潮信息AIStation智能業(yè)務(wù)生產(chǎn)創(chuàng)新平臺完成兼容性互認(rèn)證?;?b class='flag-5'>畢和浪潮信息AIStation,用戶通過預(yù)
    的頭像 發(fā)表于 06-05 11:58 ?378次閱讀
    <b class='flag-5'>畢</b><b class='flag-5'>昇</b>大模型應(yīng)用開發(fā)平臺+浪潮信息AIStation,讓大模型定制更簡單

    請問ad9171的兩個輸出端口是否支持同時輸出兩個不同的頻率?

    你好,關(guān)于AD9171芯片我有一問題 ,數(shù)據(jù)手冊顯示該芯片具有兩個輸出通道,芯片內(nèi)部有DAC0和DAC1共兩個DAC通道,那么這兩個通道是否支持
    發(fā)表于 05-28 06:20

    示波器兩個探頭地線為什么不能同時接在電路上

    電路上 示波器兩個探頭地線不能同時接在電路上是因為電路存在接地問題。例如,如果兩個地線同時連接到電路上,它們就會形成一回路。這會導(dǎo)致電流在
    的頭像 發(fā)表于 02-26 11:31 ?898次閱讀
    示波器<b class='flag-5'>兩個</b>探頭地線為什么不能<b class='flag-5'>同時</b>接在電路上

    一文了解Java 21的新功能

    JDK 21 于 2023 年 9 月 19 日發(fā)布,是繼之前的 LTS 版本 JDK 17 之后最新的長期支持 (LTS) 版本。在本文中
    的頭像 發(fā)表于 12-21 16:19 ?1233次閱讀
    一文了解Java 21的新功能

    stm32一定時器能同時控制兩個燈以不同頻率閃爍嗎?

    STM32的定時器功能強大,**STM32的定時器可以同時控制兩個燈以不同頻率閃爍** 。
    的頭像 發(fā)表于 12-13 10:43 ?1921次閱讀

    如何配置jdk的環(huán)境變量

    /javase-jdk11-downloads.html)選擇適合您操作系統(tǒng)的JDK版本,并下載它。 第二步:安裝JDK 下載完成后,運行JDK
    的頭像 發(fā)表于 12-06 15:07 ?774次閱讀

    idea的jdk配置在哪

    。 第一步:安裝JDK 首先,我們需要在計算機上安裝JDK??梢詮腛racle官方網(wǎng)站下載JDK的安裝包。在下載過程中,請注意選擇與您的操作系統(tǒng)相匹配的版本。 下載完成后,雙擊安裝包進(jìn)
    的頭像 發(fā)表于 12-06 15:04 ?2456次閱讀

    如何在eclipse配置jdk環(huán)境

    版本。確保選擇與您正在使用的Eclipse版本相對應(yīng)的JDK版本。一旦下載完成,運行安裝程序并按照提示完成安裝。 啟動Eclipse 在成功安裝并設(shè)置好Eclipse后,雙擊Eclip
    的頭像 發(fā)表于 12-06 11:49 ?1578次閱讀

    eclipse配置servers識別不到jdk

    Eclipse是一廣泛使用的集成開發(fā)環(huán)境(IDE),它可以幫助開發(fā)人員編寫、調(diào)試和測試許多編程語言。在使用Eclipse時,可能會遇到配置servers時無法識別JDK的問題,這會導(dǎo)致項目無法正常
    的頭像 發(fā)表于 12-06 11:41 ?806次閱讀

    weblogic修改jdk路徑

    WebLogic是一流行的Java應(yīng)用服務(wù)器,可以用于部署和管理企業(yè)級Java應(yīng)用程序。在WebLogic的安裝和配置過程中,我們可能會遇到需要修改JDK(Java Development Kit
    的頭像 發(fā)表于 12-05 14:46 ?1224次閱讀

    谷歌商店將推出兩個版本鑰匙

    USB-C連接(35美元)或USB-a連接(30美元),與2021年發(fā)布的前幾個版本一樣,這兩個版本都具有NFC功能,可以無線連接到手機和其他移動設(shè)備。 有鑒于遭竊的密碼是網(wǎng)絡(luò)安全最大
    的頭像 發(fā)表于 11-20 16:55 ?777次閱讀

    JDK11升級JDK17最全實踐

    2021年9月14日,Oracle發(fā)布了可以長期支持的JDK17版本,那么從JDK11JDK17,到底帶來了哪些特性呢?亞毫秒級的ZGC效
    的頭像 發(fā)表于 11-17 10:36 ?1444次閱讀
    <b class='flag-5'>JDK11</b>升級<b class='flag-5'>JDK</b>17最全實踐