澳门博彩即时赔率,联众娱乐场官网金杯娱乐,88娱乐城开户地址(中国)·官方网站

編者按：筆者在 AArch64 中遇到一個 G1 GC 掛起，CPU 利用率高達(dá) 300%的案例。經(jīng)過分析發(fā)現(xiàn)問題是由 JVM 的鎖機(jī)制導(dǎo)致，該問題根因是并發(fā)編程中沒有正確理解內(nèi)存序?qū)е隆１疚闹亟榻B JVM 中 Monitor 的基本原理，同時演示了在什么情況下會觸發(fā)該問題。希望通過本文的分析，讀者能夠了解到內(nèi)存序?qū)π阅堋⒄_性的影響，在并發(fā)編程時更加仔細(xì)。

現(xiàn)象

本案例是一個典型的弱內(nèi)存模型案例，大致的現(xiàn)象就是 AArch64 平臺上，業(yè)務(wù)掛死，而進(jìn)程占用 CPU 持續(xù)維持在 300%。配合 top 和 gdb，可以看到是 3 個 GC 線程在 offer_termination 處陷入了死循環(huán)：

多個并行 GC 線程在 Minor GC 結(jié)束時調(diào)用 offer_termination，在 offer_termination 中自旋等待其他并行 GC 線程到達(dá)該位置，才說明 GC 任務(wù)完成，可以終止。（關(guān)于并行任務(wù)的中止協(xié)議問題，可以參考相關(guān)論文，這里不做著重介紹。

簡單地說，在并行任務(wù)執(zhí)行時，多個任務(wù)之間可能存在任務(wù)不均衡，所以 JVM 內(nèi)部設(shè)計了任務(wù)均衡機(jī)制，同時必須設(shè)計任務(wù)終止的機(jī)制來保證多個任務(wù)都能完成，這里的 offer_termination 就是嘗試終止任務(wù)）。

在該案例中，部分 GC 線程完成自己的任務(wù)，等待其他的 GC 線程。此時出現(xiàn)掛起，很有可能是因為發(fā)生了死鎖。所以問題很可能是由于那些尚未完成任務(wù)的 GC 線程上錯誤地使用鎖。所以使用 gdb 觀察了一下其他 GC 線程，發(fā)現(xiàn)其他 GC 線程全都阻塞在一把 JVM 的鎖上：

而這把 Monitor 中的情況如下：

cxq 上積累了大量 GC 線程

OnDeck 記錄的 GC 線程已經(jīng)消失

_owner 記錄的鎖持有者為 NULL

分析

在進(jìn)一步分析前，首先普及一下 JVM 鎖組件 Monitor 的基本原理，Monitor 類主要包含 4 個核心字段：

“Thread * volatile _owner” 字段指向這把鎖的持有線程

“SplitWord_LockWord” 字段被設(shè)計為 1 個機(jī)器字長，目的是為了確保操作時天然的原子性，它的最低位被設(shè)計為上鎖標(biāo)記位，而高位區(qū)域用來存放 256 字節(jié)對齊的競爭隊列(cxq)地址

“ParkEvent * volatile_EntryList” 字段指向一個等待隊列，跟 cxq 差別不大，個人理解只是為了緩解 cxq 的競爭壓力而設(shè)計

“ParkEvent * volatile_OnDeck” 字段指向這把鎖的法定繼承人，同時最低位還充當(dāng)了內(nèi)部鎖的角色

接下來通過一組流程圖來介紹加解鎖的具體流程：

上圖是加鎖的一個整體流程，大致分為 3 步：

首先走快速上鎖流程，主要對應(yīng)鎖本身無人持有的最理想情況

接著是自旋上鎖流程，這是預(yù)期將在短時間內(nèi)獲取鎖的情況

最后是慢速上鎖流程，申請者將會加入等待隊列(cxq)，然后進(jìn)入睡眠，直到被喚醒后發(fā)現(xiàn)自己變成了法定繼承者，于是進(jìn)入自旋，直到完成上鎖。

而且，基于性能考慮，整個上鎖流程中的每一步幾乎都做了“插隊”的嘗試：

如上圖代碼中所示，“插隊”的意思就是不經(jīng)過排隊(cxq)，直接嘗試置上鎖標(biāo)志位。

上圖就是整個解鎖流程了，顯然真正的解鎖操作在第二步中就已經(jīng)完成了(意味著接下來時刻有“插隊”現(xiàn)象發(fā)生)，剩下的主要就是選出繼承者的過程，大致分為以下幾步：

解鎖線程首先需要將內(nèi)部鎖(_OnDeck)標(biāo)記上鎖

從競爭隊列(cxq)抽取所有等待者放入等待隊列(_EntryList)

_ EntryList 取出頭一個元素，寫入_OnDeck 的同時解除內(nèi)部鎖標(biāo)記，這代表選出了繼承者

喚醒繼承者

當(dāng)然伴隨著整個解鎖流程每一步的，還有對“插隊”行為的處理。

至此，JVM 鎖組件 Monitor 的原理就介紹到這里，再回歸到問題本身，一個疑問就是_OnDeck 上記錄的繼承者為何消失？作為繼承者，既然已經(jīng)消失在競爭隊列和等待隊列里，顯然意味著它大概率已經(jīng)持有鎖、然后解鎖走人了，所以問題很可能跟繼承者選取過程有關(guān)。基于這種猜測，我們對相關(guān)代碼著重進(jìn)行了梳理，就發(fā)現(xiàn)了下圖兩處紅框標(biāo)記位置存在疑點，那就是在選繼承者過程第 3 步中：

寫EntryList 和寫_OnDeck 之間沒有 barrier 來保證執(zhí)行順序，這可能出現(xiàn)_OnDeck 先于EntryList 寫入的情況，一旦繼承人提前持有鎖，后果就可能非常糟糕…

這里貼了一張可能的問題場景：

線程 A 處于解鎖流程中，由于亂序，先寫入了繼承者同時解除內(nèi)部鎖

線程 B 處于上鎖流程，發(fā)現(xiàn)自己就是法定繼承者后，立刻完成上鎖

線程 B 又迅速進(jìn)入解鎖流程，并從_EntryList 中取出頭元素(也就是線程 B!)作為繼承者寫入_OnDeck，完成解鎖走人

線程 A 此時才更新_EntryList，然后喚醒繼承者(也就是線程 B!)，完成解鎖走人

_OnDeck 上的繼承者線程 B，實際已經(jīng)完成加解鎖離開，后續(xù)等待線程再也無法被喚醒。

正巧在社區(qū)的高版本上找到了一個相關(guān)的修復(fù)記錄(JDK- 8166197)，這里貼出 2 個關(guān)鍵的代碼片段：

上面這段代碼位于慢速上鎖流程，被喚醒后檢查繼承者是否是自己，修復(fù)后的代碼在讀_OnDeck 時加了 Load-Acquire 的 barrier。

上面這段代碼位于解鎖時選繼承者流程，從_ EntryList 取出頭一個元素，寫入_OnDeck 的同時解除內(nèi)部鎖標(biāo)記，修復(fù)后的代碼在寫_OnDeck 時加了 Store-Release 的 barrier。

顯然，圍繞_OnDeck 添加的這對 One-way barrier 可以確保：當(dāng)繼承者線程被喚醒時，該線程可以“看”到_EntryList 已經(jīng)被及時更新。

總結(jié)：

在 AArch64 這種弱內(nèi)存模型的平臺上（關(guān)于內(nèi)存序更多的知識在接下來的分享中會詳細(xì)介紹），一旦涉及多線程對公共內(nèi)存的每一次訪問，必須反復(fù)確認(rèn)是否需要通過 barrier 來嚴(yán)格保序，而且除非存在有效的依賴關(guān)系，否則 barrier 需要在讀寫端成對使用。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

cpu

cpu

+關(guān)注

關(guān)注
68

文章
10905

瀏覽量
213030
JVM

JVM

+關(guān)注

關(guān)注
0

文章
158

瀏覽量
12261

原文標(biāo)題：JVM 鎖 bug 導(dǎo)致 G1 GC 掛起問題分析和解決

文章出處：【微信號：openEulercommunity，微信公眾號：openEuler】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

CPU占用率過高的常見原因

排查系統(tǒng)問題時，CPU 飆升是一個常見的問題。

發(fā)表于 10-23 09:33 ?667次閱讀

UCD31xx器件中的CPU鎖定機(jī)制

電子發(fā)燒友網(wǎng)站提供《UCD31xx器件中的CPU鎖定機(jī)制.pdf》資料免費下載

發(fā)表于 10-15 10:18 ?0次下載

UCD31xx器件中的<b class='flag-5'>CPU</b>鎖定<b class='flag-5'>機(jī)制</b>

服務(wù)器cpu占用率高怎么解決

服務(wù)器CPU占用率高是一個常見的問題，它可能會導(dǎo)致服務(wù)器性能下降，甚至影響用戶體驗。一、了解服務(wù)器CPU

發(fā)表于 10-10 15:14 ?1120次閱讀

RK3588J正式發(fā)布Ubuntu桌面系統(tǒng)，絲滑又便捷！

顯示屏顯示的分辨率為修改后的分辨率，如下圖所示。圖 7 查看CPU占用率打開terminal窗口輸入命令查看CPU占用率，打開并拖動文件窗口，可以看見文件窗口拖動絲滑且

發(fā)表于 08-22 13:53

從原理聊JVM（一）：染色標(biāo)記和垃圾回收算法

導(dǎo)讀 JAVA簡單易用的特性，能夠讓研發(fā)人員在不了解JVM的底層運行機(jī)制的情況下依舊能夠編寫出功能完善的代碼。但是對JVM的理解，是一個程序員普通和優(yōu)秀的分水嶺。全面地了解JVM的工

發(fā)表于 08-20 15:25 ?290次閱讀

從原理聊<b class='flag-5'>JVM</b>（一）：染色標(biāo)記和垃圾回收算法

聊聊JVM如何優(yōu)化

首先應(yīng)該明確的是JVM調(diào)優(yōu)不是常規(guī)手段，JVM的存在本身就是為了減輕開發(fā)對于內(nèi)存管理的負(fù)擔(dān)，當(dāng)出現(xiàn)性能問題的時候第一時間考慮的是代碼邏輯與設(shè)計方案，以及是否達(dá)到依賴中間件的瓶頸，最后才是針對JVM

發(fā)表于 08-05 17:49 ?527次閱讀

JAVA應(yīng)用CPU跳點自動DUMP工具

問題。如果CPU使用率過高，可能表示系統(tǒng)存在資源瓶頸，需要進(jìn)行優(yōu)化或升級。 CPU監(jiān)控的難點現(xiàn)有的監(jiān)控平臺提供了多種方式來獲取容器和JVM的CPU

發(fā)表于 08-05 17:48 ?582次閱讀

自旋鎖和互斥鎖的使用場景是什么

自旋鎖和互斥鎖是兩種常見的同步機(jī)制，它們在多線程編程中被廣泛使用。在本文中，我們將介紹自旋鎖和互斥鎖的使用場景，以及它們在不同場景下的優(yōu)勢和

發(fā)表于 07-10 10:05 ?1110次閱讀

想通過perf工具來檢查2段不同代碼的內(nèi)存占用率，但一直沒找到，怎么辦？

想通過perf工具來檢查2段不同代碼的內(nèi)存占用率，但一直沒找到，怎么辦？

發(fā)表于 05-17 13:33

在DMA運行時，其他的數(shù)據(jù)轉(zhuǎn)移會不會因DMA占用導(dǎo)致這些東西延時處理？

DMA運行時占用系統(tǒng)總線，所以不經(jīng)過CPU，速度較快，但有一個問題我不清楚，在DMA運行時，其他的數(shù)據(jù)轉(zhuǎn)移例如引腳賦值、讀引腳、數(shù)組內(nèi)的數(shù)據(jù)處理等經(jīng)過CPU的數(shù)據(jù)傳輸會不會因DMA占用

發(fā)表于 05-15 07:45

恒訊科技全面解析：如何有效降低服務(wù)器CPU利用率？

。設(shè)置警報，以便在CPU使用率超過某個閾值時獲得通知。 2、識別高CPU使用率的原因：確定是特定進(jìn)程、應(yīng)用程序還是系統(tǒng)服務(wù)

發(fā)表于 05-10 17:24 ?812次閱讀

STM32F40使用三重ADC采集6通道數(shù)據(jù)，占用CPU時間很長導(dǎo)致采集的數(shù)據(jù)很小怎么解決？

發(fā)現(xiàn)占用CPU時間很長，有4us左右，導(dǎo)致采集的數(shù)據(jù)很小。如果注釋掉這條啟動代碼，通過測量，就不會占用4us的時間。

發(fā)表于 04-11 08:08

鴻蒙OS開發(fā)實例：【ArkTS類庫多線程CPU密集型任務(wù)TaskPool】

CPU密集型任務(wù)是指需要占用系統(tǒng)資源處理大量計算能力的任務(wù)，需要長時間運行，這段時間會阻塞線程其它事件的處理，不適宜放在主線程進(jìn)行。例如圖像處理、視頻編碼、數(shù)據(jù)分析等。基于多線程并發(fā)機(jī)制處理

發(fā)表于 04-01 22:25 ?901次閱讀

借助英特爾? QAT從而顯著提升網(wǎng)絡(luò)和存儲應(yīng)用的性能

全新第四代和第五代英特爾? 至強(qiáng)? 可擴(kuò)展處理器內(nèi)置英特爾? 數(shù)據(jù)保護(hù)與壓縮加速技術(shù)（英特爾? QAT），可通過卸載計算密集型工作負(fù)載來降低 CPU 占用率，從而顯著提升網(wǎng)絡(luò)和存儲應(yīng)用的性能。

發(fā)表于 03-18 16:25 ?1161次閱讀

pwm如何產(chǎn)生指定個數(shù)脈沖，而不占用cpu？

pwm如何產(chǎn)生指定個數(shù)脈沖，而不占用cpu？目前我能想到的辦法是:1.定時器產(chǎn)生一次中斷，在中斷函數(shù)里計數(shù)。這種方法頻繁中斷，影響cpu效率。并且當(dāng)所產(chǎn)生的pwm的周期無法保持連續(xù)性，會有某一個脈沖

發(fā)表于 03-14 06:34

那曲檬骨新材料有限公司

搜索歷史

由JVM的鎖機(jī)制導(dǎo)致的CPU占用率高問題

評論

CPU占用率過高的常見原因

UCD31xx器件中的CPU鎖定機(jī)制

服務(wù)器cpu占用率高怎么解決

RK3588J正式發(fā)布Ubuntu桌面系統(tǒng)，絲滑又便捷！

從原理聊JVM（一）：染色標(biāo)記和垃圾回收算法

聊聊JVM如何優(yōu)化

JAVA應(yīng)用CPU跳點自動DUMP工具

自旋鎖和互斥鎖的使用場景是什么

想通過perf工具來檢查2段不同代碼的內(nèi)存占用率，但一直沒找到，怎么辦？

在DMA運行時，其他的數(shù)據(jù)轉(zhuǎn)移會不會因DMA占用導(dǎo)致這些東西延時處理？

恒訊科技全面解析：如何有效降低服務(wù)器CPU利用率？

STM32F40使用三重ADC采集6通道數(shù)據(jù)，占用CPU時間很長導(dǎo)致采集的數(shù)據(jù)很小怎么解決？

鴻蒙OS開發(fā)實例：【ArkTS類庫多線程CPU密集型任務(wù)TaskPool】

借助英特爾? QAT從而顯著提升網(wǎng)絡(luò)和存儲應(yīng)用的性能

pwm如何產(chǎn)生指定個數(shù)脈沖，而不占用cpu？