国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Java線上服務(wù)CPU、內(nèi)存飆升問題排查步驟!

這篇具有很好參考價值的文章主要介紹了Java線上服務(wù)CPU、內(nèi)存飆升問題排查步驟!。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

java程序內(nèi)存占用過高原因,自動化測試,程序人生,軟件測試,java,jvm,開發(fā)語言,程序人生,自動化測試

01 引言

作為一名從事Java開發(fā)快一年的程序員,在線上經(jīng)常碰到某個模塊的Pod發(fā)出CPU與內(nèi)存告警的問題,而這些問題會導致系統(tǒng)響應(yīng)緩慢甚至是服務(wù)不可用。一般情況下可以通過重啟或者調(diào)高Pod的資源量或者增加Pod數(shù)量暫時解決問題,但這是治標不治本的,只有找到問題發(fā)生的原因才能從根本上解決問題。那么在該如何快速定位到導致告警的原因呢?下面將匯總一下大致的處理思路。

一般來說導致Java程序CPU與內(nèi)存沖高的原因有兩種:

  • 代碼中某個位置讀取數(shù)據(jù)量較大,導致系統(tǒng)內(nèi)存耗盡,從而導致Full GC次數(shù)過多,系統(tǒng)緩慢。

  • 代碼中有比較耗CPU的操作,導致CPU過高,系統(tǒng)運行緩慢。

  • 代碼某個位置有阻塞性的操作,導致該功能調(diào)用整體比較耗時,但出現(xiàn)是比較隨機的;

  • 某個線程由于某種原因而進入WAITING狀態(tài),此時該功能整體不可用,但是無法復現(xiàn);

  • 由于鎖使用不當,導致多個線程進入死鎖狀態(tài),從而導致系統(tǒng)整體比較緩慢。

前兩種情況出現(xiàn)的頻率較高,可能會導致系統(tǒng)不可用,后三種會導致某個功能運行緩慢,但是不至于導致系統(tǒng)不可用。

對于第一種情況,本人曾經(jīng)遇到過某個查全量數(shù)據(jù)的接口在某段時間被頻繁調(diào)用導致內(nèi)存耗盡、瘋狂GC的情況:記一次GC導致的CPU與內(nèi)存沖高的問題解決。下面將總結(jié)一些具體的排查步驟。

02 分析工具

01 top命令查看CPU占用情況

PID為進程編號,COMMAND為其中執(zhí)行命令,java即為要找的應(yīng)用

  • top: 展示所有進程占用情況

  • top -N num: 展示CPU占用最高的num個進程

root@8d36124607a0:/# top

top - 14:01:23 up 1 day, 17:54,  1 user,  load average: 0.00, 0.01, 0.05Tasks: 101 total,   1 running, 100 sleeping,   0 stopped,   0 zombie%Cpu(s):  0.8 us,  1.2 sy,  0.0 ni, 98.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 stKiB Mem :  3782864 total,  1477524 free,   329656 used,  1975684 buff/cacheKiB Swap:        0 total,        0 free,        0 used.  3181392 avail Mem
  PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
  9   root      20   0 1031064  52580  19248 S  90.3 10.4  26:30.37 javacatalina.sh
 
root@8d36124607a0:/# top -Hp 9

top - 08:31:16 up 30 min,  0 users,  load average: 0.75, 0.59, 0.35Threads:  11 total,   1 running,  10 sleeping,   0 stopped,   0 zombie%Cpu(s):  3.5 us,  0.6 sy,  0.0 ni, 95.9 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 stKiB Mem:   2046460 total,  1924856 used,   121604 free,    14396 buffersKiB Swap:  1048572 total,        0 used,  1048572 free.  1192532 cached Mem  PID USER      PR  NI    VIRT    RES    SHR S %CPU %MEM     TIME+ COMMAND
   10 root      20   0 2557160 289824  15872 R 79.3 14.2   0:41.49 java
   11 root      20   0 2557160 289824  15872 S 1.2  14.2   0:06.78 java

可以看到占用CPU消耗最高的PID為10,該ID即為線程ID,使用如下命令將其轉(zhuǎn)化為16進制格式:

root@8d36124607a0:/# printf "%x\n" 10

得到輸出a線程即為0xa。

02 用jstack查看Java線程信息

  • jstack?進程號 | grep 線程ID:查看線程堆棧信息,將上一步驟的Java線程進程ID與CPU占用量較高的線程ID(16進制格式)填入其中。

  • jstack pid >> stack.txt:將今后曾所有堆棧信息都打印到stack.txt中

root@8d36124607a0:/# jstack 9 | grep 0xa

"VM Thread" os_prio=0 tid=0x00007f871806e000 nid=0xa runnable”

第一個雙引號圈起來的就是線程名,如果是“VM Thread”這就是虛擬機GC回收線程,如果是"main"則是其他線程,后面的runnable是線程狀態(tài)。

03 使用jstat查看GC信息

  • jstat -gcutil 進程號?統(tǒng)計間隔毫秒 統(tǒng)計次數(shù)(缺省代表一直統(tǒng)計)

root@8d36124607a0:/# jstat -gcutil 9 1000 10

  S0     S1     E      O      M     CCS    YGC     YGCT    FGC    FGCT     GCT  0.00   0.00   0.00  75.07  59.09  59.60   3259    0.919  6517    7.715    8.635
  0.00   0.00   0.00   0.08  59.09  59.60   3306    0.930  6611    7.822    8.752
  0.00   0.00   0.00   0.08  59.09  59.60   3351    0.943  6701    7.924    8.867
  0.00   0.00   0.00   0.08  59.09  59.60   3397    0.955  6793    8.029    8.984
 

查看某進程GC持續(xù)變化情況,如果發(fā)現(xiàn)返回中FGC很大且一直增大,確認為Full GC! 也可以使用“jmap -heap 進程ID”查看一下進程的堆內(nèi)從是不是要溢出了,特別是老年代內(nèi)從使用情況一般是達到閾值(具體看垃圾回收器和啟動時配置的閾值)就會進程Full GC。

04 使用Jmap分析內(nèi)存

  • jmap -dump:format=b,file=文件名稱 進程ID?:

    生成內(nèi)存dump文件,進行離線分析。

  • dump文件界面分析工具:

    IBM HeapAnalyzer,點擊進入找到ha457.jar的下載鏈接進行下載

  • java -Xmx4G -jar ha457.jar:

    運行jar文件,如果dump文件過大可以使用-Xmx設(shè)置最大堆內(nèi)存大小,防止內(nèi)存溢出。

通過ha457.jar的GUI界面可以很清晰的看到各種類型的數(shù)據(jù)內(nèi)存占用情況、對象之間的引用關(guān)系以及可能存在內(nèi)存泄漏的對象。

java程序內(nèi)存占用過高原因,自動化測試,程序人生,軟件測試,java,jvm,開發(fā)語言,程序人生,自動化測試

03 原因分析

01 Full GC次數(shù)過多

相對來說,這種情況是最容易出現(xiàn)的,尤其是新功能上線時。對于Full GC較多的情況,其主要有如下兩個特征:

  • 線上多個線程的CPU都超過了100%,通過jstack命令可以看到這些線程主要是垃圾回收線程

  • 通過jstat命令監(jiān)控GC情況,可以看到Full GC次數(shù)非常多,并且次數(shù)在不斷增加。

初步排查:使用top與top -Hp命令找到CPU占用最高的Java線程,將其轉(zhuǎn)為16進制后,使用jstack命令抓取該線程信息,發(fā)現(xiàn)線程名稱是"VM Thread"垃圾回收線程。


進一步確認:?使用jstat -gcutil命令查看gc次數(shù)與增長情況。
進一步分析:使用jmap -dump命令dump內(nèi)存,然后使用使用ha457.jar離線分析。

  • 生成大量的對象,導致內(nèi)存溢出

  • 內(nèi)存占用不高,但是Full GC次數(shù)還是比較多,此時可能是代碼中手動調(diào)用?System.gc()導致GC次數(shù)過多。

02 某個業(yè)務(wù)邏輯執(zhí)行時間過長

如果是Full GC次數(shù)過多,那么通過 jstack得到的線程信息會是類似于VM Thread之類的線程,而如果是代碼中有比較耗時的計算,那么我們得到的就是一個線程的具體堆棧信息。

如下是一個代碼中有比較耗時的計算,導致CPU過高的線程信息:

java程序內(nèi)存占用過高原因,自動化測試,程序人生,軟件測試,java,jvm,開發(fā)語言,程序人生,自動化測試

這里可以看到,在請求UserController的時候,由于該Controller進行了一個比較耗時的調(diào)用,導致該線程的CPU一直處于100%。

我們可以根據(jù)堆棧信息,直接定位到UserController的34行,查看代碼中具體是什么原因?qū)е掠嬎懔咳绱酥摺?/p>

03 死鎖

如果有死鎖,會直接提示。關(guān)鍵字:deadlock。使用jstack打印線程信息會打印出業(yè)務(wù)死鎖的位置。

java程序內(nèi)存占用過高原因,自動化測試,程序人生,軟件測試,java,jvm,開發(fā)語言,程序人生,自動化測試

04 線程一直處于WAITTING狀態(tài)

對于這種情況,這是比較罕見的一種情況,但是也是有可能出現(xiàn)的,而且由于其具有一定的 “不可復現(xiàn)性”,因在排查的時候是非常難以發(fā)現(xiàn)的。

某個線程由于某種原因而進入WAITING狀態(tài),此時該功能整體不可用,但是無法復現(xiàn)。jstack多查詢幾次,每次間隔30秒,對比一直停留在parking 導致的WAITING狀態(tài)的線程。

可以通過給線程命名快速定位到是哪個業(yè)務(wù)代碼。

05 隨機出現(xiàn)大量線程訪問接口緩慢

對于這種情況,比較典型的例子就是,我們某個接口訪問經(jīng)常需要2~3s才能返回。

這是比較麻煩的一種情況,因為一般來說,其消耗的CPU不多,而且占用的內(nèi)存也不高,也就是說,我們通過上述兩種方式進行排查是無法解決這種問題的。

而且由于這樣的接口耗時比較大的問題是不定時出現(xiàn)的,這就導致了我們在通過 jstack命令即使得到了線程訪問的堆棧信息,我們也沒法判斷具體哪個線程是正在執(zhí)行比較耗時操作的線程。

對于不定時出現(xiàn)的接口耗時比較嚴重的問題,我們的定位思路基本如下:

首先找到該接口,通過壓測工具不斷加大訪問力度,如果說該接口中有某個位置是比較耗時的,由于我們的訪問的頻率非常高,那么大多數(shù)的線程最終都將阻塞于該阻塞點

這樣通過多個線程具有相同的堆棧日志,我們基本上就可以定位到該接口中比較耗時的代碼的位置。

如下是一個代碼中有比較耗時的阻塞操作通過壓測工具得到的線程堆棧日志:

java程序內(nèi)存占用過高原因,自動化測試,程序人生,軟件測試,java,jvm,開發(fā)語言,程序人生,自動化測試

從上面的日志可以看你出,這里有多個線程都阻塞在了UserController的第18行,說明這是一個阻塞點,也就是導致該接口比較緩慢的原因。

04 總結(jié)

1、排查命令總結(jié)

  • top:

    查看系統(tǒng)進程CPU與內(nèi)存占用情況,找到占用最多的進程ID

  • top -Hp 進程號:

    查看該進程號的所有線程CPU與內(nèi)存占用情況,找到占用最多的線程ID(顯示的PID即為10進制線程編號,printf "%x\n" 進程號轉(zhuǎn)為16進制線程號)

  • jstack 進程號 >> stack.txt:

    將進程號所屬進程的堆棧信息輸出到stack.txt中

  • jstack 進程號 | grep 16進制線程號:

    查看進程號先所屬線程的堆棧信息,可查看線程名,區(qū)分出普通線程與GC線程("VM Thread")。

  • jstat -gcutil 進程號?統(tǒng)計間隔毫秒 統(tǒng)計次數(shù)(缺省代表一直統(tǒng)計):

    如果是因為GC問題,進一步觀察GC情況

  • jmap -heap 進程ID:

    查看詳細進程內(nèi)存使用信息

  • jmap -dump:format=b,file=文件名稱 進程ID:

    將進程內(nèi)存信息dump到磁盤上供進一步分析。

  • java -Xmx4G -jar ha457.jar:

    使用ha457.jar來分析內(nèi)存泄漏情況。

2、異常情況解決總結(jié)

  • GC問題:

    top+top -Hp + jstack排查是"VM Thread"消耗過多資源,可以進一步使用jmap工具進行內(nèi)存溢出排查。

  • 業(yè)務(wù)執(zhí)行過慢問題:

    top+top -Hp + jstack排查發(fā)現(xiàn)是普通業(yè)務(wù)線程,可看到具體是哪個接口。

  • 死鎖:

    jstack + Java進程打印堆棧信息中包含死鎖信息deadlock

  • 線程處于waiting狀態(tài):

    多打印幾次jstack信息,對比一直停留在waiting狀態(tài)的線程。

最后:下方這份完整的軟件測試視頻教程已經(jīng)整理上傳完成,需要的朋友們可以自行領(lǐng)取【保證100%免費】

java程序內(nèi)存占用過高原因,自動化測試,程序人生,軟件測試,java,jvm,開發(fā)語言,程序人生,自動化測試

我們學習必然是為了找到高薪的工作,下面這些面試題是來自阿里、騰訊、字節(jié)等一線互聯(lián)網(wǎng)大廠最新的面試資料,并且有字節(jié)大佬給出了權(quán)威的解答,刷完這一套面試資料相信大家都能找到滿意的工作。

java程序內(nèi)存占用過高原因,自動化測試,程序人生,軟件測試,java,jvm,開發(fā)語言,程序人生,自動化測試

整套資料獲取

java程序內(nèi)存占用過高原因,自動化測試,程序人生,軟件測試,java,jvm,開發(fā)語言,程序人生,自動化測試

??文章來源地址http://www.zghlxwxcb.cn/news/detail-601063.html

到了這里,關(guān)于Java線上服務(wù)CPU、內(nèi)存飆升問題排查步驟!的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 【面試】線上 CPU 100% 問題排查

    【面試】線上 CPU 100% 問題排查

    回答套路一般為:線上服務(wù)器沒有排查過,線上服務(wù)器只有運維才有操作權(quán)限。在平時開發(fā)的時候,在測試服務(wù)器上排查過。 2.1、將代碼打包成 jar 包 參考: 點我 2.2、傳到服務(wù)并運行 運行好的效果如下 3.1、拿到進程 id 通過 top 命令,就可以看到讓 cpu 100% 的進程 id,pid 就是

    2024年02月11日
    瀏覽(28)
  • 【面試】線上Java程序占用 CPU 過高請說一下排查方法?

    【面試】線上Java程序占用 CPU 過高請說一下排查方法?

    這個問題可以說是 Java 面試的高頻面試題了,有很多面試官都喜歡問這個問題,問題可能是下面這樣的。 線上一臺服務(wù)器 CPU 使用率100% 了,如果你碰到這樣的情況,如何排查并找到問題原因? 這就是一個套路題,所謂套路題就是有標準的套路解法的,掌握了套路,不僅能解

    2024年02月09日
    瀏覽(25)
  • 得物-Golang-記一次線上服務(wù)的內(nèi)存泄露排查

    得物-Golang-記一次線上服務(wù)的內(nèi)存泄露排查

    在風和日麗的一天,本人正看著需求、敲著代碼,展望美好的未來。突然收到一條內(nèi)存使用率過高的告警。 告警的這個項目,老代碼是python的,最近一直在go化。隨著go化率不斷上升,發(fā)現(xiàn)內(nèi)存的RSS使用率越飆越高。最終達到容器內(nèi)存限制后,進程會自動重啟。RSS如下圖所示

    2024年02月04日
    瀏覽(20)
  • JVM-Cpu飆升排查及解決

    https://blog.csdn.net/m0_37542440/article/details/123679011 1. 問題情況 在服務(wù)器上執(zhí)行某個任務(wù)時,系統(tǒng)突然運行緩慢,top 發(fā)現(xiàn)cpu飆升,一度接近100%,最終導致服務(wù)假死。 2. 問題排查 1. 執(zhí)行 “top” 命令:查看所有進程占系統(tǒng)cpu的排序,極大可能排第一的就是自己的java進程,pid就是進

    2024年02月15日
    瀏覽(21)
  • 如何解決vscode頻繁喚起git for Windows 導致電腦內(nèi)存占用多大,cpu占用率飆升、風扇狂轉(zhuǎn)問題

    如何解決vscode頻繁喚起git for Windows 導致電腦內(nèi)存占用多大,cpu占用率飆升、風扇狂轉(zhuǎn)問題

    親愛的小伙伴,你是不是發(fā)現(xiàn)最近電腦風扇狂轉(zhuǎn),在打開任務(wù)管理器后發(fā)現(xiàn) git for window 占用了大量的cup和內(nèi)存。不要擔心,一招教你解決這個問題。 如下圖, 希望可以幫助到你喲!

    2024年02月12日
    瀏覽(80)
  • 【Java高CPU占用排查步驟】

    當Java應(yīng)用程序在Linux系統(tǒng)上的CPU使用率達到100%時,可能會導致系統(tǒng)響應(yīng)變慢,甚至無響應(yīng),影響應(yīng)用程序的正常運行。下面是排查Java應(yīng)用程序CPU使用率高的步驟: 可以使用top命令查看Linux系統(tǒng)上Java進程的CPU使用率,找到占用CPU資源較高的進程??梢园凑誄PU使用率排序,找到

    2024年02月10日
    瀏覽(29)
  • springboot應(yīng)用,cpu高、內(nèi)存高問題排查

    springboot應(yīng)用,cpu高、內(nèi)存高問題排查

    前幾天,排查了2個生產(chǎn)問題。一個cpu高,一個內(nèi)存高。今天把解決過程整理一下 先說cpu高的這個問題 新系統(tǒng),上線半年,一直比較穩(wěn)定。有一天,運維過來說:cpu有點高,超過80%了。這個系統(tǒng)的量沒有那么大,也沒有什么很復雜的計算任務(wù)。cpu不應(yīng)該這么高。 1.1、獲取棧日

    2024年02月19日
    瀏覽(21)
  • Java進程CPU高負載排查步驟

    Java進程CPU高負載排查步驟

    近期發(fā)現(xiàn)服務(wù)器Java進程負載,超過100% 登錄服務(wù)器,執(zhí)行top命令,查看CPU占用情況,找到進程的pid 很容易發(fā)現(xiàn),PID為29706的java進程的CPU飆升到700%多,且一直降不下來,很顯然出現(xiàn)了問題。 使用 top -Hp pid 命令(為Java進程的id號)查看該Java進程內(nèi)所有線程的資源占用情況 很容

    2024年02月14日
    瀏覽(21)
  • 服務(wù)器卡頓、CPU飆升、接口負載劇增,如何定位到Java代碼?

    服務(wù)器卡頓、CPU飆升、接口負載劇增,如何定位到Java代碼?

    ??本文收錄于,Java基礎(chǔ)教程(進階篇)。 目前已經(jīng)800+訂閱,CSDN最強Java專欄,包含全部Java基礎(chǔ)知識點、Java8新特性、Java集合、Java多線程、Java代碼實例,理論結(jié)合實戰(zhàn),實現(xiàn)Java的輕松學習。 解決這個問題的關(guān)鍵是要找到Java代碼的位置。下面分享一下排查思路,以CentOS為例

    2024年02月11日
    瀏覽(17)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包