原創(chuàng):扣釘日記(微信公眾號ID:codelogs),歡迎分享,非公眾號轉(zhuǎn)載保留此聲明。
簡介
在之前的OOM問題復(fù)盤之后,本周,又一Java服務(wù)出現(xiàn)了內(nèi)存問題,這次問題不嚴(yán)重,只會觸發(fā)堆內(nèi)存占用高報(bào)警,沒有觸發(fā)OOM,但好在之前的復(fù)盤中總結(jié)了dump腳本,會在堆占用高時(shí)自動(dòng)執(zhí)行jstack與jmap,使得我們成功保留了問題現(xiàn)場。
查看堆占用分布
發(fā)現(xiàn)有heapdump文件后,我立馬拷貝到本機(jī),并使用MAT分析,如下:
很顯然,好像是什么接口分配了非常大的String對象,一個(gè)String對象約200MB,那它是哪分配的呢?
查找大對象分配線程
這個(gè)分配行為肯定是某個(gè)線程做的,而線程是最常見的GC Root,因此只要查找對象的GC Root即可,如下:
找到了大對象對應(yīng)的分配線程是http-nio-8088-exec-6,如下:
查看線程棧
如何查看這個(gè)線程在干什么呢?在MAT中摸索了一會,沒找到相關(guān)內(nèi)容,回想起我們的dump腳本中記錄了jstack,打開看看,如下:
可以發(fā)現(xiàn),這個(gè)線程正在做json序列化,但我仔細(xì)找了好一會,也沒有找到相關(guān)接口的Controller,這是因?yàn)榫€程已經(jīng)執(zhí)行完了Controller里面的邏輯,之后返回接口響應(yīng)數(shù)據(jù)時(shí)分配的大對象。
可是,線程棧中沒有業(yè)務(wù)代碼,就沒法定位是哪個(gè)接口有問題了。。。
檢查accesslog日志
考慮到分配大對象的接口肯定會很慢,于是我轉(zhuǎn)向查看tomcat的accesslog日志,如下:
終于,找到了問題接口,這個(gè)接口是用來查詢商品數(shù)據(jù)的,當(dāng)輸入3時(shí)會查詢出所有3開頭的商品,而這有20w+數(shù)據(jù),解決問題很簡單,加個(gè)limit完事。
排查過程復(fù)盤
然而,我一直有個(gè)習(xí)慣,就是解決一個(gè)問題后,我會反思一下問題解決過程中有多少運(yùn)氣成分。
如果你經(jīng)常閱讀排查問題類的技術(shù)文章,就會發(fā)現(xiàn)不少文章,中間突然有一步定位到了問題根因,可能是突然發(fā)現(xiàn)了一個(gè)線索,或是硬看代碼看出來的,或是猜測某處有問題,我覺得這種排查過程都有不少運(yùn)氣成分,我希望問題是通過多年理論基礎(chǔ)的積累和對診斷工具的熟練使用,而有章法的一步步查出來的。
而上面通過accesslog能夠定位到問題,有一定的運(yùn)氣成分,因?yàn)楸敬蝺?nèi)存問題不極端,如果此接口請求量大,那就會瞬間觸發(fā)多次FGC,進(jìn)而會影響其它接口也變慢,進(jìn)而無法分辨出哪個(gè)是導(dǎo)致問題的接口!
我想,從理論上來說,Java堆文件里面,應(yīng)該有線程棧以及線程棧上的參數(shù),因?yàn)榫€程是對象,參數(shù)也是對象,它們理應(yīng)都在堆里,于是我找了個(gè)空閑時(shí)間,又摸索起MAT這個(gè)工具了。
MAT查看線程棧
摸索了一會,我就發(fā)現(xiàn)有這樣一個(gè)按鈕,可以查看線程信息,如下:
找到前面說的線程http-nio-8088-exec-6,展開后,就可以發(fā)現(xiàn)線程棧以及棧上的參數(shù),如下:
這就找到了請求的Request參數(shù)對象,再將Request對象多次展開后,就可以找到接口url信息,如下:
嗯,這樣分析heapdump文件真tm的高效啊??
MAT下載地址:https://www.eclipse.org/mat/downloads.php
VisualVM查看線程棧
考慮到不少同學(xué)習(xí)慣用VisualVM分析heapdump,這里也放一下VisualVM的使用方法。
首先,加載heapdump文件,如下:
然后選擇相應(yīng)對象,右鍵選擇Select in Threads,如下:
定位到線程棧后,找到要查看的Request對象,點(diǎn)擊進(jìn)入,如下:
同樣,展開Request對象后,可找到url信息,如下:
VisualVM下載地址:https://visualvm.github.io/download.html
總結(jié)
雖然我也用MAT很多次了,但每次問題都太簡單,以至于沒有深入使用過MAT,導(dǎo)致到現(xiàn)在才知道有如此便捷的分析路徑。文章來源:http://www.zghlxwxcb.cn/news/detail-420724.html
如果你對我們的自動(dòng)dump腳本感興趣,可看看我之前寫的這兩篇文章。
一次線上OOM問題的個(gè)人復(fù)盤
jmap執(zhí)行失敗了,怎么獲取heapdump?文章來源地址http://www.zghlxwxcb.cn/news/detail-420724.html
到了這里,關(guān)于java獲取到heapdump文件后,如何快速分析?的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!