對象存活判斷
在堆里存放著幾乎所有的 Java 對象實例,在 GC 執(zhí)行垃圾回收之前,首先需要區(qū)分出內(nèi)存中哪些是存活對象,哪些是已經(jīng)死亡的對象。只有被標記為己經(jīng)死亡的對象,GC 才會在執(zhí)行垃圾回收時,釋放掉其所占用的內(nèi)存空間,因此這個過程我們可以稱為垃圾標記階段。
那么在 JVM 中究竟是如何標記一個死亡對象呢?簡單來說,當一個對象已經(jīng)不再被任何的存活對象繼續(xù)引用時,就可以宣判為已經(jīng)死亡。
判斷對象存活一般有兩種方式:引用計數(shù)算法 和 可達性分析算法。
標記階段:引用計數(shù)算法
方式一:引用計數(shù)算法
引用計數(shù)算法(Reference Counting)比較簡單,對每個對象保存一個整型的引用計數(shù)器屬性。用于記錄對象被引用的情況。
對于一個對象 A,只要有任何一個對象引用了 A,則 A 的引用計數(shù)器就加 1;當引用失效時,引用計數(shù)器就減 1。只要對象 A 的引用計數(shù)器的值為 0,即表示對象 A 不可能再被使用,可進行回收。
優(yōu)點:實現(xiàn)簡單,垃圾對象便于辨識;判定效率高,回收沒有延遲性。
缺點:
-
它需要單獨的字段存儲計數(shù)器,這樣的做法增加了存儲空間的開銷。
-
每次賦值都需要更新計數(shù)器,伴隨著加法和減法操作,這增加了時間開銷。
-
引用計數(shù)器有一個嚴重的問題,即無法處理循環(huán)引用的情況。這是一條致命缺陷,導致在 Java 的垃圾回收器中沒有使用這類算法。
循環(huán)引用
當 p 的指針斷開的時候,內(nèi)部的引用形成一個循環(huán),這就是循環(huán)引用
舉例
測試 Java 中是否采用的是引用計數(shù)算法
public class RefCountGC {
? ?// 這個成員屬性的唯一作用就是占用一點內(nèi)存
? ?private byte[] bigSize = new byte[5*1024*1024];
? ?// 引用
? ?Object reference = null;
?
? ?public static void main(String[] args) {
? ? ? ?RefCountGC obj1 = new RefCountGC();
? ? ? ?RefCountGC obj2 = new RefCountGC();
?
? ? ? ?obj1.reference = obj2;
? ? ? ?obj2.reference = obj1;
?
? ? ? ?obj1 = null;
? ? ? ?obj2 = null;
? ? ? ?// 顯示的執(zhí)行垃圾收集行為
? ? ? ?// 這里發(fā)生GC,obj1和obj2是否被回收?
? ? ? ?System.gc();
? }
}
// 運行結(jié)果 PSYoungGen: 15490K->808K(76288K)] 15490K->816K(251392K)
上述進行了 GC 收集的行為,所以可以證明 JVM 中采用的不是引用計數(shù)器的算法
小結(jié)
引用計數(shù)算法,是很多語言的資源回收選擇,例如因人工智能而更加火熱的 Python,它更是同時支持引用計數(shù)和垃圾收集機制。
具體哪種最優(yōu)是要看場景的,業(yè)界有大規(guī)模實踐中僅保留引用計數(shù)機制,以提高吞吐量的嘗試。
Java 并沒有選擇引用計數(shù),是因為其存在一個基本的難題,也就是很難處理循環(huán)引用關(guān)系。
Python 如何解決循環(huán)引用?
-
手動解除:很好理解,就是在合適的時機,解除引用關(guān)系。 使用弱引用 weakref,weakref 是 Python 提供的標準庫,旨在解決循環(huán)引用。
標記階段:可達性分析算法
可達性分析算法(根搜索算法、追蹤性垃圾收集)
相對于引用計數(shù)算法而言,可達性分析算法不僅同樣具備實現(xiàn)簡單和執(zhí)行高效等特點,更重要的是該算法可以有效地解決在引用計數(shù)算法中循環(huán)引用的問題,防止內(nèi)存泄漏的發(fā)生。
相較于引用計數(shù)算法,這里的可達性分析就是 Java、C#選擇的。這種類型的垃圾收集通常也叫作追蹤性垃圾收集(Tracing Garbage Collection)
所謂"GCRoots”根集合就是一組必須活躍的引用。
基本思路
-
可達性分析算法是以根對象集合(GCRoots)為起始點,按照從上至下的方式搜索被根對象集合所連接的目標對象是否可達。
-
使用可達性分析算法后,內(nèi)存中的存活對象都會被根對象集合直接或間接連接著,搜索所走過的路徑稱為引用鏈(Reference Chain)
-
如果目標對象沒有任何引用鏈相連,則是不可達的,就意味著該對象己經(jīng)死亡,可以標記為垃圾對象。
-
在可達性分析算法中,只有能夠被根對象集合直接或者間接連接的對象才是存活對象。
?
在 Java 語言中,GC Roots 包括以下幾類元素:
-
虛擬機棧中引用的對象
-
比如:各個線程被調(diào)用的方法中使用到的參數(shù)、局部變量等。
-
-
本地方法棧內(nèi) JNI(通常說的本地方法)引用的對象
-
方法區(qū)中類靜態(tài)屬性引用的對象
-
比如:Java 類的引用類型靜態(tài)變量
-
-
方法區(qū)中常量引用的對象
-
比如:字符串常量池(String Table)里的引用
-
-
所有被同步鎖 synchronized 持有的對象
-
Java 虛擬機內(nèi)部的引用。
-
基本數(shù)據(jù)類型對應的 Class 對象,一些常駐的異常對象(如:NullPointerException、OutOfMemoryError),系統(tǒng)類加載器。
-
-
反映 java 虛擬機內(nèi)部情況的 JMXBean、JVMTI 中注冊的回調(diào)、本地代碼緩存等。
?
除了這些固定的 GC Roots 集合以外,根據(jù)用戶所選用的垃圾收集器以及當前回收的內(nèi)存區(qū)域不同,還可以有其他對象“臨時性”地加入,共同構(gòu)成完整 GC Roots 集合。比如:分代收集和局部回收(PartialGC)。
如果只針對 Java 堆中的某一塊區(qū)域進行垃圾回收(比如:典型的只針對新生代),必須考慮到內(nèi)存區(qū)域是虛擬機自己的實現(xiàn)細節(jié),更不是孤立封閉的,這個區(qū)域的對象完全有可能被其他區(qū)域的對象所引用,這時候就需要一并將關(guān)聯(lián)的區(qū)域?qū)ο笠布尤?GCRoots 集合中去考慮,才能保證可達性分析的準確性。
小技巧:由于 Root 采用棧方式存放變量和指針,所以如果一個指針,它保存了堆內(nèi)存里面的對象,但是自己又不存放在堆內(nèi)存里面,那它就是一個 Root。
注意
如果要使用可達性分析算法來判斷內(nèi)存是否可回收,那么分析工作必須在一個能保障一致性的快照中進行。這點不滿足的話分析結(jié)果的準確性就無法保證。
這點也是導致 GC 進行時必須“stop The World”的一個重要原因。
-
即使是號稱(幾乎)不會發(fā)生停頓的 CMS 收集器中,枚舉根節(jié)點時也是必須要停頓的。
對象的 finalization 機制
Java 語言提供了對象終止(finalization)機制來允許開發(fā)人員提供對象被銷毀之前的自定義處理邏輯。
當垃圾回收器發(fā)現(xiàn)沒有引用指向一個對象,即:垃圾回收此對象之前,總會先調(diào)用這個對象的 finalize()方法。
finalize() 方法允許在子類中被重寫,用于在對象被回收時進行資源釋放。通常在這個方法中進行一些資源釋放和清理的工作,比如關(guān)閉文件、套接字和數(shù)據(jù)庫連接等。
永遠不要主動調(diào)用某個對象的 finalize()方法 I 應該交給垃圾回收機制調(diào)用。理由包括下面三點:
-
在 finalize()時可能會導致對象復活。
-
finalize()方法的執(zhí)行時間是沒有保障的,它完全由 GC 線程決定,極端情況下,若不發(fā)生 GC,則 finalize()方法將沒有執(zhí)行機會。
-
一個糟糕的 finalize()會嚴重影響 Gc 的性能。
從功能上來說,finalize()方法與 C++中的析構(gòu)函數(shù)比較相似,但是 Java 采用的是基于垃圾回收器的自動內(nèi)存管理機制,所以 finalize()方法在本質(zhì)上不同于 C++中的析構(gòu)函數(shù)。
由于 finalize()方法的存在,虛擬機中的對象一般處于三種可能的狀態(tài)。
生存還是死亡?
如果從所有的根節(jié)點都無法訪問到某個對象,說明對象己經(jīng)不再使用了。一般來說,此對象需要被回收。但事實上,也并非是“非死不可”的,這時候它們暫時處于“緩刑”階段。一個無法觸及的對象有可能在某一個條件下“復活”自己,如果這樣,那么對它的回收就是不合理的,為此,定義虛擬機中的對象可能的三種狀態(tài)。如下:
-
可觸及的:從根節(jié)點開始,可以到達這個對象。
-
可復活的:對象的所有引用都被釋放,但是對象有可能在 finalize()中復活。
-
不可觸及的:對象的 finalize()被調(diào)用,并且沒有復活,那么就會進入不可觸及狀態(tài)。不可觸及的對象不可能被復活,因為finalize()只會被調(diào)用一次。
以上 3 種狀態(tài)中,是由于 inalize()方法的存在,進行的區(qū)分。只有在對象不可觸及時才可以被回收。
具體過程
判定一個對象 objA 是否可回收,至少要經(jīng)歷兩次標記過程:
-
如果對象 objA 到 GC Roots 沒有引用鏈,則進行第一次標記。
-
進行篩選,判斷此對象是否有必要執(zhí)行 finalize()方法
-
如果對象 objA 沒有重寫 finalize()方法,或者 finalize()方法已經(jīng)被虛擬機調(diào)用過,則虛擬機視為“沒有必要執(zhí)行”,objA 被判定為不可觸及的。
-
如果對象 objA 重寫了 finalize()方法,且還未執(zhí)行過,那么 objA 會被插入到 F-Queue 隊列中,由一個虛擬機自動創(chuàng)建的、低優(yōu)先級的 Finalizer 線程觸發(fā)其 finalize()方法執(zhí)行。
-
finalize()方法是對象逃脫死亡的最后機會,稍后 GC 會對 F-Queue 隊列中的對象進行第二次標記。如果 objA 在 finalize()方法中與引用鏈上的任何一個對象建立了聯(lián)系,那么在第二次標記時,objA 會被移出“即將回收”集合。之后,對象會再次出現(xiàn)沒有引用存在的情況。在這個情況下,finalize 方法不會被再次調(diào)用,對象會直接變成不可觸及的狀態(tài),也就是說,一個對象的 finalize 方法只會被調(diào)用一次。
舉例
public class CanReliveObj {
? ?// 類變量,屬于GC Roots的一部分
? ?public static CanReliveObj canReliveObj;
?
? ?@Override
? ?protected void finalize() throws Throwable {
? ? ? ?super.finalize();
? ? ? ?System.out.println("調(diào)用當前類重寫的finalize()方法");
? ? ? ?canReliveObj = this;
? }
?
? ?public static void main(String[] args) throws InterruptedException {
? ? ? ?canReliveObj = new CanReliveObj();
? ? ? ?canReliveObj = null;
? ? ? ?System.gc();
? ? ? ?System.out.println("-----------------第一次gc操作------------");
? ? ? ?// 因為Finalizer線程的優(yōu)先級比較低,暫停2秒,以等待它
? ? ? ?Thread.sleep(2000);
? ? ? ?if (canReliveObj == null) {
? ? ? ? ? ?System.out.println("obj is dead");
? ? ? } else {
? ? ? ? ? ?System.out.println("obj is still alive");
? ? ? }
?
? ? ? ?System.out.println("-----------------第二次gc操作------------");
? ? ? ?canReliveObj = null;
? ? ? ?System.gc();
? ? ? ?// 下面代碼和上面代碼是一樣的,但是 canReliveObj卻自救失敗了
? ? ? ?Thread.sleep(2000);
? ? ? ?if (canReliveObj == null) {
? ? ? ? ? ?System.out.println("obj is dead");
? ? ? } else {
? ? ? ? ? ?System.out.println("obj is still alive");
? ? ? }
?
? }
}
運行結(jié)果文章來源:http://www.zghlxwxcb.cn/news/detail-606687.html
-----------------第一次gc操作------------ 調(diào)用當前類重寫的finalize()方法 obj is still alive -----------------第二次gc操作------------ obj is dead
在第一次 GC 時,執(zhí)行了 finalize 方法,但 finalize()方法只會被調(diào)用一次,所以第二次該對象被 GC 標記并清除了。文章來源地址http://www.zghlxwxcb.cn/news/detail-606687.html
到了這里,關(guān)于對象存活判斷的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!