引用計數 Python預設的垃圾收集機制是“引用計數”,每個對象維護了一個ob_ref欄位。它的優點是機制簡單,當新的引用指向該對象時,引用計數加1,當一個對象的引用被銷毀時減1,一旦對象的引用計數為0,該對象立即被回收,所占用的記憶體將被釋放。它的缺點是需要額外的空間維護引用計數,不過最主要的問題是
-
引用計數
Python預設的垃圾收集機制是“引用計數”,每個對象維護了一個ob_ref欄位。它的優點是機制簡單,當新的引用指向該對象時,引用計數加1,當一個對象的引用被銷毀時減1,一旦對象的引用計數為0,該對象立即被回收,所占用的記憶體將被釋放。它的缺點是需要額外的空間維護引用計數,不過最主要的問題是它不能解決“迴圈引用”。
什麼是迴圈引用?A和B相互引用而再沒有外部引用A與B中的任何一個,它們的引用計數雖然都為1,但顯然應該被回收,例子:
a = { } # a 的引用為 1 b = { } # b 的引用為 1 a['b'] = b # b 的引用增 1,b的引用為2 b['a'] = a # a 的引用增 1,a的引用為 2 del a # a 的引用減 1,a的引用為 1 del b # b 的引用減 1, b的引用為 1
在這個例子中,del語句減少了 a 和 b 的引用計數並刪除了用於引用的變數名,可是由於兩個對象各包含一個對方對象的引用,雖然最後兩個對象都無法通過名字訪問了,但引用計數並沒有減少到零。因此這個對象不會被銷毀,它會一直駐留在記憶體中,這就造成了記憶體泄漏。為瞭解決迴圈引用問題,Python引入了標記-清除和分代回收兩種GC機制。
-
標記清除
標記——清除(Mark——Sweep)是一種基於追蹤(Tracing)回收技術實現的垃圾回收演算法,對象之間通過引用(指針)連在一起,構成一個有向圖,對象構成這個有向圖的節點,而引用關係構成這個有向圖的邊。從根對象(root object)出發,沿著有向邊遍歷對象,可達的對象標記為有用的對象,不可達的對象就是要被清除的對象。所謂根對象就是一些全局引用對象和函數棧中的引用,這些引用所引用的對象是不可被刪除的。
標記清除演算法作為Python的輔助垃圾收集技術主要處理的是一些容器對象,比如list、dict、tuple,instance等,因為對於字元串、數值對象是不可能造成迴圈引用問題。Python使用一個雙向鏈表將這些容器對象組織起來。
-
分代回收
分代回收是一種以空間換時間的操作方式,Python將記憶體根據對象的存活時間劃分為不同的集合,每個集合稱為一個代,Python將記憶體分為了3“代”,分別為年輕代(第0代)、中年代(第1代)、老年代(第2代),他們對應的是3個鏈表,它們的垃圾收集頻率與對象的存活時間的增大而減小。新創建的對象都會分配在年輕代,年輕代鏈表的總數達到上限時,Python垃圾收集機制就會被觸發,把那些可以被回收的對象回收掉,而那些不會回收的對象就會被移到中年代去,依此類推,老年代中的對象是存活時間最久的對象,甚至是存活於整個系統的生命周期內。同時,分代回收是建立在標記清除技術基礎之上。
分代回收同樣作為Python的輔助垃圾收集技術處理那些容器對象
FROM: http://foofish.net/blog/94/python-gc