一般和以下两个模块相关
import gc
import sys
高级语言一般都有垃圾回收机制,其中c、c++使用的是用户自己管维护内存的方式,这种方式比较自由,但如果回收不当也会引起垃内存泄露等问题。而python采用的是引用计数机制为主,标记-清理和分代收集两种机制为辅的策略。
内存垃圾回收时机:
1.调用gc.collect();
2.当gc模块的计数器达到阀值的时候;
3.程序退出的时候。
引用计数
python中一切皆对象,所以python底层计数结构地就可以抽象为:
引用计数结构体{
引用计数
引用的对象
}
对象什么情况下会被删除:引用计数=0
什么情况下引用计数+1,什么情况下-1,当引用次数为0时,肯定就是需要进行回收的时刻。
引用计数+1的情况
1、对象被创建时,例如a=“hello zzy”
2、对象被copy引用时,例如 b=a,此时a引用计数+1
3、对象被作为参数,传入到一个函数中时
4、对象作为一个子元素,存储到容器中时,例如 list=[a,b]
引用计数-1的情况
1、对象别名被显示销毁,例如 del a
2、对象引用被赋予新的对象,例如b=c,此时b引用计数-1(对照引用计数+1的情况下的第二点来看)
3、一个函数离开他的作用域,例如函数执行完成,它的引用参数的引用计数-1
4、对象所在容器被销毁,或者从容器中删除。
统计引用计数的方法:
import sys
print(sys.getrefcount(xxx引用))
标记-清除
如果单一使用引用计数回收,有个问题无法解决:
arr1 = [1]
arr2 = [2]
arr1.append(arr2)
arr2.append(arr1)
print(sys.getrefcount(arr1))
print(sys.getrefcount(arr2))
现在单独靠引用计数不能删除
需要使用标记清除的办法:
所有无法从0级引用出发找到的内存都会标记为可清除,而后垃圾回收会清理它们
分代收集
经过上面的【引用计数】及【标记-清理】方法,已经可以保证对垃圾的回收了,但还有一个问题,垃圾回收会对所有引用进行遍历辨识是否需要垃圾回收,系统性能会因此受到影响,那么python对此做出了优化性能的做法:分代回收机制
Python将所有的对象分为0,1,2三代。所有的新建对象都是0代对象。当某一代对象经历过垃圾回收,依然存活,那么它就被归入下一代对象。垃圾回收启动时,一定会扫描所有的0代对象。如果0代经过一定次数垃圾回收,那么就启动对0代和1代的扫描清理。当1代也经历了一定次数的垃圾回收后,那么会启动对0,1,2,即对所有对象进行扫描。
import gc
print(gc.get_threshold())
返回(700, 10, 10),后面的两个10是与分代回收相关的阈值,后面可以看到。700即是垃圾回收启动的阈值。也就是说,内存0代数目到700,回收0代垃圾一次,每10次0代垃圾回收,会配合1次1代的垃圾回收;而每10次1代的垃圾回收,才会有1次的2代垃圾回收。
这样的机制可以保证经常使用的对象不会被重复检测是否回收,保证性能。
可以用set_threshold()来调整阈值控制回收频率:
import gc
gc.set_threshold(700, 10, 5)