您当前的位置:首页 > 电脑百科 > 程序开发 > 编程百科

什么是“内存管理机制”?

时间:2020-07-29 10:02:06  来源:CSDN  作者:
什么是“内存管理机制”?

作者 | 头文件

来源 | 程序员小灰

Python作为一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言,与大多数编程语言不同,Python中的变量无需事先申明,变量无需指定类型,程序员无需关心内存管理,Python解释器给你自动回收。开发人员不用过多的关心内存管理机制,这一切全部由Python内存管理器承担了复杂的内存管理工作。

内存不外乎创建和销毁两部分,本文将围绕Python的内存池和垃圾回收两部分进行分析。

 

 

Python内存池

 

1、为什么要引入内存池(why)

当创建大量消耗小内存的对象时,频繁调用new/malloc会导致大量的内存碎片,致使效率降低。内存池的作用就是预先在内存中申请一定数量的,大小相等的内存块留作备用,当有新的内存需求时,就先从内存池中分配内存给这个需求,不够之后再申请新的内存。这样做最显著的优势就是能够减少内存碎片,提升效率。

python中的内存管理机制为Pymalloc

 

2、内存池是如何工作的(how)

首先,我们看一张CPython(python解释器)的内存架构图:

什么是“内存管理机制”?
  • Python的对象管理主要位于Level+1~Level+3层

  • Level+3层:对于python内置的对象(比如int,dict等)都有独立的私有内存池,对象之间的内存池不共享,即int释放的内存,不会被分配给float使用

  • Level+2层:当申请的内存大小小于256KB时,内存分配主要由 Python 对象分配器(Python’s object allocator)实施

  • Level+1层:当申请的内存大小大于256KB时,由Python原生的内存分配器进行分配,本质上是调用C标准库中的malloc/realloc等函数

关于释放内存方面,当一个对象的引用计数变为0时,Python就会调用它的析构函数。调用析构函数并不意味着最终一定会调用free来释放内存空间,如果真是这样的话,那频繁地申请、释放内存空间会使Python的执行效率大打折扣。因此在析构时也采用了内存池机制,从内存池申请到的内存会被归还到内存池中,以避免频繁地申请和释放动作。

 

垃圾回收机制

Python的垃圾回收机制采用引用计数机制为主,标记-清除和分代回收机制为辅的策略。其中,标记-清除机制用来解决计数引用带来的循环引用而无法释放内存的问题,分代回收机制是为提升垃圾回收的效率。

 

1、引用计数

Python通过引用计数来保存内存中的变量追踪,即记录该对象被其他使用的对象引用的次数。

Python中有个内部跟踪变量叫做引用计数器,每个变量有多少个引用,简称引用计数。当某个对象的引用计数为0时,就列入了垃圾回收队列。


 
  1. >>> a=[1,2]

  2. >>> importsys

  3. >>> sys.getrefcount(a) ## 获取对象a的引用次数

  4. 2

  5. >>> b=a

  6. >>> sys.getrefcount(a)

  7. 3

  8. >>> delb ## 删除b的引用

  9. >>> sys.getrefcount(a)

  10. 2

  11. >>> c=list

  12. >>> c.Append(a) ## 加入到容器中

  13. >>> sys.getrefcount(a)

  14. 3

  15. >>> delc ## 删除容器,引用-1

  16. >>> sys.getrefcount(a)

  17. 2

  18. >>> b=a

  19. >>> sys.getrefcount(a)

  20. 3

  21. >>> a=[3,4] ## 重新赋值

  22. >>> sys.getrefcount(a)

  23. 2

注意:当把a作为参数传递给getrefcount时,会产生一个临时的引用,因此得出来的结果比真实情况+1

  • 引用计数增加的情况:

  1. 一个对象被分配给一个新的名字(例如:a=[1,2])

  2. 将其放入一个容器中(如列表、元组或字典)(例如:c.append(a))

  • 引用计数减少的情况:

  1. 使用del语句对对象别名显式的销毁(例如:del b)

  2. 对象所在的容器被销毁或从容器中删除对象(例如:del c )

  3. 引用超出作用域或被重新赋值(例如:a=[3,4])

引用计数能够解决大多数垃圾回收的问题,但是遇到两个对象相互引用的情况,del语句可以减少引用次数,但是引用计数不会归0,对象也就不会被销毁,从而造成了内存泄漏问题。针对该情况,Python引入了标记-清除机制。

 

2、标记-清除

标记-清除用来解决引用计数机制产生的循环引用,进而导致内存泄漏的问题 。循环引用只有在容器对象才会产生,比如字典,元组,列表等。

顾名思义,该机制在进行垃圾回收时分成了两步,分别是:

  • 标记阶段,遍历所有的对象,如果是可达的(reachable),也就是还有对象引用它,那么就标记该对象为可达;

  • 清除阶段,再次遍历对象,如果发现某个对象没有标记为可达(即为Unreachable),则就将其回收。


 
  1. >>> a=[1,2]

  2. >>> b=[3,4]

  3. >>> sys.getrefcount(a)

  4. 2

  5. >>> sys.getrefcount(b)

  6. 2

  7. >>> a.append(b)

  8. >>> sys.getrefcount(b)

  9. 3

  10. >>> b.append(a)

  11. >>> sys.getrefcount(a)

  12. 3

  13. >>> dela

    >>> del b


     
  • a引用b,b引用a,此时两个对象各自被引用了2次(去除getrefcout()的临时引用)

什么是“内存管理机制”?
  • 执行del之后,对象a,b的引用次数都-1,此时各自的引用计数器都为1,陷入循环引用

什么是“内存管理机制”?
  • 标记:找到其中的一端a,因为它有一个对b的引用,则将b的引用计数-1

什么是“内存管理机制”?
  • 标记:再沿着引用到b,b有一个a的引用,将a的引用计数-1,此时对象a和b的引用次数全部为0,被标记为不可达(Unreachable)

什么是“内存管理机制”?
  • 清除: 被标记为不可达的对象就是真正需要被释放的对象

上面描述的垃圾回收的阶段,会暂停整个应用程序,等待标记清除结束后才会恢复应用程序的运行。为了减少应用程序暂停的时间,Python 通过“分代回收”(Generational Collection)以空间换时间的方法提高垃圾回收效率。

 

3、分代回收

分代回收是基于这样的一个统计事实,对于程序,存在一定比例的内存块的生存周期比较短;而剩下的内存块,生存周期会比较长,甚至会从程序开始一直持续到程序结束。生存期较短对象的比例通常在 80%~90%之间。因此,简单地认为:对象存在时间越长,越可能不是垃圾,应该越少去收集。这样在执行标记-清除算法时可以有效减小遍历的对象数,从而提高垃圾回收的速度,是一种以空间换时间的方法策略

Python将所有的对象分为年轻代(第0代)、中年代(第1代)、老年代(第2代)三代。所有的新建对象默认是 第0代对象。当在第0代的gc扫描中存活下来的对象将被移至第1代,在第1代的gc扫描中存活下来的对象将被移至第2代。

gc扫描次数(第0代>第1代>第2代)

当某一代中被分配的对象与被释放的对象之差达到某一阈值时,就会触发当前一代的gc扫描。当某一代被扫描时,比它年轻的一代也会被扫描,因此,第2代的gc扫描发生时,第0,1代的gc扫描也会发生,即为全代扫描。


 
  1. >>> importgc

    >>> gc.get_threshold ## 分代回收机制的参数阈值设置

    (700,10,10)

  • 700=新分配的对象数量-释放的对象数量,第0代gc扫描被触发

  • 第一个10:第0代gc扫描发生10次,则第1代的gc扫描被触发

  • 第二个10:第1代的gc扫描发生10次,则第2代的gc扫描被触发

 

4、思考

在标记-清除中,如果对象c也引用a,执行del操作后,会发生什么?

对象a,b,c的引用关系如下图所示:


 
  1. >>> a=[1,2]

  2. >>> b=[3,4]

  3. >>> c=a

  4. >>> a.append(b)

  5. >>> b.append(a)

什么是“内存管理机制”?
  • ref_count表示引用计数

  • 对象a,b,c全部为reachable

 

执行del之后,引用关系如下图所示:


 
  1. >>> dela

  2. >>> delb

什么是“内存管理机制”?
  • a,b,c的ref_count减1

 

执行gc扫描

标记: a引用b,将b的refcount减1到0,b引用a,将a的refcount减1到1,将b放在unreachable下。

什么是“内存管理机制”?

再循环:因为a是可达的,所以会递归地将从a节点出发可以达到的所有节点标记为reachable下,即为:

清除:unreachable下没有可清除的对象,因此a,b,c对象不会被清除

 

总结

总体而言,Python通过内存池来减少内存碎片化,提高执行效率。主要通过引用计数来完成垃圾回收,通过标记-清除解决容器对象循环引用造成的问题,通过分代回收提高垃圾回收的效率。



Tags:内存管理机制   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
作者:前端小混混 来源:前端先锋作用域JavaScript 的变量被作用域所限制,如果超出了作用域,那么变量就没有办法再被使用,这样做的优点是: 可以避免当前的变量转为全局变量 有效限制...【详细内容】
2020-11-09  Tags: 内存管理机制  点击:(112)  评论:(0)  加入收藏
Python作为一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言,与大多数编程语言不同,Python中的变量无需事先申明,变量无需指定类型,程序员无需关心内存管理,Python解释器给你自动回收。开发人员不用过多的关...【详细内容】
2020-07-29  Tags: 内存管理机制  点击:(72)  评论:(0)  加入收藏
Java与C++之间有一堆由内存动态分配与垃圾收集技术所围成的“高墙”,墙外面的人想进去,墙里面的人却想出来。 —— 《深入理解Java虚拟机:JVM高级特性与最佳实践》...【详细内容】
2020-05-12  Tags: 内存管理机制  点击:(47)  评论:(0)  加入收藏
为什么IOS设备RAM运存远远小于Android设备,却还能运行得比Android设备流畅?IOS的多任务是伪多任务了,应用被切回后台以后,系统就会将应用休眠,此时应用不占用cpu和内存,此时保持运...【详细内容】
2019-12-02  Tags: 内存管理机制  点击:(127)  评论:(0)  加入收藏
一、内存管理机制先看一段代码:<?php//内存管理机制var_dump(memory_get_usage());//获取内存方法,加上true返回实际内存,不加则返回表现内存$a = "laruence";var_dump(memory_...【详细内容】
2019-09-19  Tags: 内存管理机制  点击:(143)  评论:(0)  加入收藏
其实在写这篇文章之前,我也想了很久,因为网上对这块的东西已经很多了,但有些读起来还是不容易让人理解,而且JS 中的内存管理, 我的感觉就像 JS 中的一门副科, 我们平时不会太重...【详细内容】
2019-04-16  Tags: 内存管理机制  点击:(421)  评论:(0)  加入收藏
▌简易百科推荐
摘 要 (OF作品展示)OF之前介绍了用python实现数据可视化、数据分析及一些小项目,但基本都是后端的知识。想要做一个好看的可视化大屏,我们还要学一些前端的知识(vue),网上有很多比...【详细内容】
2021-12-27  项目与数据管理    Tags:Vue   点击:(1)  评论:(0)  加入收藏
程序是如何被执行的&emsp;&emsp;程序是如何被执行的?许多开发者可能也没法回答这个问题,大多数人更注重的是如何编写程序,却不会太注意编写好的程序是如何被运行,这并不是一个好...【详细内容】
2021-12-23  IT学习日记    Tags:程序   点击:(9)  评论:(0)  加入收藏
阅读收获✔️1. 了解单点登录实现原理✔️2. 掌握快速使用xxl-sso接入单点登录功能一、早期的多系统登录解决方案 单系统登录解决方案的核心是cookie,cookie携带会话id在浏览器...【详细内容】
2021-12-23  程序yuan    Tags:单点登录(   点击:(8)  评论:(0)  加入收藏
下载Eclipse RCP IDE如果你电脑上还没有安装Eclipse,那么请到这里下载对应版本的软件进行安装。具体的安装步骤就不在这赘述了。创建第一个标准Eclipse RCP应用(总共分为六步)1...【详细内容】
2021-12-22  阿福ChrisYuan    Tags:RCP应用   点击:(7)  评论:(0)  加入收藏
今天想简单聊一聊 Token 的 Value Capture,就是币的价值问题。首先说明啊,这个话题包含的内容非常之光,Token 的经济学设计也可以包含诸多问题,所以几乎不可能把这个问题说的清...【详细内容】
2021-12-21  唐少华TSH    Tags:Token   点击:(9)  评论:(0)  加入收藏
实现效果:假如有10条数据,分组展示,默认在当前页面展示4个,点击换一批,从第5个开始继续展示,到最后一组,再重新返回到第一组 data() { return { qList: [], //处理后...【详细内容】
2021-12-17  Mason程    Tags:VUE   点击:(14)  评论:(0)  加入收藏
什么是性能调优?(what) 为什么需要性能调优?(why) 什么时候需要性能调优?(when) 什么地方需要性能调优?(where) 什么时候来进行性能调优?(who) 怎么样进行性能调优?(How) 硬件配...【详细内容】
2021-12-16  软件测试小p    Tags:性能调优   点击:(19)  评论:(0)  加入收藏
Tasker 是一款适用于 Android 设备的高级自动化应用,它可以通过脚本让重复性的操作自动运行,提高效率。 不知道从哪里听说的抖音 app 会导致 OLED 屏幕烧屏。于是就现学现卖,自...【详细内容】
2021-12-15  ITBang    Tags:抖音防烧屏   点击:(23)  评论:(0)  加入收藏
11 月 23 日,Rust Moderation Team(审核团队)在 GitHub 上发布了辞职公告,即刻生效。根据公告,审核团队集体辞职是为了抗议 Rust 核心团队(Core team)在执行社区行为准则和标准上...【详细内容】
2021-12-15  InfoQ    Tags:Rust   点击:(24)  评论:(0)  加入收藏
一个项目的大部分API,测试用例在参数和参数值等信息会有很多相似的地方。我们可以复制API,复制用例来快速生成,然后做细微调整既可以满足我们的测试需求1.复制API:在菜单发布单...【详细内容】
2021-12-14  AutoMeter    Tags:AutoMeter   点击:(20)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条