使用c++有些年头了,有一本深度搜索c++对象模型的书写的很赞,很经典。本文是本书的读书笔记。
关于对象
加上封装后的布局成本
C语言中如下声明一个结构体
typedef struct point3d{ float x; float y; float z;}Point3d;
struct point3d 转化为class Point3d之后
class Point3d { public: Point3d(float x = 0.0f, float y = 0.0f; float z = 0.0f) :_x(x),_y(y),_z(z){} private: float _x,_y,_y; }
封装带来的布局成本增加了多少?实际是没有增加布局成本的。3个数据成员直接在class object内,member function在classs声明却不出现在class object中,所谓布局的成本主要由virtual引起的。
virtual function 机制用以支持运行时绑定(运行时多态)
virtual base class 机制支持多次出现在集成体系中的base class有一个单一的被共享的实例。
基本c++对象模型
nostatic data members 被配置在class object之内,static data member存放在class object之外.
static 和nostatic function memners放在class object之外
virtual function的处理步骤:
声明一个class Point然后查看其对象模型
class Point { public: Point(float x); virtual ~Point(); float x() const; static int PointCount(); protected: virtual ostream& print(ostream& os) const; float _x; static int _point_count; }
加上继承
c++支持单一继承和多重继承.base class subobject的data members直接被放置在derived class object,也就是说子类对象中包含基类子对象.基类成员的改变都会导致继承类重新编译.对于虚基类则是扩展子类自己的vittual table维护virtual base class的位置。
class istream : virtual public IOS{...}; class ostream : virtual public ios{...}; class iostream : public istream, public ostream{...};
在虚拟继承的情况下base class 不管在继承链中被派生多少次,永远只有一个实例存在即一个subobject.iostream之中只有virtual ios base class的一个实例.
NRV优化
函数返回基本是数据类型或者指针类型是通过eax寄存器进行传递的,返回对象对象则会进行命名返回值优化.以外部引用传参的形式去掉函数内部的局部对象构造。
X foo(){ X xx X* px = new X(); xx.foo(); //func是一个虚函数 px->foo() delete px; rerurn xx }
如上函数有可能内部转化为如下代码:
void foo(X &result){ _result.X::X(); px = _new(sizeof(X)); if(px != 0){ px->X::X(); } func(&_result);//这里涉及到成员函数的语义 (*px->vtbl[2])(px) //使用virtual机制扩展px->func() if(px != 0) { (*px->[1])(px); //扩展delete px _delete(p) } return; }
指针类型
构造函数语义学
默认构造函数被合成出来执行编译器的所需操作
如果类class A含有一个以上的类成员对象,编译器会扩张构造函数,在构造函数中安插代码,以成员类的声明顺序调用每个成员类的默认构造函数,这些代码被安插在用户代码之前.
有四种情况会造成编译器为未声明构造函数的类合成一个默认的构造函数,接着调用member object或者base class的默认构造函数,完成虚函数和虚基类机制。
拷贝构造函数
类中没有任何member或者base class object带有拷贝构造函数,也没有任何的虚函数和虚基类,默认情况下 对象的初始化会展示按位拷贝,这样效率很高且安全.
当对一个object做显示初始化或者object被当做参数交给函数时以及函数返回一个object时(传参、返回值、初始化)构造函数会被调用。
copy 构造函数不展现按位逐次拷贝的时候有编译器产生出来,有四种情况不展现:
1、2中编译器讲member或者bass class的拷贝构造哈数的调用安插到合成的拷贝构造函数中;3,4是为了对vptr重新初始化.
在构造函数中调用memset或者memcopy会使vptr设置为0
class Shape{ public: Shape(){ memset(this, 0, sizeof(Shape);)} virtual ~Shape(); }
编译器扩充构造函数的内容如下:
//扩充后的构造函数 Shape::Shape(){ //vptr在用户代码之前被设定 __vptr__Shape = __vtbl__Shape; //memset 会使vptr清0 memset(this, 0, sizeof(Shape)); }
初始化成员列表
编译器会操作初始化列表,以成员的声明顺序子构造函数内部在用户代码之前安插初始化代码. 当类含有一下四种情况的时候会需要使用成员初始化列表:
Data语义学
数据成员的布局
class X{};一个空类它隐藏1byte的大小,他是被编译器安插进去的一个char,这使得这一class的两个object在内存中配置有独一无二的地址.
非静态的数据成员直接存放在每一个类对象中,对于继承而来的费静态成员也是如此。静态数据成员则放在程序的全局数据段,且只存在一份数据实例.
对成员函数的分析,会在整个class声明完成之后才会出现.
在同一个访问段中member的排列要符合较晚出现的成员在对象中有较高的地址,多个访问段中的数据成员是自由排列的.
数据成员的访问
单一继承无virtual function下的内存布局
单一继承下无布局情况下class和struct的布局是一样的.
单一继承有virtaual function下的内存布局
Point3d中含有基类的子对象Point2d subobject,子类数据成员放置在基类子对象之后。
多重继承下的数据布局
类体系如下
class Point2d { public: virtual ~Point2d(){}; protected: float _x,_y; }; class Point3d : public Point2d { public: //... protected: float _z; }; class Vertex { public: virtual ~Vertex(){}; protected: Vertex *next; } class Vertex3d: public Point3d, public Vertex { public: //... protected: float mumble; }
要存取第二个基类中的数据成员,将会是怎样的情况需要付出额外的成本吗?不 ,成员的位置在编译期就时就固定了,因此存取数据成员知识一个简单的offset操作,就像单一继承一样简单--不管是经由一个指针或者引用或者是一个对象来存取.
虚拟继承
对于虚拟继承主要的问题是如何存取class的共享部分,虚拟继承使用两种策略来实现:指针策略和offset策略.
指针策略
为了指出共享类对象每个子类对象安插一些指针,每个指针指向虚基类。
进一步的优化策略的实现:每一个class object如果有一个或者多个virtual base classes,就会由编译器安插一个指针指向virtual base class table.真正的虚基类指针放在虚基类表中.
offset策略
在虚函数表中放置虚基类的offset.
Function语义学
虚函数
基类的指针或者引用寻址出一个子类对象,虚函数分配表格索引,vptr指向virtual table, virtual table中存放虚函数指针.
inline函数
inline是一个请求,编译器解说就必须认为它用一个表达式合理的将这个函数扩展开来,扩展期间使用实参代替形参,局部变量在封装的区域内名字唯一.
函数的调用方式
float Point3d::getX()const{...} extern getX_Point3dFv(const Point3d* this) obj.getX() 等价于 getX_Point3dFv(&obj) ptr->getX() 等价于 getX_Point3dFv(ptr)
构造、拷贝、析构语义学
构造函数的扩充
顺序: 先父类后成员最后自己的调用方式.
vptr的初始化在所有base 类构造之后,初始化列表之前(程序代码)
析构函数
按照上面相反的顺序调用 先自己析构然后类成员对象析构然后重置vptr然后基类析构然后虚基类析构
拷贝构造
拷贝构造函数和拷贝复制运算符