关于C++虚函数默认参数的问题。Effective C++ 条款38: 决不要重新定义继承而来的缺省参数值
昨晚在chgaowei的博客上关于讨论C++虚函数的默认参数问题,刚翻书找了一下,在Effective C++ 中的38条有说明。
直接上原文吧,最后加几句细点的理解
条款38: 决不要重新定义继承而来的缺省参数值
让我们从一开始就把问题简化。缺省参数只能作为函数的一部分而存在;另外,只有两种函数可以继承:虚函数和非虚函数。因此,重定义缺省参数值的唯一方法是重定义一个继承而来的函数。然而,重定义继承而来的非虚函数是一种错误(参见条款37),所以,我们完全可以把讨论的范围缩小为 "继承一个有缺省参数值的虚函数" 的情况。
既然如此,本条款的理由就变得非常明显:虚函数是动态绑定而缺省参数值是静态绑定的。
什么意思?你可能会说你不懂这些最新的面向对象术语;或者,过度劳累的你一时想不起静态和动态绑定的区别。那么,让我们来复习一下。
对象的静态类型是指你声明的存在于程序代码文本中的类型。看下面这个类层次结构:
enum ShapeColor { RED, GREEN, BLUE }; // 一个表示几何形状的类 class Shape { public: // 所有的形状都要提供一个函数绘制它们本身 virtual void draw(ShapeColor color = RED) const = 0; ... }; class Rectangle: public Shape { public: // 注意:定义了不同的缺省参数值 ---- 不好! virtual void draw(ShapeColor color = GREEN) const; ... }; class Circle: public Shape { public: virtual void draw(ShapeColor color) const; ... };
用图形来表示是下面这样:
Shape
//
/ /
/ /
Rectangle Circle
现在看看这些指针:
Shape *ps; // 静态类型 = Shape*
Shape *pc = new Circle; // 静态类型 = Shape*
Shape *pr = new Rectangle; // 静态类型 = Shape*
这个例子中, ps, pc,和pr都被声明为Shape指针类型,所以它们都以此作为自己的静态类型。注意,这和它们真的所指向的对象的类型绝对没有关系 ---- 它们的静态类型总是Shape*。
对象的动态类型是由它当前所指的对象的类型决定的。即,对象的动态类型表示它将执行何种行为。上面的例子中,pc的动态类型是Circle*,pr的动态类型是Rectangle*。至于ps,实际上没有动态类型,因为它(还)没有指向任何对象。
动态类型,顾名思义,可以在程序运行时改变,典型的方法是通过赋值:
ps = pc; // ps的动态类型
// 现在是Circle*
ps = pr; // ps的动态类型
// 现在是Rectangle*
虚函数是动态绑定的,意思是说,虚函数通过哪个对象被调用,具体被调用的函数就由那个对象的动态类型决定:
pc->draw(RED); // 调用Circle::draw(RED)
pr->draw(RED); // 调用Rectangle::draw(RED)
我知道这些都是老掉牙的知识了,你当然也了解虚函数。(如果想知道它们是怎么实现的,参见条款M24)但是,将虚函数和缺省参数值结合起来分析就会产生问题,因为,如上所述,虚函数是动态绑定的,但缺省参数是静态绑定的。这意味着你最终可能调用的是一个定义在派生类,但使用了基类中的缺省参数值的虚函数:
pr->draw(); // 调用Rectangle::draw(RED)!
这种情况下,pr的动态类型是Rectangle*,所以Rectangle的虚函数被调用 ---- 正如我们所期望的那样。Rectangle::draw中,缺省参数值是GREEN。但是,由于pr的静态类型是Shape*,这个函数调用的参数值是从Shape类中取得的,而不是Rectangle类!所以结果将十分奇怪并且出人意料,因为这个调用包含了Shape和Rectangle类中Draw的声明的组合。你当然不希望自己的软件以这种方式运行啦;至少,用户不希望这样,相信我。
不用说,ps, pc,和pr都是指针的事实和产生问题的原因无关。如果它们是引用,问题也会继续存在。问题仅仅出在,draw是一个虚函数,并且它的一个缺省参数在子类中被重新定义了。
为什么C++坚持这种有违常规的做法呢?答案和运行效率有关。如果缺省参数值被动态绑定,编译器就必须想办法为虚函数在运行时确定合适的缺省值,这将比现在采用的在编译阶段确定缺省值的机制更慢更复杂。做出这种选择是想求得速度上的提高和实现上的简便,所以大家现在才能感受得到程序运行的高效;当然,如果忽视了本条款的建议,就会带来混乱。
先说一下现在的C++的参数传递机制,非虚函数和虚函数的传递机制都是一样的。
比如如下函数调用:
func(10) ;
会被编译器翻译成:
push 10
puch 返回地址
call func
大概就是这样:先把参数压栈,然后压返回地址,在调用函数。
对于虚函数来说,如果调用时没有指定参数值,那么编译器会帮我们加上去。
对,加上去,这里就有问题来了,如果是用基类指针调用的虚函数,我们知道,因为动态绑定,编译器暂时无法知道实际调用的是哪个函数,所以他得用虚函数的机制进行2此指针操作在实际的类地址中找到虚函数表,再根据偏移找到实际的函数跳转地址,而此时,编译器必须提前把参数压栈准备好,call之后就直接用参数了。
那么,既然编译器还不知道实际调用的是哪个函数,那么当然就更不知道实际传递的默认参数应该是子类还是父类的了。关键就在这里。
参数都是静态绑定的,如果要动态,上文说了,效率会跟虚函数调用一样稍微有点低,所以C++折中了。
话又说回来,如果要动态的实现,怎么办呢???下面说点个人的思路
对,虚函数动态绑定是用vptbl实现的(这个《深度探索c++对象模型》中有),那么默认参数的实现是否也能参考呢??应该可以。
编译器可以把一条压栈(压默认参数值的指令)放在函数代码的前面几条指令中,
然后在跳转的时候,实际的call指令可以延后几句,这样:
用effective 中的例子:
pr->draw();
编译后可能是:
//因为没有指定参数,所以在我们的尝试实现中不压参数
call ( *pr->_vtbl[2] - 4 ) //这个计算虚函数地址的我简单写到一行了,实际上时2个取指操作。-4的原因待会说。
当然,函数代码也得相应的改变一下:
push GREEN
Rectangle::draw://这才是真正的draw代码,上述-4的原因就是为了执行上面的push GREEN指令,这,同理在基类中代码也会变成这样:
push RED
Shape::draw: //Shape 的draw代码
总结一下,就是说把参数压栈的指令稍微改一下,如果正常传递了参数当然就不用了,如果没传递参数,那么在函数的代码之前加上一句压参数指令,然后在函数跳转的时候,往回多跳一条指令,让实际掉用的代码去压这个参数。
说的可能有的乱,有些错的地方还忘见谅。呵呵···
近期评论