[翻译]C++教程:指向成员函数的指针
这是一篇翻译的文章,原文详细解释了C++中指向成员函数的指针,因为带有“教程”一词,所以比较通俗易懂。为了使文章读起来通俗有趣,翻译君并未一字一句一板一眼地翻译,并大量使用了诙谐的词汇(如“码农”)。另外,原文的某些地方分段不太合适(小学语文可能是体育老师教的。。),有些地方也稍嫌啰嗦,所以翻译君自己作了一些调整。如果对翻译君的翻译质量有意见,建议前往 原地址 围观。
咦?还不走?那废话少说,我们开始了啊。
关于成员函数指针
成员函数指针是C++最少用到的语法之一,甚至有经验的C++码农有时候也会被它搞晕。这是一篇针对于初学者的教程,同时也给有经验的码农分享了一些我个人对底层机制的挖掘。在开始之前,让我们先看一段在第一次看时一定会高呼“我++”的代码(说明,这些代码都是翻译君重新手敲的,改正了原文代码中的一些不太好的空格、缩进,下同):
//mem_fun1.cpp #include <iostream> class Foo { public: Foo(int i = 0) { _i = i; } void f() { std::cout << "Foo::f()" << std::endl; } private: int _i; }; int main() { Foo *p = 0; p->f(); } // Output: // Foo::f()
为什么我们能通过一个空指针调用成员函数?看起来好像编译器根本不鸟p的值是什么,只介意p的类型。别着急,咱先吊吊胃口,把答案留到后面的章节。现在,我们所能知道的是,编译器准确地知道要调用哪个函数。这就是所谓的“静态绑定”。因为成员函数可以静态绑定(并不是总能静态绑定,待会儿讨论),所以它们的地址是在编译阶段决定的(同样并不是永远如此)。直观地讲,应该有一种方法可以保存成员函数的地址。而且,真有这么一种方法,那就是——成员函数指针。
C++语法
下面的语法展示了如何声明一个成员函数指针:
Return_Type (Class_Name::* pointer_name) (Argument_List); Return_Type: member function return type. Class_name: name of the class in which the member function is declared. Argument_List: member function argument list. pointer_name: a name we'd like to call the pointer variable.
例如,我们定义一个类 Foo
和一个成员函数 f
:
int Foo::f(string);
我们可以给这个成员函数指针起一个“高大上”的名字 fptr
,所以我们就有了下面的内容:
Return_Type: int Class_Name: Foo Argument_List: string declaration of a pointer-to-member function named "fptr": int (Foo::*fptr) (string);
现在,指定一个成员函数给我们“高大上”的 fptr
:
fptr = &Foo::f;
当然,就连脑残都知道可以将声明和初始化结合起来:
int (Foo::*fptr) (string) = &Foo::f;
为了通过函数指针来调用成员函数,我们使用成员指针选择操作符(翻译君表示也不知道该怎么翻译,原文是pointer-to-member selection operators), .*
或者 ->*
。下面的代码演示了基本用法:
#include <iostream> #include <string> using namespace std; class Foo { public: int f(string str) { cout << "Foo::f()" << endl; return 1; } }; int main(int argc, char *argv[]) { int (Foo::*fptr) (string) = &Foo::f; Foo obj; (obj.*fptr)("str"); // 通过对象来调用 Foo::f() Foo *p = &obj; (p->*fptr)("str"); // 通过指针来调用 Foo::f() }
注意: .*fptr
绑定fptr到对象obj,而 ->*fptr
则绑定fptr到指针p所指向的对象。(还有一个 重要的区别 是:我们可以重载后者,却不能重载前者)。在 (obj.*fptr)
和 (p->*fptr)
两边的括号是语法所强制要求的。
成员函数指针不是常规指针
成员函数指针不像常规指针那样保存某个“准确”的地址。我们可以把它想像成保存的是成员函数在类布局中的“相对”地址。让我们来展示一下二者的不同。我们只对类 Foo
做一个小手术:将成员函数 f
变成 static
:
#include <iostream> #include <string> using namespace std; class Foo { public: static int f(string str) { cout << "Foo::f()" << endl; return 1; } }; int main(int argc, char *argv[]) { // int (Foo::*fptr) (string) = &Foo::f; // 错误 int (*fptr) (string) = &Foo::f; // 正确 (*fptr)("str"); // 调用 Foo::f() }
一个静态成员函数没有 this
指针。除了它和其它的类成员共享命名空间Foo(在我们的例子中命名空间是 Foo::
)之外,它和常规全局函数是一样的。所以,静态成员函数不是类的一部分,成员函数指针的语法对常规函数指针并不成立,例如上面例子中的静态成员函数指针。
int (Foo::*fptr) (string) = &Foo::f;
上面这行代码在g++ 4.2.4中编译的错误信息为:“不能将 int (*)(std::string)
转化成 int (Foo::*)(std::string)
”。这个例子证明了成员函数指针不是常规指针。另外,为什么C++如此费心地去发明这样的语法?很简单,因为它和常规指针是不同的东西,而且这样的类型转换也是违反直觉的。
C++类型转换规则
非虚函数情形
我们在前面一节看到,成员函数指针并不是常规指针,所以,成员函数指针(非静态)不能被转换成常规指针(当然,如果哪个脑残真想这么做的话,可以使用汇编技术来暴力解决),因为成员函数指针代表了 偏移量 而不是 绝对地址 。但是,如果是成员函数指针之间相互转换呢?
//memfunc4.cpp #include <iostream> class Foo { public: int f(char *c = 0) { std::cout << "Foo::f()" << std::endl; return 1; } }; class Bar { public: void b(int i = 0) { std::cout << "Bar::b()" << std::endl; } }; class FooDerived : public Foo { public: int f(char *c = 0) { std::cout << "FooDerived::f()" << std::endl; return 1; } }; int main(int argc, char *argv[]) { typedef int (Foo::*FPTR) (char*); typedef void (Bar::*BPTR) (int); typedef int (FooDerived::*FDPTR) (char*); FPTR fptr = &Foo::f; BPTR bptr = &Bar::b; FDPTR fdptr = &FooDerived::f; // bptr = static_cast<void(Bar::*)(int)>(fptr); // 错误 fdptr = static_cast<int(Foo::*)(char*)>(fptr); // 正确,逆变性规则 Bar obj; ( obj.*(BPTR) fptr )(1); // 调用 Foo::f() } // Output: // Foo::f()
在上面的代码中,我们首先使用了我们的老朋友 typedef
。它让这些繁琐的定义变得清晰起来。关键是,fptr是什么类型?它的类型是:
int (Foo::*) (char*);
或者等价地说——FPTR。如果我们仔细看上面的代码:
bptr = static_cast<void(Bar::*)(int)>(fptr);
这一行会出错,因为 不同的非静态非虚成员函数具有强类型因此不能相互转化 ,但是:
fdptr = static_cast<int(Foo::*)(char*)>(fptr);
这一行却是正确的!我们可以将一个指向派生类的指针赋值给一个指向其基类的指针(即"is-a"关系),而所谓的“逆变性规则”(翻译君:不知道是啥,原文是contravariance rule)正是这种规则的反面。这个规则提供了将 FooDerived::*
应用到任何 Foo::*
能被应用的地方的基本保证。在代码最后两行:
Bar obj; ( obj.*(BPTR) fptr)(1);
尽管我们想要调用的是 Bar::b()
,但是 Foo::f()
却被调用了,因为fptr是静态绑定(翻译君注:这里的静态绑定,即指在编译阶段,fptr的值已经确定了,所以即使进行强制转换,依然调用的是Foo类的f()函数)。(请围观成员函数调用和 this
指针)
虚函数情形
我们只将前例中的所有成员函数变成虚函数,其它都不动:
#include <iostream> class Foo { public: virtual int f(char *c = 0) { std::cout << "Foo::f()" << std::endl; return 1; } }; class Bar { public: virtual void b(int i = 0) { std::cout << "Bar::b()" << std::endl; } }; class FooDerived : public Foo { public: int f(char *c = 0) { std::cout << "FooDerived::f()" << std::endl; return 1; } }; int main(int argc, char *argv[]) { typedef int (Foo::*FPTR) (char*); typedef void (Bar::*BPTR) (int); FPTR fptr = &Foo::f; BPTR bptr = &Bar::b; FooDerived objDer; (objDer.*fptr)(0); // 调用 FooDerived::f(),而不是 Foo::f() Bar obj; ( obj.*(BPTR) fptr )(1);// 调用 Bar::b(),而不是 Foo::f() } // Output: // FooDerived::f() // Bar::b()
如我们所看到的,当成员函数是虚函数的时候,成员函数能够具有多态性并且现在调用的是 FooDerived::f()
,而且 Bar::b()
也能被正确调用了。因为 “一个指向虚成员的指针能在不同地址空间之间传递,只要二者使用的对象布局一样” (此话来自C++老爸 Bjarne Stroustrup 的 《C++程序设计语言》 )。当函数是虚函数的时候,编译器会生成虚函数表,来保存虚函数的地址。这是和非虚函数之间的最大不同,因此,运行时的行为也是不同的。
成员函数指针数组及其应用
成员函数指针的一个重要应用就是根据输入来生成响应事件,下面的 Printer
类和指针数组 pfm
展示了这一点:
#include <stdio.h> #include <string> #include <iostream> class Printer { // 一台虚拟的打印机 public: void Copy(char *buff, const char *source) { // 复制文件 strcpy(buff, source); } void Append(char *buff, const char *source) { // 追加文件 strcat(buff, source); } }; enum OPTIONS { COPY, APPEND }; // 菜单中两个可供选择的命令 typedef void(Printer::*PTR) (char*, const char*); // 成员函数指针 void working(OPTIONS option, Printer *machine, char *buff, const char *infostr) { PTR pmf[2] = { &Printer::Copy, &Printer::Append }; // 指针数组 switch (option) { case COPY: (machine->*pmf[COPY])(buff, infostr); break; case APPEND: (machine->*pmf[APPEND])(buff, infostr); break; } } int main() { OPTIONS option; Printer machine; char buff[40]; working(COPY, &machine, buff, "Strings "); working(APPEND, &machine, buff, "are concatenated!"); std::cout << buff << std::endl; } // Output: // Strings are concatenated!
在上述代码中, working
是一个用来执行打印工作的函数,它需要几个参数:1. 菜单选项;2. 可用的打印机;3. 字符串目的地;4. 字符串来源。上述代码中字符串来源是两个字符串常量"Strings "和"concatenated!",而成员函数指针数组被用来根据菜单选项执行相应的打印动作。
成员函数指针另外一个重要的应用可以在STL的 mem_fun()
中找到。(翻译君去看了一下 mem_fun()
的源代码,原来是用成员函数来构造仿函数functor的。)
成员函数调用和 this
指针
现在我们回到文章最开始的地方。为什么一个空指针也能调用成员函数?对于一个非虚函数调用,例如: p->f()
,编译器会生成类似如下代码:
Foo *const this = p; void Foo::f(Foo *const this) { std::cout << "Foo::f()" << std::endl; }
所以,不管p的值是神马,函数 Foo::f
都可以被调用,就像一个全局函数一样!p被作为 this
指针并当作参数传递给了函数。而在我们的例子中 this
指针并没有被解引用,所以,编译器放了我们一马(翻译君表示,这其实跟编译器没有关系,即使我们在成员函数中使用this指针,编译照样能通过,只不过在运行时会crash)。假如我们想知道成员变量 _i
的值呢?那么编译器就需要解引用 this
指针,这只有一个结果,那就是我们的好兄弟——未定义行为(undefined behavior)。对于一个虚函数调用,我们需要虚函数表来查找正确的函数,然后, this
指针被传递给这个函数。
这就是非虚函数、虚函数、静态函数的成员函数指针使用不用实现方式的根本原因。
结论
简单总结一下,通过上述文章,我们学到了:
- 成员函数指针声明和定义的语法
- 使用成员指针选择操作符来调用成员函数的语法
- 使用
typedef
写出更加清晰的代码 - 非虚成员函数、虚函数、静态成员函数之间的区别
- 成员函数指针和常规指针的对比
- 不同情形下的成员函数指针转换规则
- 如何使用成员函数指针数组来解决特定的设计问题
- 编译器是如何解释成员函数调用的
我衷心希望这篇教程能打开通往上述要点的相关高级技巧的大门,例如多重继承、虚继承下的成员函数指针,以及编译器的相关实现,例如“巨硬”家的Thunk技术(原文这里有链接,但翻译君去看了一下,不仅又老又旧(还在讲Windows 98和16位程序),而且只是巨硬的support性质的文章,所以就不贴链接了,免得浪费各位看官宝贵的青春:-p)。
那么,就到这里了,谢谢各位的围观,希望能对各位有所帮助。(翻译君表示,这哥们怎么这么啰嗦,和天朝棺猿有得一拼:-p)