分享

你想错了,并不是所有指针都是4字节。

 求真我 2014-04-20

以前自己也一直认为, 指针都一样,32机器的寻址是32位,大小都是4,原来,我一直是错的,成员函数指针的大小就不是4,不过,它应该不是普通的函数指针,看来自己以前对成员函数指针的理解太过于幼稚和肤浅了。

        本文将对成员函数指针的一点点小小的总结。 

        自己只是作了下简单的测试,如下

测试如下:

  1. <span style="font-size:16px;">class A  
  2. {    
  3. };  
  4.   
  5. class B  
  6. {  
  7. };  
  8.   
  9. class C  
  10. {  
  11. };  
  12.   
  13. class D:public A  
  14. {  
  15. };  
  16.   
  17. class E:public A,B  
  18. {  
  19. };  
  20.   
  21. class F:public A,B,C  
  22. {  
  23. };  
  24.   
  25.    
  26.   
  27. int main()  
  28. {  
  29.  cout<<"void (D::*)()的大小是:"<<sizeofvoid (D::*)() )<<endl; // 4  指向成员函数的指针大小不一定等于sizeof(void*)  
  30.  cout<<"void (E::*)()的大小是:"<<sizeofvoid (E::*)() )<<endl; // 8  指向成员函数的指针大小不一定等于sizeof(void*)  
  31.  cout<<"void (F::*)()的大小是:"<<sizeofvoid (F::*)() )<<endl; // 8  指向成员函数的指针大小不一定等于sizeof(void*)  
  32.  cout<<"void* 的大小是:"<<sizeofvoid* )<<endl;  
  33.   
  34. };</span>  


 

     下文是出自网上一牛人:http://www./ncre/three/pc/fudao/20071109/094943632.html     

      尊重作者,我只是一字不漏的拷贝过来,方便自己和大家查阅

 

一。理论篇 
在进行深入学习和分析之前,还是先看看书中是怎么介绍成员函数的。总结一下类成员函数指针的内容,应该包含以下几个知识点: 
1。成员函数指针并不是普通的函数指针。 
2。编译器提供了几个新的操作符来支持成员函数指针操作:  
1)   操作符"::*"用来声明一个类成员函数指针,例如: 
       typedef void (Base::*PVVBASEMEMFUNC)(void);        //Base is a class


2)   操作符"->*"用来通过对象指针调用类成员函数指针,例如: 
       //pBase is a Base pointer and well initialized 
      //pVIBaseMemFunc is a member function pointer and well initialized 
    (pBase->*pVIBaseMemFunc)();


3) 操作符".*"用来通过对象调用类成员函数指针,例如: 
    //baseObj is a Base object 
    //pVIBaseMemFunc is a member function pointer and well initialized 
    (baseObj.*pVIBaseMemFunc)(); 


3。成员函数指针是强类型的。     typedef void (Base::*PVVBASEMEMFUNC)(void);
    typedef void (Derived::*PVVDERIVEMEMFUNC)(void); 
PVVBASEMEMFUNC和PVVDERIVEMEMFUNC是两个不同类型的成员函数指针类型。


4。由于成员函数指针并不是真真意义上的指针,所以成员函数指针的转化就受限制。具体的转化细节依赖于不同的编译器,甚至是同一个编译器的不同版本。不过,处于同一个继承链中的不同类之间override的不同函数和虚函数还是可以转化的。     void* pVoid = reinterpret_cast<void*>(pVIBaseMemFunc);            //error
    int*  pInt  = reinterpret_cast<int*>(pVIBaseMemFunc);             //error 
  pVIDeriveMemFunc = static_cast<PVIDERIVEMEMFUNC>(pVIBaseMemFunc);   //OK


二。实践篇 
有了上面的理论知识,我们对类成员函数指针有了大概的了解,但是我们对成员函数指针还存在太多的疑惑。既然说成员函数指针不是指针,那它到底是什么东东? 编译器为什么要限制成员函数指针转化?老办法,我们还是分析汇编代码揭示其中的秘密。

首先,我写了这样两个具有继承关系的类:

  1. <span style="font-size:16px;"class Base  
  2.   
  3.  {   
  4. public:   
  5.     //ordinary member function   
  6.     void setValue(int iValue);   
  7.   
  8.     //virtual member function   
  9.     virtual void dumpMe();   
  10.     virtual void foobar();   
  11.   
  12. protected:   
  13.     int m_iValue;   
  14. };   
  15.   
  16. class Derived:public Base  
  17.   
  18. {   
  19. public:   
  20.     //ordinary member function   
  21.     void setValue(int iValue);   
  22.   
  23.     //virtual member function   
  24.     virtual void dumpMe();   
  25.     virtual void foobar();   
  26. private:   
  27.     double m_fValue;   
  28. };   
  29.   
  30. </span>  


接着,我又定义了一些成员函数指针类型:    

    typedef void (Base::*PVVBASEMEMFUNC)(void); 
    typedef void (Derived::*PVVDERIVEMEMFUNC)(void); 
    typedef void (Base::*PVIBASEMEMFUNC)(int); 
    typedef void (Derived::*PVIDERIVEMEMFUNC)(int);

 


最后,在main函数写了一些测试代码:

  1. <span style="font-size:16px;">int _tmain(int argc, _TCHAR* argv[])   
  2. {   
  3.     PVIBASEMEMFUNC pVIBaseMemFunc = &Base::setValue;   
  4.     PVIDERIVEMEMFUNC pVIDeriveMemFunc = static_cast<PVIDERIVEMEMFUNC>(pVIBaseMemFunc);  
  5.   
  6.     PVVBASEMEMFUNC      pVVBaseMemFunc   = &Base::foobar;   
  7.     PVVDERIVEMEMFUNC  pVVDeriveMemFunc = static_cast<PVVDERIVEMEMFUNC>(pVVBaseMemFunc);  
  8.   
  9.     Base baseObj;   
  10.     (baseObj.*pVIBaseMemFunc)(10);   
  11.     (baseObj.*pVVBaseMemFunc)();   
  12.   
  13.     Derived deriveObj;   
  14.     (deriveObj.*pVIDeriveMemFunc)(20);   
  15.     (deriveObj.*pVVDeriveMemFunc)();   
  16.   
  17.     return 0;   
  18. }</span>  


       成功编译后生成汇编代码。

       老规矩,在分析汇编代码的过程中还是只分析对解决问题有意义的汇编代码,其他的就暂时忽略。


1。 成员函数指针不是指针。

       从代码看出,在main函数的调用栈(calling stack)中首先依次压入四个成员函数指针,如果它们是普通指针的话,它们之间的偏移量应该是4个字节,可是实际的情况却是这样的: _deriveObj$ = -88
_baseObj$ = -60 
_pVVDeriveMemFunc$ = -44 
_pVVBaseMemFunc$ = -32 
_pVIDeriveMemFunc$ = -20 
_pVIBaseMemFunc$ = -8 
_argc$ = 8 
_argv$ = 12 


       由此可以看出,他们之间的偏移量是12个字节。这12个字节中应该可以包含三个指针,其中的一个指针应该指向函数的地址,那另外两个指针又指向那里呢?

       在《C++ Common Knowledge: Essential Intermediate Programming》(中文译名:C++必知必会)这本书的第16章对这部分的内容做了说明,这个12个字节的偏移量正好印证了书中的内容:

        ”The implementation of the pointer to member function must store within itself information as to whether the member function to which it refers is virtual or nonvirtual, information about where to find the appropriate virtual function table pointer (see The Compiler Puts Stuff in Classes [11, 37]), an offset to be added to or subtracted from the function’s this pointer (see Meaning of Pointer Comparison [28, 97]), and possibly other information. A pointer to member function is commonly implemented as a small structure that contains this information, although many other implementations are also in use. Dereferencing and calling a pointer to member function usually involves examining the stored information and conditionally executing the appropriate virtual or nonvirtual function calling sequence.“ 

2。 成员函数指针的转化。本文所采用的代码是想比较普通成员函数指针和虚函数指针在转化的过程中存在那些差异 ;

       PVIBASEMEMFUNC pVIBaseMemFunc = &Base::setValue; 
       mov    DWORD PTR _pVIBaseMemFunc$[ebp], OFFSET FLAT:?setValue@Base@@QAEXH@Z ;  
       取出Base::setValue函数的地址,存放于变量pVIBaseMemFunc所占内存的前4个字节(DWORD)中。

; PVVBASEMEMFUNC      pVVBaseMemFunc   = &Base::foobar; 
mov    DWORD PTR _pVVBaseMemFunc$[ebp], OFFSET FLAT:??_9@$B3AE ; `vcall’ 
取出符号”??_9@$B3AE“的值,存放于变量pVVBaseMemFunc所占内存的前4个字节(DWORD)中。  
对于符号”??_9@$B3AE“,我又找到了这样的汇编代码:     _TEXT    SEGMENT 
    _9@$B3AE PROC NEAR                    ; `vcall’, COMDAT 
    mov    eax, DWORD PTR [ecx] 
    jmp    DWORD PTR [eax+4] 
    _9@$B3AE ENDP                        ; `vcall’ 
    _TEXT    ENDS

符号”??_9@$B3AE“代表的应该是一个存根函数,这个函数首先根据this指针获得虚函数表的指针,然后将指令再跳转到相应的虚函数的地址。由此可以看出,对于虚函数,即使是用过成员函数指针间接调用,仍然具有和直接调用一样的特性。
   ; PVIDERIVEMEMFUNC pVIDeriveMemFunc = static_cast<PVIDERIVEMEMFUNC>(pVIBaseMemFunc);
    mov    eax, DWORD PTR _pVIBaseMemFunc$[ebp] 
    mov    DWORD PTR _pVIDeriveMemFunc$[ebp], eax 
直接将变量pVIBaseMemFunc所占内存的前4个字节(DWORD)的值付给了变量_pVIDeriveMemFunc所占内存的前4个字节中。 
    ; PVVDERIVEMEMFUNC    pVVDeriveMemFunc = static_cast<PVVDERIVEMEMFUNC>(pVVBaseMemFunc);
    mov    eax, DWORD PTR _pVVBaseMemFunc$[ebp] 
    mov    DWORD PTR _pVVDeriveMemFunc$[ebp], eax 
直接将变量pVVBaseMemFunc所占内存的前4个字节(DWORD)的值付给了变量pVVDeriveMemFunc所占内存的前4个字节中。由此可以看出,基类的成员函数指针转化到相应的派生类的成员函数指针,值保持不变。当然这里的例子继承关系相对来说比较简单,如果存在多继承和虚继承的情况下,结果可能会复杂的多。

3。函数调用 
下面的函数调用都大同小异,这里是列出其中的一个:     ; (baseObj.*pVIBaseMemFunc)(10); 
    mov    esi, esp 
    push    10                    ; 0000000aH 
    lea    ecx, DWORD PTR _baseObj$[ebp] 
    call    DWORD PTR _pVIBaseMemFunc$[ebp] 
    cmp    esi, esp 
    call    __RTC_CheckEsp    
这里的汇编代码并没有给我们太多新鲜的内容:将对象的首地址(this指针)存放于寄存器ECX中,接着就将指令转到变量_pVIBaseMemFunc所占内存的前4个字节所表示的地址。

到了这里,我们应该对成员函数指针有了进一步的了解

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多