新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 本版讨论高级C/C++编程、代码重构(Refactoring)、极限编程(XP)、泛型编程等话题
    [返回] 中文XML论坛 - 专业的XML技术讨论区计算机技术与应用『 C/C++编程思想 』 → C/C++语言struct深层探索(ZT) 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 5247 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: C/C++语言struct深层探索(ZT) 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     longshentailang 帅哥哟,离线,有人找我吗?
      
      
      威望:1
      等级:计算机学士学位
      文章:325
      积分:2990
      门派:XML.ORG.CN
      注册:2006/6/20

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给longshentailang发送一个短消息 把longshentailang加入好友 查看longshentailang的个人资料 搜索longshentailang在『 C/C++编程思想 』的所有贴子 引用回复这个贴子 回复这个贴子 查看longshentailang的博客楼主
    发贴心情 C/C++语言struct深层探索(ZT)

    C/C++语言struct深层探索(ZT)

    1. struct的巨大作用
      面对一个人的大型C/C++程序时,只看其对struct的使用情况我们就可以对其编写者的编程经验进行评估。因为一个大型的C/C++程序,势必要涉及一些(甚至大量)进行数据组合的结构体,这些结构体可以将原本意义属于一个整体的数据组合在一起。从某种程度上来说,会不会用struct,怎样用 struct是区别一个开发人员是否具备丰富开发经历的标志。
      在网络协议、通信控制、嵌入式系统的C/C++编程中,我们经常要传送的不是简单的字节流(char型数组),而是多种数据组合起来的一个整体,其表现形式是一个结构体。
      经验不足的开发人员往往将所有需要传送的内容依顺序保存在char型数组中,通过指针偏移的方法传送网络报文等信息。这样做编程复杂,易出错,而且一旦控制方式及通信协议有所变化,程序就要进行非常细致的修改。
      一个有经验的开发者则灵活运用结构体,举一个例子,假设网络或控制协议中需要传送三种报文,其格式分别为packetA、packetB、packetC:
    struct structA
    {
    int a;
    char b;
    };
    struct structB
    {
    char a;
    short b;
    };
    struct structC
    {
    int a;
    char b;
    float c;
    }
      优秀的程序设计者这样设计传送的报文:
    struct CommuPacket
    {
    int iPacketType;  //报文类型标志
    union      //每次传送的是三种报文中的一种,使用union
    {
      struct structA packetA;
      struct structB packetB;
      struct structC packetC;
    }
    };
      在进行报文传送时,直接传送struct CommuPacket一个整体。
      假设发送函数的原形如下:
    // pSendData:发送字节流的首地址,iLen:要发送的长度
    Send(char * pSendData, unsigned int  iLen);
    发送方可以直接进行如下调用发送struct CommuPacket的一个实例sendCommuPacket:
    Send( (char *)&sendCommuPacket , sizeof(CommuPacket) );
    假设接收函数的原形如下:
    // pRecvData:接收字节流的首地址,iLen:要接收的长度
    //返回值:实际接收到的字节数
    unsigned int Recv(char * pRecvData, unsigned int  iLen);
      接收方可以直接进行如下调用将接收到的数据保存在struct CommuPacket的一个实例recvCommuPacket中:
    Recv( (char *)&recvCommuPacket , sizeof(CommuPacket) );
      接着判断报文类型进行相应处理:
    switch(recvCommuPacket. iPacketType)
    {
        case PACKET_A:
        …    //A类报文处理
        break;
        case PACKET_B:
        …   //B类报文处理
        break;
        case PACKET_C:
        …   //C类报文处理
        break;
    }
      以上程序中最值得注意的是
    Send( (char *)&sendCommuPacket , sizeof(CommuPacket) );
    Recv( (char *)&recvCommuPacket , sizeof(CommuPacket) );
      中的强制类型转换:(char *)&sendCommuPacket、(char *)&recvCommuPacket,先取地址,再转化为char型指针,这样就可以直接利用处理字节流的函数。
      利用这种强制类型转化,我们还可以方便程序的编写,例如要对sendCommuPacket所处内存初始化为0,可以这样调用标准库函数memset():
    memset((char *)&sendCommuPacket,0, sizeof(CommuPacket));
    2. struct的成员对齐
      Intel、微软等公司曾经出过一道类似的面试题:
    1. #include <iostream.h>
    2. #pragma pack(8)
    3. struct example1
    4. {
    5. short a;
    6. long b;
    7. };
    8. struct example2
    9. {
    10. char c;
    11. example1 struct1;
    12. short e;    
    13. };
    14. #pragma pack()
    15. int main(int argc, char* argv[])
    16. {
    17. example2 struct2;
    18. cout << sizeof(example1) << endl;
    19. cout << sizeof(example2) << endl;
    20. cout << (unsigned int)(&struct2.struct1) - (unsigned int)(&struct2)
    << endl;
    21. return 0;
    22. }
      问程序的输出结果是什么?
      答案是:
    8
    16
    4
      不明白?还是不明白?下面一一道来:
    2.1 自然对界
      struct是一种复合数据类型,其构成元素既可以是基本数据类型(如int、long、float等)的变量,也可以是一些复合数据类型(如 array、struct、union等)的数据单元。对于结构体,编译器会自动进行成员变量的对齐,以提高运算效率。缺省情况下,编译器为结构体的每个成员按其自然对界(natural alignment)条件分配空间。各个成员按照它们被声明的顺序在内存中顺序存储,第一个成员的地址和整个结构的地址相同。
      自然对界(natural alignment)即默认对齐方式,是指按结构体的成员中size最大的成员对齐。
      例如:
    struct naturalalign
    {
    char a;
    short b;
    char c;
    };
      在上述结构体中,size最大的是short,其长度为2字节,因而结构体中的char成员a、c都以2为单位对齐,sizeof(naturalalign)的结果等于6;
      如果改为:
    struct naturalalign
    {
    char a;
    int b;
    char c;
    };
      其结果显然为12。
    2.2指定对界
      一般地,可以通过下面的方法来改变缺省的对界条件:
      • 使用伪指令#pragma pack (n),编译器将按照n个字节对齐;
      • 使用伪指令#pragma pack (),取消自定义字节对齐方式。
      注意:如果#pragma pack (n)中指定的n大于结构体中最大成员的size,则其不起作用,结构体仍然按照size最大的成员进行对界。
      例如:
    #pragma pack (n)
    struct naturalalign
    {
    char a;
    int b;
    char c;
    };
    #pragma pack ()
      当n为4、8、16时,其对齐方式均一样,sizeof(naturalalign)的结果都等于12。而当n为2时,其发挥了作用,使得sizeof(naturalalign)的结果为8。
      在VC++ 6.0编译器中,我们可以指定其对界方式,其操作方式为依次选择projetct > setting > C/C++菜单,在struct member alignment中指定你要的对界方式。
      另外,通过__attribute((aligned (n)))也可以让所作用的结构体成员对齐在n字节边界上,但是它较少被使用,因而不作详细讲解。
    2.3 面试题的解答
      至此,我们可以对Intel、微软的面试题进行全面的解答。
      程序中第2行#pragma pack (8)虽然指定了对界为8,但是由于struct example1中的成员最大size为4(long变量 size为4),故struct example1仍然按4字节对界,struct example1的size为8,即第18行的输出结果;
      struct example2中包含了struct example1,其本身包含的简单数据成员的最大size为2(short变量e),但是因为其包含了struct example1,而struct example1中的最大成员size为4,struct example2也应以4对界, #pragma pack (8)中指定的对界对struct example2也不起作用,故19行的输出结果为16;
      由于struct example2中的成员以4为单位对界,故其char变量c后应补充3个空,其后才是成员struct1的内存空间,20行的输出结果为4。(注:即成员struct1的地址与第一个成员char c的地址(亦即结构struct example2的地址)相差的数值为4)。

    3. C和C++间struct的深层区别
      在C++语言中struct具有了“类” 的功能,其与关键字class的区别在于struct中成员变量和函数的默认访问权限为public,而class的为private。
      例如,定义struct类和class类:
    struct structA
    {
    char a;

    }
    class classB
    {
          char a;
          …
    }
      则:
    structA a;
    a.a = 'a';    //访问public成员,合法
    classB b;
    b.a = 'a';    //访问private成员,不合法
      许多文献写到这里就认为已经给出了C++中struct和class的全部区别,实则不然,另外一点需要注意的是:
      C++中的struct保持了对C中struct的全面兼容(这符合C++的初衷——“a better c”),因而,下面的操作是合法的:
    //定义struct
    struct structA
    {
    char a;
    char b;
    int c;
    };
    structA a = {'a' , 'a' ,1};    //  定义时直接赋初值
      即struct可以在定义的时候直接以{ }对其成员变量赋初值,而class则不能,在经典书目《thinking C++ 2nd edition》中作者对此点进行了强调。
    4. struct编程注意事项
      看看下面的程序:
    1. #include <iostream.h>
    2. struct structA
    3. {
    4. int iMember;
    5. char *cMember;
    6. };
    7. int main(int argc, char* argv[])
    8. {
    9. structA instant1,instant2;
    10.char c = 'a';
        
    11. instant1.iMember = 1;
    12. instant1.cMember = &c;
    13.instant2 = instant1;
    14.cout << *(instant1.cMember) << endl;
    15.*(instant2.cMember) = 'b';
    16. cout << *(instant1.cMember) << endl;
    17. return 0;
    }
      14行的输出结果是:a
      16行的输出结果是:b
      Why?我们在15行对instant2的修改改变了instant1中成员的值!
      原因在于13行的instant2 = instant1赋值语句采用的是变量逐个拷贝,这使得instant1和instant2中的cMember指向了同一片内存,因而对instant2的修改也是对instant1的修改。
      在C语言中,当结构体中存在指针型成员时,一定要注意在采用赋值语句时是否将2个实例中的指针型成员指向了同一片内存。
    在C++语言中,当结构体中存在指针型成员时,我们需要重写struct的拷贝构造函数并进行“=”操作符重载。
    1. #include <iostream.h>
    2. #pragma pack(2)
    3. struct example1
    4. {
    5. short a;
    6. long b;
    7. };
    8. struct example2
    9. {
    10. char c;
    11. example1 struct1;
    12. short e;    
    13. };
    14. #pragma pack()
    15. int main(int argc, char* argv[])
    16. {
    17. example2 struct2;
    18. cout << sizeof(example1) << endl;
    19. cout << sizeof(example2) << endl;
    20. cout << (unsigned int)(&struct2.struct1) - (unsigned int)(&struct2)
    << endl;
    21. return 0;
    22. }
      问程序的输出结果是什么?
      实际运行答案是:
    6
    10
    2
    注意第二行代码有改动


       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/10/28 10:26:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 C/C++编程思想 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/5/10 1:02:16

    本主题贴数1,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    46.875ms