分享

C语言中的类型提升

 liuhuoer 2018-08-08
每天都会看CU的博客,尤其是CU首页上面的博客。个人感觉有很多同学并不关注基础知识,
在遇到问题时,经常会舍本求末。遇到问题,总是找不到根本原因,得出了一些结论。但这些结论并不是真正的原因,整个儿过程,也把真正的原因给掩盖了。

今天主要说一下C语言的类型提升的事情。

下面是引用的一个例子——这个代码是从一个朋友的博文中复制过来的,但是当时这位朋友没有去说明类型提升的问题,而是阐述汇编的过程。
/***************************************************************/
int main()
{
int i;
unsigned char *p;
char *p1;
int a[] = {0xffffffff, 0xffffffff, 0xffffffff};
p = a;
p1 = a;
for(i = 0 ; i < 8 ; i++) {
printf(" 0x%02x  0x%02x \n", p[i], p1[i]);
}
}
$ gcc main.c 
main.c: In function ‘main’:
main.c:10: warning: assignment from incompatible pointer type
main.c:11: warning: assignment from incompatible pointer type
$ ./a.out 
 0xff  0xffffffff 
 0xff  0xffffffff 
 0xff  0xffffffff 
 0xff  0xffffffff 
 0xff  0xffffffff 
 0xff  0xffffffff 
 0xff  0xffffffff 
 0xff  0xffffffff 
。。。。。。 。。。。。。
/***************************************************************/

根本原因其实很简单。
%x是打印无符号整数的16进制,而例子中传递的类型是字符型,那么这里就有一个字符提升的问题,将类型提升为无符号整形。
*p是unsigned char,其值为0xff,那么对应的无符号整形的值仍然是0xff。
而*p1确实char,其值为0xff,其对应的无符号整形的值为0xffffffff。为什么这次是0xffffffff呢?
因为*p1为-1,而无符号整数的-1则是0xffffffff。

为什么是这样呢?
因为在在编码为补码的情形下,类型提升有两种情况:
1. 符号扩展:对于有符号数,扩展存储位数的方法。在新的高位字节使用当前最高有效位即符号位的值进行填充。
2. 零扩展:对于无符号数,扩展存储位数的方法。在新的高位直接填0.

对于这个例子来说。*p是无符号数,所以填充的是0,即为0x000000ff。而*p1是有符号数,所以填充的是1,即为0xffffffff。

因此,从char型到unsigned int,是对有符号数的提升,因此用的是符号扩展,oxff被扩展为oxffffffff;而从unsigned char型到unsigned int型,是对无符号数的扩展,使用零扩展,oxff被扩展为ox000000ff,而填充的这些零是不会被打印出来的。

如果说这样教科书式的概念不容易理解。还有这样一种理解方式,也许不一定准确,但更容易理解。
对于这里的类型提升,整个步骤可以这样理解:
1. %x要求参数为无符号整数,需要参数为4个字节;
2. *p, *p1为(unsigned) char型,只占1个字节;
3. 因为参数的类型不符,需要扩展;
4. 定位需要扩展到4个字节;
5. 那么就需要填充增加的3个字节;
6. 这3个字节需要什么值?这里就需要上面所需要的概念了。针对有符号数和无符号数,进行不同值的填充。

这就是为什么在编程的过程中,要避免有符号数和无符号数的混用。我个人认为,在我们解决问题的时候,不要一味儿的想着怎么用高级的技术解决。其实最重要的是基础。一般情况下,大部分的问题都可以由C语言基础解决。

接下来再看一个例子:

     1  #include <stdio.h>
     2
     3  int main(int argc, char **argv){
     4          int a=1000000,b=1000000;
     5          long int c,c1,c2,c3;
     6          c=a*b;//note1
     7          c1=(long)a*b;//note2
     8          c2=(long)a*(long)b;//note3
     9          c3=(long)(a*b);//note4
    10          printf("c=%ld, c1=%ld,c2=%ld, c3=%ld\n",c,c1,c2,c3);
    11          return 0;
    12  }

运行结果:

c=-727379968, c1=1000000000000,c2=1000000000000, c3=-727379968

note1和note4的打印结果是一样的,原理也是一样的,只不过在代码里note1是隐式类型转换,note4是显式类型转换,此处a*b的结果位数大于int的32位的范围,发生了溢出,高于第31位的数值丢弃,剩下的在进行符号扩展,最后显示为-727379968。而note2和note3,在计算出a*b的结果之前将a或b扩展为long型,提前避免了溢出问题,最后显示为1000000000000。

结束!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多