C语言中的类型提升

liuhuoer 2018-08-08

展开全文

每天都会看CU的博客，尤其是CU首页上面的博客。个人感觉有很多同学并不关注基础知识，

在遇到问题时，经常会舍本求末。遇到问题，总是找不到根本原因，得出了一些结论。但这些结论并不是真正的原因，整个儿过程，也把真正的原因给掩盖了。

今天主要说一下C语言的类型提升的事情。

下面是引用的一个例子——这个代码是从一个朋友的博文中复制过来的，但是当时这位朋友没有去说明类型提升的问题，而是阐述汇编的过程。

/***************************************************************/

int main()

{

int i;

unsigned char *p;

char *p1;

int a[] = {0xffffffff, 0xffffffff, 0xffffffff};

p = a;

p1 = a;

for(i = 0 ; i < 8 ; i++) {

printf(" 0x%02x 0x%02x \n", p[i], p1[i]);

}

$ gcc main.c

main.c: In function ‘main’:

main.c:10: warning: assignment from incompatible pointer type

main.c:11: warning: assignment from incompatible pointer type

$ ./a.out

0xff 0xffffffff

。。。。。。。。。。。。

/***************************************************************/

根本原因其实很简单。

%x是打印无符号整数的16进制，而例子中传递的类型是字符型，那么这里就有一个字符提升的问题，将类型提升为无符号整形。

*p是unsigned char，其值为0xff，那么对应的无符号整形的值仍然是0xff。

而*p1确实char，其值为0xff，其对应的无符号整形的值为0xffffffff。为什么这次是0xffffffff呢？

因为*p1为-1，而无符号整数的-1则是0xffffffff。

为什么是这样呢？

因为在在编码为补码的情形下，类型提升有两种情况：

1. 符号扩展：对于有符号数，扩展存储位数的方法。在新的高位字节使用当前最高有效位即符号位的值进行填充。

2. 零扩展：对于无符号数，扩展存储位数的方法。在新的高位直接填0.

对于这个例子来说。*p是无符号数，所以填充的是0，即为0x000000ff。而*p1是有符号数，所以填充的是1，即为0xffffffff。

因此，从char型到unsigned int，是对有符号数的提升，因此用的是符号扩展，oxff被扩展为oxffffffff；而从unsigned char型到unsigned int型，是对无符号数的扩展，使用零扩展，oxff被扩展为ox000000ff，而填充的这些零是不会被打印出来的。

如果说这样教科书式的概念不容易理解。还有这样一种理解方式，也许不一定准确，但更容易理解。

对于这里的类型提升，整个步骤可以这样理解：

1. %x要求参数为无符号整数，需要参数为4个字节；

2. *p, *p1为(unsigned) char型，只占1个字节；

3. 因为参数的类型不符，需要扩展；

4. 定位需要扩展到4个字节；

5. 那么就需要填充增加的3个字节；

6. 这3个字节需要什么值？这里就需要上面所需要的概念了。针对有符号数和无符号数，进行不同值的填充。

这就是为什么在编程的过程中，要避免有符号数和无符号数的混用。我个人认为，在我们解决问题的时候，不要一味儿的想着怎么用高级的技术解决。其实最重要的是基础。一般情况下，大部分的问题都可以由C语言基础解决。

接下来再看一个例子：

1 #include <stdio.h>
2
3 int main(int argc, char **argv){
4 int a=1000000,b=1000000;
5 long int c,c1,c2,c3;
6 c=a*b;//note1
7 c1=(long)a*b;//note2
8 c2=(long)a*(long)b;//note3
9 c3=(long)(a*b);//note4
10 printf("c=%ld, c1=%ld,c2=%ld, c3=%ld\n",c,c1,c2,c3);
11 return 0;
12 }

运行结果：

c=-727379968, c1=1000000000000,c2=1000000000000, c3=-727379968

note1和note4的打印结果是一样的，原理也是一样的，只不过在代码里note1是隐式类型转换，note4是显式类型转换，此处a*b的结果位数大于int的32位的范围，发生了溢出，高于第31位的数值丢弃，剩下的在进行符号扩展，最后显示为-727379968。而note2和note3,在计算出a*b的结果之前将a或b扩展为long型，提前避免了溢出问题，最后显示为1000000000000。

结束！