1 C/C++的左值和右值
左值性(lvalueness)在C/C++中是表达式的一个重要属性。只有通过一个左值表达式才能
来引用及更改一个对象(object)的值。(某些情况下,右值表达式也能引用(refer)到某一
个对象,并且可能间接修改该对象的值,后述)。
何谓对象?如果没有明确说明,这里说的对象,和狭义的类/对象(class/object)相比,
更为广泛。在C/C++中,所谓的对象指的是执行环境中一块存储区域(a region of storage),
该存储区域中的内容则代表(represent)了该对象的值(value)。注意到我们这里所说的"代
表",对于一个对象,如果我们需要取出(fetch)它的值,那么我们需要通过一定的类型(type)来引用它。使用不同的类型,对同一对象中的内容的解释会导致可能得到不同的值,或者产生某些未定义的行为。
在介绍左值之前,我们还需要引入一个概念: 变量(variable)。经常有人会把变量与对
象二者混淆。什么叫变量?所谓变量是一种声明,通过声明,我们把一个名字(name)与一
个对象对应起来,当我们使用该名字时,就表示了我们对该对象进行某种操作。但是并不
是每个对象都有名字,也并不意味着有对应的变量。比如临时对象(temporary object)就
没有一个名字与之关联(不要误称为临时变量,这是不正确的说法)。
1 C中的左值
1.1
按照C的定义,左值是一个引用到对象的表达式,通过左值我们可以取出该对象的值。通
过可修改的左值表达式(modifiable lvalue)我们还可以修改该对象的值。(需要说明的是,
在C++中,左值还可以引用到函数,即表达式f如果引用的是函数类型,那么在C中它既不是
左值也不是右值;而在C++中则是左值)。因为左值引用到某一对象,因此我们使用&对左
值表达式(也只能对左值表达式和函数)取址运算时,可以获得该对象的地址(有两种左
值表达式不能取址,一是具有位域( bit-field )类型,因为实现中最小寻址单位是 byte;
另一个是具有register指定符,使用register修饰的变量编译器可能会优化到寄存器中).
Ex1.1
char a[10]; // a is an lvalue representing an array of 10 ints.
char (* p)[10]=&a; // &a is the address of the array a.
const char* p="hello world"; //"hello world" is an lvalue of type char[12]
//in C, type const char[12] in C++.
char (*p)[12]=&"hello world";
struct S{ int a:2; int b: 8; };
struct S t;
int* p=&t.a; //error. t.a is an lvalue of bitfield.
register int i;
int * p=&i; //error. i is an lvalue of register type.
int a, b;
int * p=& (a+b); //error. a+b is not an lvalue.
1.2
假设expr1是一个指向某对象类型或未完整类型(incomplete type,即该类型的布局和大
小未知)的指针,那么我们可以断言*expr1一定是个左值表达式,因为按照*运算符的定义,
*expr1表示引用到expr1所指向的对象。如果expr1是个简单的名字,该名字代表一个变量.
同样的,该表达式也是个左值,因为他代表的是该变量对应的对象。对于下标运算符,我
们一样可以做出同样的结论,因为expr1[expr2]总是恒等于*( ( expr1 )+ expr2 ),那么
p->member,同样也是一个左值表达式。然而对于expr1.expr2,则我们不能断定就是个左值
表达式。因为expr1可能不是左值。
需要特别说明的是,左值性只是表达式的静态属性,当我们说一个表达式是左值的时候,
并不意味着它一定引用到某一个有效存在的对象。int *p; *p是左值表达式,然而这里对
*p所引用的对象进行读写的结果将可能是未定义的行为。
Ex1.2
extern struct A a;
struct A* p2= &a;
a是个左值表达式,因而可以进行&运算,然而此时stru A仍然没有完整。
//In C++
extern class A a;
A & r=a;// OK. Refers to a, though a with an incomplete type.
1.3可修改的左值
在语义上需要修改左值对应的对象的表达式中,左值必须是一个可修改的左值。比如赋
值(包括复合赋值)表达式中的左操作数,必须是一个可修改的左值表达式;自增/减运算
符的操作数等。
Ex1.3
const int a[2], i; //NOTE: a unintialized. legal in C, illegal in C++.
i++; //error, i is an lvalue of type const int.
a[0]--;//error, a[0] is an lvalue of const int.
1.4右值
与左值相对应的另一个概念是右值(rvalue)。在C中,右值也用表达式的值(value of
the expression)来表达。即右值强调的不是表达式本身,而是该表达式运算后的结果。这
个结果往往并不引用到某一对象,可以看成计算的中间结果;当然它也可能引用到某一对
象,但是通过该右值表达式我们不能直接修改该对象。
1.4.1右值的存储位置
Ex1.4
int i;
i=10;
10在这里是一个右值表达式,上句执行的语义是用整型常量10的值修改i所引用的对象。
从汇编语言上看,上述语句可能被翻译成:
mov addr_of_i,10;
10这个值被硬编码到机器指令中;
右值也可以存储在寄存器中:
int i,j,k;
k=i+j;
i+j表达式是个右值,该右值可能存储在寄存器中。
mov eax, dword ptr[addr_of_i];
mov ebx, dword ptr[addr_of_j];
add eax, ebx;
mov dword ptr[addr_of_k], eax;
在这里,i+j表达式的结果在eax中,这个结果就是i+j表达式的值,它并不引用到某一对象
某些情况下,一个右值表达式可能也引用到一个对象。
struct S{ char c[2];};
struct S f(void);
void g()
{
f().i;
f().c[1]; // (*)
}
f()表达式是个函数调用,该表达式的类型是f的返回类型struct S,f()表达式为右值表
达式,但是在这里往往对应着一个对象,因为这里函数的返回值是一个结构,如果不对应着
一个对象(一片存储区域),用寄存器几乎不能胜任,而且[]操作符语义上又要求一定引用
到对象。
右值虽然可能引用到对象,然而需要说明的是,在右值表达式中,是否引用到对象及引用
得对象的生存期往往并不是程序员所能控制。
1.4.2
为什么需要右值?右值表示一个表达式运算后的值,这个值存储的地方并没有指定;当我
们需要一个表达式运算后的值时,即我们需要右值。比如在赋值运算时,a=b;我们需要用表
达式b的值,来修改a所代表的对象。如果b是个左值表达式,那么我们必须从b所代表的对象
中取出(fetch)该对象的值,然后利用该值来修改a代表的对象。这个取出过程,实际上就是
一个由左值转换到右值的过程。这个过程,C中没有明确表述;但在C++中,被明确归纳为标
准转换之一,左值到右值转换(lvalue-to-rvalue conversion)。回头看看上面的代码,i+j
表达式中,+运算符要求其左右操作数都是右值。行1和2,就是取出左值表达式i,j的对应的
对象的值的过程。这个过程,就是lvalue-to-rvalue conversion。i+j本身就是右值,这里
不需要执行lvalue-to-rvalue conversion,直接将该右值赋值给k。
1.4.3右值的类型
右值表达式的类型是什么? 在C中,右值总是cv-unqualified的类型。因为我们对于右值,
即使其对应着某个对象, 我们也无从或不允许修改它。而在C++中,对于built-in类型的右
值,一样是cv-unqualified,但是类类型(class type)的右值,因为C++允许间接修改其对
应的对象,因此右值表达式与左值一样同样有cv-qualified的性质。(详细见后)
Ex1.5
void f(int);
void g()
{
const int i;
f(i); //OK. i is an lvalue.After an lvalue-to-rvalue conversion, the rvalue's
//type is int.
}
1.5
在理解了左值和右值的概念后,我们就能够更好理解为什么有些运算符需要右值,而某些
场合则需要左值。简单说来,当操作符的某个操作数是一个表达式,而我们只需要该表达
式的值时,如果该表达式不是右值,那么我们需要取出该表达式的值;比如算术运算中,
我们只需要左右操作数的值,这个时候对左右操作数的要求就是右值。任何用作其操作数
的左值表达式,都需要转化为右值。如果我们需要的不是该表达式的值,而是需要使用表
达式的其他信息;比如我们只是关心表达式的类型信息,比如作为sizeof的操作数,那么
我们对表达式究竟是左值还是右值并不关心,我们只需要得到他的类型信息。(按,在
C++中,表达式的类型信息也有静态、动态之分,这个情况下,表达式的左值性,也会影响
到一些操作符的语义。比如typeid,后有分析)。有些操作符则必需要求其操作数是左值,
因为他们需要的是该表达式所引用对象的信息,比如地址;或者希望引用或修改该对象的
值,比如赋值运算。
根据分析,我们可以总结出哪些表达式在C中是左值,而哪些操作符又要求其操作数是左
值表达式:
表1:左值表达式 (From C Reference Manual )
--------------------------------------------------
表达式 | 条件 |
__________________________________________________
Name | Name 为变量名 |
--------------------------------------------------
E[k] | \ |
--------------------------------------------------
(e) //括号表达式 | e 为左值 |
--------------------------------------------------
e.name | e 为左值 |
--------------------------------------------------
e->name | \ |
--------------------------------------------------
*e | \ |
--------------------------------------------------
string literal(字符串字面值) | \