Welcome

首页 / 软件开发 / C++ / 揭开C/C++中数组形参的迷雾

揭开C/C++中数组形参的迷雾2010-09-21 vckbase 乾坤一笑楔子

去年,周星星大哥曾经在VCKBASE/C++论坛发表过一篇文章“数组引用"以避免"数组降阶”,当时我不能深入理解这种用法的含义;时隔一年,我的知识有几经锤炼,终于对此文章渐有所悟,所以把吾所知作想详细道来,竟也成了一篇文章。希望本文能对新手有所启迪,同时也希望大家发现本文中的疏漏之处后不吝留言指教。

故事起源于周星星大哥给出的两个Demo,为了节省地方,我把两个Demo合二为一,也能说明同样的问题:

#include <iostream>
using namespace std;
void Foo1(int arr[100])
{
cout << "pass by pointer: " << sizeof(arr) << endl;
}
void Foo2(int (&arr)[100])
{
cout << "pass by reference: " << sizeof(arr) << endl;
}
void main()
{
int a[100];
cout << "In main function : " << sizeof(a) << endl;
Foo1(a);
Foo2(a);
}
其运行结果如下:In main function : 400
pass by pointer: 4
pass by reference: 400

这段代码说明了,如果数组形参是数组名形式(或者指针形式,下文讨论)时,使用sizeof运算符,将得不到原来数组的长度;如果用传递原数组引用的方法,则没有问题。

这段代码的确很难理解,因为这短短的十几行涉及到了形参与实参的关系、数组名和指针的关系、引用的意义、声名和表达式的关系这4大类问题,只要有1条理解不透、或者理解不正确,就理解不透上面的这段代码。本文也就从这4个问题入手,把这4个问题首先解决掉,然后再探讨上面的这段代码。虽然这样看来很是繁复,但是我认为从根上入手来理解、学习,是条似远实近的道路。

一、函数形参和实参的关系

void Foo(int a);
Foo(10);

这里的a叫做形式参数(parameter),简称形参;这里的10叫做实际参数(argument),简称实参。形参和式参之间是什么关系呢?他们是赋值的关系,也就是说:把实参传递给形参的过程,可以看作是把实参赋值给形参的过程。上面的例子中,实参10传递给形参a,就相当于a=10;这个赋值的过程。(因为数据类型多的很,无法举例子举全面,所以这里就不举例子了;如果觉得不好理解,就在vc中写个sample调试一下各种数据类型的情况,你就能够验证这个结论了。)

二、数组名和指针的关系

这个问题是个历史性的问题了,在C语言中,数组名是当作指针来处理的。更确切的说,数组名就是指向数组首元素地址的指针,数组索引就是距数组首元素地址的偏移量。理解这一点很重要,很多数组应用的问题就是有此而起的。这也就是为什么C语言中的数组是从0开始计数,因为这样它的索引就比较好对应到偏移量上。在C语言中,编译过程中遇到有数组名的表达式,都会把数组名替换成指针来处理;编译器甚至无法区分a[4]和4[a]的区别!*2 但是下面这一点需要注意:

int a[100];
int *b;

这两者并不等价,第一句话声明了数组a,并定义了这个数组,它有100个int型元素,sizeof(a)将得到整个数组所占的内存大小,是400;第二句话只是声明并定义了一个int型的指针,sizeof(b)将得到这个指针所占的内存大小,是4。所以说,虽然数组名在表达式中一般会当作指针来处理,但是数组名和指针还是有差距的,最起码有a==&a[0]但是sizeof(a)!=sizeof(a[0])。

并且在ANSI C标准中,也明文规定:在函数参数的声明中,数组名北边一起当作指向该数组第一个元素的指针。所以,下面的几种书写形式是等效的:

void Foo1(int arr[100]){}
void Foo2(int arr[]){}
void Foo3(int *arr){}
C++尽可能的全面兼容C语言,所以这一部分的语法相同。