从头开始介绍一门编程语言总是显得很困难,因为有许多细节还没有介绍,很难让读者在头脑中形成一幅完整的图。在本章中,我将向大家展示一个例子程序,并逐行讲解它的工作过程,试图让大家对C语言的整体有一个大概的印象。这个例子程序同时向你展示了你所熟悉的过程在C语言中是如何实现的。这些信息再加上本章所讨论的其他主题,向你介绍了c语言的基础知识,这样你就可以自己编写有用的C程序了。
我们所要分析的这个程序从标准输入读取文本并对其进行修改,然后把它写到标准输出。程序1.1首先读取一串列标号。这些列标号成对出现,表示输入行的列范围。这串列标号以一个负值结尾,作为结束标志。剩余的输入行被程序读入并打印,然后输入行中被选中范围的字符串被提取出来并打印。注意,每行第1列的列标号为零。例如,如果输入如下:
则程序的输出如下:
这个程序的重要之处在于它展示了当你开始编写C程序时所需要知道的绝大多数基本技巧。
程序1.1重排字符
1.1.1 空白和注释
现在,让我们仔细观察这个程序。首先需要注意的是程序的空白:空行将程序的不同部分分隔开来;制表符( tab )用于缩进语句,更好地显示程序的结构等等。C是一种自由格式的语言,并没有规则要求你必须怎样书写语句。然而,如果你在编写程序时能够遵守一些约定还是非常值得的,它可以使代码更加容易阅读和修改,千万不要小看了这一点。
清晰地显示程序的结构固然重要,但告诉读者程序能做些什么以及怎样做则更为重要。注释(comment)就是用于实现这个功能。
这段文字就是注释。注释以符号/*开始,以符号*/结束。在C程序中,凡是可以插入空白的地方都可以插入注释。然而,注释不能嵌套,也就是说,第1个*/符号和第1个*/符号之间的内容都被看作是注释,不管里面还有多少个/*符号。
在有些语言中,注释有时用于把一段代码“注释掉",也就是使这段代码在程序中不起作用,但并不将其真正从源文件中删除。在C语言中,这可不是个好主意,如果你试图在一段代码的首尾分别加上/*和*/符号来“注释掉”这段代码,你不一定能如愿。如果这段代码内部原先就有注释存在,这样做就会出问题。要从逻辑上删除一段C代码,更好的办法是使用#if指令。只要像下面这样使用:
在#if和#endif之间的程序段就可以有效地从程序中去除,即使这段代码之间原先存在注释也无妨,所以这是一种更为安全的方法。预处理指令的作用远比你想象的要大,我将在第14章详细讨论这个问题。
1.1.2 预处理指令
这5行称为预处理指令(preprocessor directives) ,因为它们是由预处理器(preprocessor)解释的。预处理器读入源代码,根据预处理指令对其进行修改,然后把修改过的源代码递交给编译器。
在我们的例子程序中,预处理器用名叫stdio.h的库函数头文件的内容替换第1条#include指令语句,其结果就仿佛是stdio.n的内容被逐字写到源文件的那个位置。第2、3条指令的功能类似,只是它们所替换的头文件分别是stdlib.n和string.h.
stdio.h头文件使我们可以访问标准I/O库(Standard I/O Library)中的函数,这组函数用于执行输入和输出。 stdlib.h定义了EXIT_SUCCESS和EXIT_FAILURE符号。我们需要string.h头文件提供的函数来操纵字符串。
这些声明被称为函数原型(function prototype),它们告诉编译器这些以后将在源文件中定义的函数的特征。这样,当这些函数被调用时,编译器就能对它们进行准确性检查。每个原型以一个类型名开头,表示函数返回值的类型。跟在返回类型名后面的是函数的名字,再后面是函数期望接受的参数。所以,函数read_column_numbers返回一个整数,接受两个类型分别是整型数组和整型标量的参数。函数原型中参数的名字并非必需,我这里给出参数名的目的是提示它们的作用。
rearrange函数接受4个参数。其中第1个和第2个参数都是指针(pointer),指针指定一个存储于计算机内存中的值的地址,类似于门牌号码指定某个特定的家庭位于街道的何处。指针赋予C语言强大的威力,我将在第6章详细讲解指针。第2个和第4个参数被声明为const ,这表示函数将不会修改函数调用者所传递的这两个参数。关键字void表示函数并不返回任何值,在其他语言里,这种无返回值的函数被称为过程(procedure)。
1.1.3 main函数
这几行构成了main函数定义的起始部分。每个C程序都必须有一个main函数,因为它是程序执行的起点。关键字int表示函数返回一个整型值,关键字void表示函数不接受任何参数。main函数的函数体包括左花括号和与之相匹配的右花括号之间的任何内容。
请观察一下缩进是如何使程序的结构显得更为清晰的。
这几行声明了4个变量:一个整型标量,一个整型数组以及两个字符数组。所有4个变量都是main函数的局部变量,其他函数不能根据它们的名字访问它们。当然,它们可以作为参数传递给其他函数。
这条语句调用函数read_column_numbers,数组columns和MAX_COLS所代表的常量(20)作为参数传递给这个函数。在C语言中,数组参数是以引用(reference)形式进行传递的,也就是传址调用,而标量和常量则是按值(value)传递的(分别类似于Pascal和Modula中的var参数和值参数)。在函数中对标量参数的任何修改都会在函数返回时丢失,因此,被调用函数无法修改调用函数以传值形式传递给它的参数。然而,当被调用函数修改数组参数的其中一个元素时,调用函数所传递的数组就会被实际地修改。
事实上,关于C函数的參数传递规则可以表述如下:
所有传递给函数的参数都是按值传递的。
但是,当数组名作为参数时就会产生按引用传递的效果,如上所示。规则和现实行为之间似乎存在明显的矛盾之处,第8章会对此作出详细解释。
用于描述这段代码的注释看上去似乎有些多余。但是,如今软件开销的最大之处并非在于编写,而是在于维护。在修改一段代码时所遇到的第1个问题就是要搞清楚代码的功能。所以,如果你在代码中插入一些东西,能使其他人(或许就是你自己! )在以后更容易理解它,那就非常值得这样做。但是,要注意书写正确的注释,并且在你修改代码时要注意注释的更新。注释如果不正确那还不如没有!
这段代码包含了一个while循环。在C语言中, while循环的功能和它在其他语言中一样。它首先测试表达式的值,如果是假的(0)就跳过循环体。如果表达式的值是真的(非0) ,就执行循环体内的代码,然后再重新测试表达式的值。
这个循环代表了这个程序的主要逻辑。简而言之,它表示:
gets函数从标准输入读取一行文本并把它存储于作为参数传递给它的数组中。一行输入由一串字符组成,以一个换行符(newline)结尾。gets函数丢弃换行符,并在该行的末尾存储一个NUL字节(一个NUL字节是指字节模式为全0的字节,类似‘\0’这样的字符常量)。然后, gets函数返回一个非NULL值,表示该行已被成功读取。当gets函数被调用但事实上不存在输入行时,它就返回NULL值,表示它到达了输入的末尾(文件尾)。
在C程序中,处理字符串是常见的任务之一。尽管C语言并不存在"string”数据类型,但在整个语言中存在一项约定:字符串就是一串以NUL字节结尾的字符。NUL是作为字符串终止符,它本身并不被看作是字符串的一部分。字符串常量(string literal)就是源程序中被双引号括起来的一串字符。例如,字符串常量:
“Hello”
在内存中占据6个字节的空间,按顺序分别是H、 e、l、l、o和NUL。
printf函数执行格式化的输出。C语言的格式化输出比较简单,如果你是Modula或Pascal的用户,你肯定会对此感到愉快。printf函数接受多个参数,其中第一个参数是一个字符串,描述输出的格式,剩余的参数就是需要打印的值。格式常常以字符串常量的形式出现。
格式字符串包含格式指定符(格式代码)以及一些普通字符。这些普通字符将按照原样逐字打印出来,但每个格式指定符将使后续参数的值按照它所指定的格式打印。表1.1列出了一些常用的格式指定符。如果数组input包含字符串Hi friend!,那么下面这条语句
的打印结果是:
后面以一个换行符终止。
表1.1 常用printf格式代码
例子程序接下来的一条语句调用rearrange函数。后面3个参数是传递给函数的值,第1个参数则是函数将要创建并返回给main函数的答案。记住,这种参数是唯一可以返回答案的方法,因为它是一个数组。最后一个print函数显示输入行重新整理后的结果。
最后,当循环结束时, main函数返回值EXIT_SUCCESS,该值向操作系统提示程序成功执行。右花括号标志着main函数体的结束。
1.1.4 read_column_numbers函数
这几行构成了read_column_numbers函数的起始部分。注意,这个声明和早先出现在程序中的该函数原型的参数个数和类型以及函数的返回值完全匹配。如果出现不匹配的情况,编译嚣就会报错
在函数声明的数组参数中,并未指定数组的长度。这种格式是正确的,因为不论调用函数的程序传递给它的数组参数的长度是多少,这个函数都将照收不误。这是一个伟大的特性,它允许单个函数操纵任意长度的一维数组。这个特性不利的一面是函数没法知道该数组的长度。如果确实需要数组的长度,它的值必须作为一个单独的参数传递给函数。
当本例的read_column_numbers函数被调用时,传递给函数的其中一个参数的名字碰巧与上面给出的形参名字相同。但是,其余几个参数的名字与对应的形参名字并不相同。和绝大多数语言一样,C语言中形式参数的名字和实际参数的名字并没有什么关系。你可以让两者相同,但这并非必须。
这里声明了两个变量,它们是该函数的局部变量。第1个变量在声明时被初始化为0,但第2个变量并未初始化。更准确地说,它的初始值将是一个不可预料的值,也就是垃圾。在这个函数里,它没有初始值并不碍事,因为函数对这个变量所执行的第1个操作就是对它赋值。
这又是一个循环,用于读取列标号。scanf函数从标准输入读取字符并根据格式字符串对它们进行转换-类似于printf函数的逆操作。 scanf函数接受几个参数,其中第1个参数是一个格式字符串,用于描述期望的输入类型。剩余几个参数都是变量,用于存储函教所读取的输入数据。scanf函数的返回值是函数成功转换并存储于参数中的值的个数。
我们现在可以解释表达式:
格式码%d表示需要读取一个整型值。字符是从标准输入读取,前导空白将被跳过。然后这些数字被转换为一个整数,结果存储于指定的数组元素中。我们需要在参数前加上一个"&"符号,因为数组下标选择的是一个单一的数组元素,它是一个标量。
while循环的测试条件由3个部分组成:
这个测试条件确保函数不会读取过多的值,从而导致数组溢出。如果scanf函数转换了一个整数之后,它就会返回1这个值。最后,
这个表达式确保函数所读取的值是正数。如果两个测试条件之一的值为假,循环就会终止。
表1.2 常用scanf格式码
&&是“逻辑与"操作符。要使整个表达式为真,&&操作符两边的表达式都必须为真。然而,如果左边的表达式为假,右边的表达式便不再进行求值,因为不管它是真是假,整个表达式总是假的。在这个例子中,如果num到达了它的最大值,循环就会终止,而表达式
便不再被求值。
scanf函数每次调用时都从标准输入读取一个十进制整数。如果转换失败,不管是因为文件已经读完还是因为下一次输入的字符无法转换为整数,函数都会返回0,这样就会使整个循环终止。如果输入的字符可以合法地转换为整数,那么这个值就会转换为二进制数存储于数组元素columns[num]中。然后, scanf 函数返回1。
接下来的一个&&操作符确保在scanf函数成功读取了一个数之后才对这个数进行是否赋值的测试。语句
使变量num的值增加1,它相当于下面这个表达式
以后我将解释为什么C语言提供了两种不同的方式来增加一个变量的值。
这个测试检查程序所读取的整数是否为偶数个,这是程序规定的,因为这些数字要求成对出现。%操作符执行整数的除法,但它给出的结果是除法的余数而不是商。如果num不是一个偶数,它除以2之后的余数将不是0。
puts函数是gets函数的输出版本,它把指定的字符串写到标准输出并在末尾添上一个换行符。程序接着调用exit函数,终止程序的运行, EXIT_FAILURE这个值被返回给操作系统,提示出现了错误。
当scan函数对输入值进行转换时,它只读取需要读取的字符。这样,该输入行包含了最后一个值的剩余部分仍会留在那里,等待被读取。它可能只包含作为终止符的换行符,也可能包含其他字符。不论如何while循环将读取并丢弃这些剩余的字符,防止它们被解释为第1行数据。
下面这个表达式
值得花点时间讨论。首先, getchar函数从标准输入读取一个字符并返回它的值。如果输入中不再存在任何字符,函数就会返回常量EOF(在stdio.h中定义),用于提示文件的结尾。
从getchar函数返回的值被赋给变量ch ,然后把它与EOF进行比较。在赋值表达式两端加上括号用于确保赋值操作先于比较操作进行。如果ch等于EOF,整个表达式的值就为假,循环将终止。若非如此,再把ch与换行符进行比较,如果两者相等,循环也将终止。因此,只有当输入尚未到达文件尾并且输入的字符并非换行符时,表达式的值才是真的(循环将继续执行)。这样,这个循环就能剔除当前输入行最后的剩余字符。
现在让我们进入有趣的部分。在大多数其他语言中,我们将像下面这个样子编写循环:
它将读取一个字符,接下来如果我们尚未到达文件的末尾或读取的字符并不是换行符,它将继续读取下一个字符。注意这里两次出现了下面这条语句
C可以把赋值操作蕴含于while语句内部,这样就允许程序员消除冗余语句。
一个经常问到的问题是:为什么ch被声明为整型,而我们事实上需要它来读取字符?答案是EOF是一个整型值,它的位数比字符类型要多,把ch声明为整型可以防止从输入读取的字符意外地被解释为EOF,但同时,这也意味着接收字符的ch必须足够大,足以容纳EOF ,这就是ch使用整型值的原因。正如第3章所讨论的那样,字符只是小整型数而已,所以用一个整型变量容纳字符值并不会引起任何问题。
return语句就是函数向调用它的表达式返回一个值。在这个例子里,变量num的值被返回给调用该函数的程序,后者把这个返回值赋值给主程序的n_columns变量。
1.1.5 rearrange函数
这些语句定义了rearrange函数并声明了一些局部变量。此处最有趣的一点是:前两个参数被声明为指针,但在函数实际调用时,传给它们的参数却是数组名。当数组名作为实参时,传给函数的实际上是一个指向数组起始位置的指针,也就是数组在内存中的地址。正因为实际传递的是一个指针而不是一份数组的拷贝,才使数组名作为参数时具备了传址调用的语义。函数可以按照操纵指针的方式来操纵实参,也可以像使用数组名一样用下标来引用数组的元素。第8章将对这些技巧进行更详细的说明。
但是,由于它的传址调用语义,如果函数修改了形参数组的元素,它实际上将修改实参数组的对应元素。因此,例子程序把columns声明为const就有两方面的作用。首先,它声明该函数的作者的意图是这个参数不能被修改。其次,它导致编译器去验证是否违背该意图。因此,这个函数的调用者不必担心例子程序中作为第4个参数传递给函数的数组中的元素会被修改。
这个函数的真正工作是从这里开始的。我们首先获得输入字符串的长度,这样如果列标号超出了输入行的范围,我们就忽略它们。C语言的for语句跟它在其他语言中不太像,它更像是while语句的一种常用风格的简写法。for语句包含3个表达式(顺便说一下,这3个表达式都是可选的)。第一个表达式是初始部分,它只在循环开始前执行一次。第二个表达式是测试部分,它在循环每执行一次后都要执行一次。第三个表达式是调整部分,它在每次循环执行完毕后都要执行一次,但它在测试部分之前执行。为了清楚起见,上面这个for循环可以改写为如下所示的while循环:
这是for循环的循环体,它一开始计算当前列范围内字符的个数,然后决定是否继续进行循环。如果输入行比起始列短,或者输出行已满,它便不再执行任务,使用break语句立即退出循环。
接下来的一个测试检查这个范围内的所有字符是否都能放入输出行中,如果不行,它就把nchars调整为数组能够容纳的大小。
最后, strncpy函数把选中的字符从输入行复制到输出行中可用的下一个位置。strncpy函数的前两个参数分别是目标字符串和源字符串的地址。在这个调用中,目标字符串的位置是输出数组的起始地址向后偏移output_col列的地址,源字符串的位置则是输入数组起始地址向后偏移columns[col]个位置的地址。第3个参数指定需要复制的字符数,输出列计数器随后向后移动nchars个位置。
循环结束之后,输出字符串将以一个NUL字符作为终止符。注意,在循环体中,函数经过精心设计,确保数组仍有空间容纳这个终止符。然后,程序执行流便到达了函数的未尾,于是执行一条隐式的return语句。由于不存在显式的return语句,所以没有任何值返回给调用这个函数的表达式。在这里,不存在返回值并不会有问题,因为这个函数被声明为void (也就是说,不返回任何值) ,并且当它被调用时,并不对它的返回值进行比较操作或把它赋值给其他变量。
1.2补充说明
本章的例子程序描述了许多C语言的基础知识。但在你亲自动手编写程序之前,你还应该知道一些东西。首先是putchar函数,它与getchar函数相对应,它接受一个整型参数,并在标准输出中打印该字符(如前所述,字符在本质上也是整型)
同时,在函数库里存在许多操纵字符串的函数。这里我将简单地介绍几个最有用的。除非特别说明,这些函数的参数既可以是字符串常量,也可以是字符型数组名,还可以是一个指向字符的指针。
strcpy函数与strncpy函数类似,但它并没有限制需要复制的字符数量。它接受两个参数:第2个字符串参数将被复制到第1个字符串参数,第1个字符串原有的字符将被覆盖。 strcat函数也接受两个参数,但它把第2个字符串参数添加到第1个字符串参数的末尾。在这两个函数中,它们的第1个字符串参数不能是字符串常量。而且,确保目标字符串有足够的空间是程序员的责任,函数并不对其进行检查。
在字符串内进行搜索的函数是strchr,它接受两个参数,第1个参数是字符串,第2个参数是一个字符。这个函数在字符串参数内搜索字符参数第1次出现的位置,如果搜索成功就返回指向这个位置的指针,如果搜索失败就返回一个NULL指针。 strstr函数的功能类似,但它的第2个参数也是一个字符串,它搜索第2个字符串在第1个字符串中第1次出现的位置。
1.3编译
你编译和运行C程序的方法取决于你所使用的系统类型。在UNIX系统中,要编译一个存储于文件testing.c的程序,要使用以下命令:
cc testing.c
a.out
在PC中,你需要知道你所使用的是哪一种编译器。如果是Borland C ,在MS-DOS窗口中,可以使用下面的命令:
hcc testing.c
testing
1.4总结
本章的目的是描述足够的C语言的基础知识,使你对C语言有一个整体的印象。有了这方面的基础,在接下来章节的学习中,你会更加容易理解。
本章的例子程序说明了许多要点。注释以/*开始,以*/结束,用于在程序中添加一些描述性的说明。
#include预处理指令可以使一个函数库头文件的内容由编译器进行处理, #define指令允许你给字面值常量取个符号名。
所有的C程序必须有一个main函数,应是程序执行的起点。函数的标量参教通过传值的方式进行传递而数组名参数则具有传址调用的语义。字符串是一串由NUL字节结尾的字符,并且有一组库函数以不同的方式专门用于操纵字符串。printf函数执行格式化输出, scanf函数用于格式化输入, getchar和putchar分别执行非格式化字符的输入和输出。If和while语句在C语言中的用途跟它们在其他语言中的用途差不太多。
通过观察例子程序的运行之后,你或许想亲自编写一些程序。你可能觉得C语言所包含的内容应该远远不止这些,确实如此,但是,这个例子程序应该足以让你上手了。
1.5 警告的总结
1.在scanf函数的标量参数前未添加&字符。
2.机械地把printf函数的格式代码照搬于scan函数。
3.在应该使用&&操作符的地方误用了&操作符。
4.误用=操作符而不是==操作符来测试相等性。
1.6编程提示的总结
1. 使用#include指令避免重复声明
2. 使用#define指令给常量值取名。
3. 在#include文件中放置函数原型。
4. 在使用下标前先检查它们的值。
5. 在while或i表达式中蕴含赋值操作。
6.如何编写一个空循环体。
7.始终要进行检查,确保数组不越界。
1.7问题
1.C是一种自由形式的语言,也就是说并没有规则规定它的外观究竟应该怎样。但本章的例子程序遵循了一定的空白使用规则。你对此有何想法?
2.把声明(如函数原型的声明)放在头文件中,并在需要时用#include指令把它们包含于源文件中,这种做法有什么好处?
3.使用#deine字面值常量取名有什么好处?
4.依次打印一个十进制整数、字符串和浮点值,你应该在printf函数中分别使用什么格式代码?试编一例,让这些打印值以空格分隔,并在输出行的末尾添加一个换行符。
5.编写一条scanf语句,它需要读取两个整数,分别保存于quantity和price变量,然后再读取一个字符串,保存在一个名叫department的字符数组中。
6.C语言并不执行数组下标的有效性检查。你觉得为什么这个明显的安全手段会从语言中省略?
7.本章描述的rearrange程序包含下面的语句
strncpy( output output_col,
input columns [col], nchars);
strcpy函数只接受两个参数,所以它实际上所复制的字符数由第2个参数指定。在本程序中,如果用strcpy函数取代strncpy函数会出现什么结果?
8. rearrange程序包含下面的语句
while( gets( input ) != NULL ){
你认为这段代码可能会出现什么问题?
本文节选自《C和指针》
本书提供与C语言编程相关的全面资源和深入讨论。本书通过对指针的基础知识和高级特性的探讨,帮助程序员把指针的强大功能融入到自己的程序中去。 全书共18章,覆盖了数据、语句、操作符和表达式、指针、函数、数组、字符串、结构和联合等几乎所有重要的C编程话题。书中给出了很多编程技巧和提示,每章后面有针对性很强的练习,附录部分则给出了部分练习的解答。
,