引言

对于 C 程序员来说,最头痛的莫过于操作指针出现问题,导致程序数据错乱、甚至崩溃退出。其实还有更严重的情况,就是留下程序漏洞,被恶意攻击,造成更大的损失。

造成这些问题的原因,有的是程序员对于指针的技术原理和运行时机制掌握不到位,以为可以这么用,结果却埋下隐患。有的则是程序员警惕性不足,缺少对异常情况的判断与保护。

可以说,天下 C 程序员苦指针久矣。逃避肯定不是办法,那就勇敢地直面它吧。幸好,C 程序员们不用在黑暗中独自摸索,把《C 和指针》这本书的内容融汇贯通,就可无敌了。

学c语言指针注意什么(苦C语言指针久矣)(1)

掌握好指针,其实只要循序渐进走好三步就可以,就是首先能够 Hold 住指针的运算,保证怎么算都不会出错;然后是构建抽象数据类型(ADT),这是实现复杂处理逻辑的基础;最后是存乎一心,自由妙用。

不过,我觉得还是有必要先从修炼 C 语言基本功说起。

想要飞得高,先要站得稳

C 语言本身历史悠久,且更靠近系统底层,可以看作是高级语言与低级语言之间的“中级语言”。这意味着它拥有更多的自由,但使用不当也容易造成难以预料的破坏。

指针作为 C 语言中的一种特性,拥有直接访问程序内存的能力。这使得指针操作数据具备极高的效率,但缺少语言层面的保护,由程序员负全部责任。

因此,要搞明白指针,就必须先要对 C 语言有通盘掌握,想要展翅高飞,一定要立足先稳。

《C 和指针》的内容就涵盖了 C 语言的必备知识。包括语法规则、数据类型说明、操作符表达式等。拿着这本书,作为 C 语言的入门教程也完全没问题。

打牢了基础,再进入到书中对指针的讲解中,就水到渠成了。那么,指针到底是什么?

先明确关于内存的两个特点:

  1. 内存中的每个位置,由一个独一无二的地址标识;
  2. 内存中的每个位置,都包含一个值。

指针型变量,它存储的是内存地址标识值。通过指针变量访问内存中包含的值,称为间接访问或者解引用指针。

用代码来说话:

int a = 100; int *b = &a; // 定义整型指针 b 指向整型变量 a *b = 10; // b 以间接访问方式,修改变量 a 的值

第一步:Hold 住指针的运算

指针的运算可以分为两种,一类是算术运算,另一类是关系运算。其实它们的规则还是比较简单的,但却是实际编程中出错最多的地方。

要避免出错,安全是第一位的,我们先从一个特殊的指针变量说起。

C 语言标准里定义了一个关键词:NULL。它的含义是空指针,即不指向任何内存地址。这就意味着,一个指针变量被赋予NULL值时,那么就不能对它进行间接访问,否则会产生不可预料的后果。

所以一个指针变量,它在初始化时如果没有明确地赋值,或者它在使用完毕之后,都必须赋予NULL值。判断指针是否为NULL,这是保证指针运算安全性的前提。

有了安全保障,我们先来看算术运算,就是指针变量加减一个整数值:

int *a = NULL; int array[10] = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}; a = array; // 整型指针变量 a 指向数组第一个元素 array[0] 的地址 a ; // a 向后移动,指向 array[1] 的地址 a--; // a 向前移动,指向 array[0] 的地址

指针类型变量自增的结果,是在一段连续内存区域进行偏移,而其跨过的长度,就是sizeof(指针变量类型) * 跳变量字节。以上例来说,a 等同于偏移sizeof(int) * 1个字节,正好是整型数组的下一个元素位置。

对于初学者来说,会容易将a 理解成指针仅偏移一个字节,这是最大的坑,所以此处千万要理解透。

指针的关系运算,就是可以在指针变量之间以关系运算符>, <, =, !=进行比较。大小的比较,可以判定两个指针在连续内存区域上的位置关系。但如果是两段不相干的内存区,则关系运算没有意义。

关系运算可以用来实现连续内存区的循环处理,还有更多用法以及注意事项,可以在书中慢慢细品。

第二步:构建抽象数据类型

指针的运算能够拿下,那就要考虑更高层次的使用了。对于复杂问题的求解,仅是 C 语言内置类型和容器,显然是不够的。那么,基于结构体与指针,构建抽象数据类型,是 C 程序员的必备功底。

《C 和指针》一书中面向初学者还是非常友好的,以链表的实现作为示例,进行充分讲解。有了这个基础,再实现更复杂的哈希表、字典、队列、树、图等结构时,就有章可循了。

让我们先来学习一下在构建单链表的过程中,指针应当如何使用。

首先是定义链表节点:

typedef struct NODE { struct NODE *link; // 结构成员的自引用指针,用来存储下一个节点的地址 int value; } Node;

在结构体中使用自引用指针成员,是关键之处,它是 C 语言中实现动态构建数据结构的基本。

那么在表头插入节点的过程,如下伪代码所示:

Node *head = HEAD(); // 获得链表表头节点 Node *new = NEW(); // 生成待插入新节点 Node *temp = NULL; // 临时节点指针 temp = head->link; // 将表头节点的下一节点地址临时保存 head->link = new; // 将新节点置为表头节点的下一节点 new->link = temp; // 将暂存节点置为新节点的下一节点 temp = NULL;

看代码觉着有些抽象是吗?书中实现了完整的有序单链表插入功能,作者精心绘制了数据插入分解图,可以说是一目了然。话说有图有真相,如此学习起来怎能不事半功倍呢。

学c语言指针注意什么(苦C语言指针久矣)(2)

摘自《C 和指针》有序单链表插入分解图

如果链表的实现已经掌握了,那就可以放心学习书中第17章,关于经典抽象数据类型的内容。它包括了堆栈、队列,以及二叉搜索树的实现。

第三步:自由妙用

在掌握了指针的运算与如何构建抽象数据类型之后,C 程序员们就可以向更高境界出发,即存乎一心,自由妙用。

这时候会发现,所谓程序,不过就是指令、数据与存储地址。那么,凡是存放着指令与数据的内存区域,都可以通过指针来运算,设计出高妙的用法。

以网络通信开发的一个场景为例,其中对于应用协议的多版本兼容是硬性要求。那么一种简单的办法就是每个协议版本对对应一个函数。例如Protocol_v1(); protocol_v2(); ……。

但这样做在程序升级的时候,就会给运维工作带来麻烦。因为必须先停止老程序运行,然后再启动新程序。这期间服务不可避免地会暂停。

基于书中介绍的函数指针,就可以平滑升级的方式解决这个问题。步骤是先将协议解析功能置于动态库中,然后用回调的方式,从动态库中获得对应版本的处理方法。

使用函数指针的伪代码示例:

int protocol_v1(char *data); // 老版本协议解析方法 int protocol_v2(char *data); // 新版本协议解析方法 void protocol_work(int version, char *data) { int (*pProtocol)(char *) = NULL; // 定义函数指针变量,它必须与待调用函数的形参列表一致 switch(version) { // 根据不同协议版本,将对应的处理方法赋予 pProtocol 变量 case V1: pProtocol = protocol_v1; break; case V2: pProtocol = protocol_v2; break; } pProtocol(data); // 实现了对不同版本协议的兼容处理 }

协议版本有更新时,只需要将动态库进行替换即可,主程序只要实现动态库注入与热更新功能,就能在不影响业务运行的情况下实现平滑升级。

当然,以上仅是以一例说明,指针与指令结合,可以实现怎样的妙用。其实 C 程序员们可以从书中获得更多的启示,再与实际业务相结合,创造出简明高效的用法。

结语

《C 和指针》的作者 Kenneth Reek 是罗彻斯特理工大学的计算机科学教授,同时也是多家公司的技术顾问。在学术研究与 C 语言编程实践上,都兼具了相当丰富的经验。

学c语言指针注意什么(苦C语言指针久矣)(3)

Kenneth Reek

所以在这本书中,不仅能看到翔实的 C 语言理论知识,还有解决实际问题的干货。我从书中总结出三条使用指针的安全注意事项,帮助大家避免掉坑。

  1. 在动态分配内存之后,第一件事就要判断是否为NULL,不要假设它会永远成功;
  2. 一定要保证在连续内存区的边界之内操作,任何一个越界判断都不是多余的;
  3. 指针指向的动态内存不再使用时,一定要第一时间释放。

无论是刚入行的菜鸟还是摸爬滚打多年的老鸟,都需要在案头摆上这本《C 和指针》。对于菜鸟来说,这本书就是破解恐惧,迅速提升功力的捷径;对于老鸟来说,则是升级思维,通向更高境界之路。

愿天下 C 程序员们征服指针,无敌开挂!

,