操作系统还负责磁盘管理的其他几个方面。本节讨论磁盘初始化、磁盘引导、坏块恢复等。
磁盘格式化一个新的磁盘是一个空白盘,它只是一个磁性记录材料的盘子。在磁盘可以存储数据之前,它必须分成扇区,以便磁盘控制器能够读写,这个过程称为低级格式化或物理格式化。低级格式化为每个扇区使用特殊的数据结构,填充磁盘。每个扇区的数据结构通常由头部、数据区域(通常为512字节大小)和尾部组成。头部和尾部包含了一些磁盘控制器的使用信息,如扇区号和纠错代码(ECC)。当控制器通过正常I/O写入一个扇区的数据时,ECC采用根据数据区域所有字节而计算的新值来加以更新。在读取一个扇区时,ECC值会重新计算,并与原来存储的值相比较,如果存储和计算的数值不一样,则表示扇区数据区已损坏,并且磁盘扇区可能已坏。ECC是纠错代码,因为它有足够的信息,以便在只有少数数据损坏时,控制器能够识别哪些位已经改变,并且计算它们的正确值应该是什么。然后它会报告可恢复的软错误。当读或写一个扇区时,控制器自动进行ECC处理。大多数磁盘在工厂时作为制造过程的一部分就已低级格式化。这种格式化能让制造商测试磁盘,并且初始化逻辑块号到无损磁盘扇区的映射。对于许多磁盘,当磁盘控制器低级格式化磁盘时,还能指定在头部和尾部之间留下多长的数据区。通常有几个选择,如256、512和1024字节等。采用较大扇区来低级格式化磁盘,意味着每个磁道的扇区数会更少,但也意味着每个磁道的头部和尾部信息会更少,用户数据的可用空间会更多。有的操作系统只能处理512字节的扇区大小。在可以使用磁盘存储文件之前,操作系统仍然需要将自己的数据结构记录在磁盘上。这分为两步:
- 第一步是将磁盘分为由柱面组成的多个分区。操作系统可以将每个分区作为一个单独磁盘。例如,一个分区可以存储操作系统的可执行代码,而另一个分区存储用户数据;
- 第二步是逻辑格式化,或创建文件系统。在这一步,操作系统将初始的文件系统数据结构存储到磁盘上。这些数据结构包括空闲和已分配的空间和一个初始为空的目录。
为了提高效率,大多数操作系统将块组合在一起变成更大的块,经常称为簇。磁盘I/O按块完成,而文件系统I/O按簇完成,有效确保了I/O具有更多的顺序访问和更少的随机访问的特点。有些操作系统允许特殊程序将磁盘分区作为逻辑块的一个大的有序数组,而没有任何文件系统数据结构。这个数组有时称为原始磁盘,这个数组的I/O称为原始I/O。例如,有些数据库系统喜欢使用原始I/O,因为能够允许它们控制每条数据库记录存储的精确磁盘位置。原始I/O绕过所有文件系统服务,如缓冲区缓存、文件锁定、预取、空间分配、文件名和目录等。虽然某些应用程序可以通过原始分区来实现自己特殊的更为高效的存储服务,但是大多数应用程序在使用常规文件系统服务时会执行的更好。
引导块为了开始运行计算机,如打开电源或重启时,它必须有一个初始程序来运行。这个初始自举程序往往很简单。它初始化系统的所有部分,从CPU寄存器到设备控制器和内存,接着启动操作系统。为此,自举程序找到磁盘上的操作系统内核,加载到内存,并转到起始地址以便幵始操作系统的执行。对于大多数计算机,自举程序处在只读存储器(ROM)中。这个位置非常方便,因为ROM不需要初始化而且位于固定位置,这便于处理器在上电或复位时开始执行。并且,由于ROM是只读的,不会受到计算机病毒的影响。它的问题是,改变这种自举代码需要改变ROM硬件芯片。因此,大多数系统存储一个极小的自举程序在启动ROM中,它的作用是从磁盘上调入完整的引导程序。这个完整的引导程序可以轻松改变:可以简单地将新的版本写到磁盘。完整的引导程序存储在磁盘固定位置上的“启动块”。具有启动分区的磁盘称为启动磁盘或系统磁盘。引导ROM内的代码指示磁盘控制器将引导块读到内存(这时不加载设备驱动程序),然后开始执行代码。完整的自举程序比引导ROM的自举程序更加复杂。它可以从非固定的磁盘位置处加载整个操作系统,并且开始运行操作系统。即使如此,完整的自举程序可能很小。
Windows的磁盘引导
下面以Windows为例,分析引导过程。首先,请注意,Windows允许将磁盘分为多个分区:
- 有一个分区为引导分区,包含操作系统和设备驱动程序。
- Windows系统将引导代码存在磁盘的第一个扇区,它称为主引导记录(MBR)。引导首先运行驻留在系统ROM内存中的代码。这个代码指示系统从MBR中读取、引导代码。除了包含引导代码,MBR包含:一个表(以列出磁盘分区)和一个标志(以指示从哪个分区引导系统),如上图所示。
- 当系统找到引导分区,它读取分区的第一个扇区,称为引导扇区,并继续余下的引导过程,这包括加载各种子系统和系统服务
因为磁盘具有移动部件并且容错差(请记住,磁头恰好飞行在磁盘表面上方),容易出现故障。有时,故障是彻底的,在这种情况下,需要更换磁盘,并且从备份介质上将其内容恢复到新的磁盘。更为常见的是,一个或多个扇区坏掉。大多数磁盘出厂时就有坏块。这些坏块的处理多种多样,取决于使用的磁盘和控制器。对于简单磁盘,如采用IDE控制器的磁盘,可以手动处理坏块。一种策略是,在格式化磁盘时扫描磁盘以便发现坏块。发现的任何坏块,标记为不可用,以便文件系统不再分配它们。如果在正常操作时块变坏了,则必须人工运行特殊程序(如Linux命令 badlocks),以便搜索坏块并锁定它们。坏块中的数据通常会丢失。更为复杂的磁盘在恢复坏块时更为智能。它的控制器维护磁盘内的坏块列表。这个列表在出厂低级格式化时初始化,并且在磁盘使用寿命内更新。低级格式化将一些块放在一边作为备用,操作系统看不到这些块。控制器可以采用备用块来逻辑地替代坏块。这种方案称为扇区备用或扇区转寄。典型的坏扇区事务可能如下:
- 操作系统尝试读取逻辑块87。
- 控制器计算ECC,并且发现扇区是坏的。它向操作系统报告这一发现。
- 当下次重启操作系统时,可以运行特殊命令,以告诉控制器通过备用块替代坏块。
- 之后,每当系统试图访问逻辑块87时,这一请求转换成控制器的替代扇区的地址。
请注意,控制器的这种重定向可能会使操作系统的磁盘调度算法失效。为此,大多数磁盘在格式化时为每个柱面保留了少量的备用块,还保留了一个备用柱面。当需要重新映射坏块时,控制器尽可能地使用同一柱面的备用扇区。作为扇区备用的替代方案,有些控制器可以采用扇区滑动来替换坏块。这里有一个例子,假定逻辑块17变坏,并且第一个可用的备用块在扇区202之后。然后,扇区滑动重新映射从17到202的所有扇区,将它们全部下移一个扇区。也就是说,扇区202复制到备用扇区,扇区201到 202,200到 201,依次类推,直到扇区18复制到扇区19。按这种方式滑动扇区释放扇区18的空间,以使扇区17 能够映射到它。坏块的更换一般不是全自动的,因为坏块的数据通常会丟失。一些软错误可能触发一个进程,以便复制块数据和备份或滑动块。然而,不可恢复的硬错误导致数据丢失。因此,任何使用坏块的文件必须修复(如从备份磁带中恢复),而且通常需要人工干预。
,