服务器故障描述

某公司有一台服务器,上面有8块硬盘,组成了raid5磁盘阵列,其中有2块硬盘提示故障,故障灯亮起,其他硬盘状态正常。上层应用已经不可使用。

故障盘的修复和备份

服务器上有2块硬盘出现物理故障,需要先对其进行物理修复,然后备份里面的数据,工程师按照常规流程对存在物理故障的2块硬盘进行了物理修复,同时也确认了2块硬盘的故障原因分别是磁头损坏和逻辑故障,当然,这些故障都可以经硬件修复后备份出硬盘内的数据。

服务器硬盘故障数据损坏(服务器2块硬盘掉线数据恢复解决方案)(1)

判断服务器起始扇区

镜像好所有硬盘的数据后,数据恢复工程师使用底层数据查看工具将所有硬盘都打开,查询55AA标志,查找结果如下图所示,注意看下图中特别标注的“05”的位置,这个标志代表了这应该是一个扩展分区,所以这不是我们要找的正常分区,因此将这个分区排除了。

服务器硬盘故障数据损坏(服务器2块硬盘掉线数据恢复解决方案)(2)

继续向下查找,最终找到一个满足“55AA”标志的同时又在“0x01C6”位置的数值所指向的下一个扇区是分区头部的分区。也就是下图中的位置:

服务器硬盘故障数据损坏(服务器2块硬盘掉线数据恢复解决方案)(3)

这个盘就是我们最终要找的服务器内的第一块硬盘。GPT分区所在扇区起始于172032扇区,因此初步确定LUN的起始扇区是172032扇区。

判断条带大小

raid5阵列中,每个条带组中包含一个校验区,校验区的大小和一个正常条带的大小是相同的,因此,在数据恢复判断条带大小的时候,可以通过这一规律进行分析。经过分析,该服务器阵列中的条带大小是1024扇区。

判断raid磁盘阵列硬盘顺序

根据已经分析出来的1024扇区的条带大小,以及扇区起始位置,校验区走向这三个因素,我们可以确定服务器上所有硬盘在raid阵列中的盘序。

服务器硬盘故障数据损坏(服务器2块硬盘掉线数据恢复解决方案)(4)

重组raid5阵列

借助数据恢复工具将所有硬盘的镜像文件按照分析出来的盘序依次添加,输入基础信息后重组raid5阵列。重组完成后,校验数据完整性,检查上层应用是否可用,确认无误后请客户验证数据恢复结果。

移交数据

客户工程师亲自对上层数据验收后确认数据完整无误,可移交。

由客户使用新硬盘替换损坏的硬盘重建raid阵列后,将恢复的数据迁移到客户服务器上,本次数据恢复服务圆满成功。

,