服务器存储raid数据恢复环境:

华为OceanStor某型号存储,16块FC硬盘(包含一块热备盘)组成RAID5。

服务器存储raid故障:

该存储RAID5中的一块硬盘由于未知原因离线,热备盘上线同步数据,同步完成一半左右时另外一块硬盘未知原因离线,数据同步失败,raid5崩溃,上层的lun失效。管理员联系我们数据恢复中心对该存储中的raid5进行数据恢复。

服务器存储raid数据恢复过程:

1、检测raid5中所有磁盘:

北亚硬件工程师首先对故障raid中所有磁盘进行物理故障检测,检测结果为第一块掉线硬盘存在物理故障,其他的包括后面掉线的硬盘均无物理故障。

2、备份raid5中所有磁盘:

将raid5中所有磁盘都镜像备份,后续的数据恢复操作都在镜像文件中进行,避免可能对原始数据造成的二次破坏。

3、分析raid5结构:

数据恢复工程师对故障raid中的所有磁盘进行分析,找出热备盘(热备盘与其他数据盘有明显区别)。由于raid是条带化的,raid中的数据是按照一定规律存储,通过分析raid中的数据库页在每一个物理磁盘中的分布情况,北亚数据恢复工程师计算出raid的磁盘顺序、数据走向、条带大小等基本信息。

4、找出raid5中被同步的坏盘:

根据分析获取到的RAID信息,尝试通过北亚自主开发的RAID虚拟重组程序将原始RAID虚拟重组出来。故障RAID中掉线两块盘并且有一块硬盘中的数据由于同步失败损坏,数据恢复工程师仔细分析每一块硬盘中的数据,发现有一块硬盘在同一个条带上的数据和其他硬盘明显不一样,因此初步判断此硬盘是被同步损坏的硬盘。通过北亚自主开发的RAID校验程序对这个条带进行校验,最终确定那块被同步损坏的硬盘。

5、分析raid中的lun信息:

分析lun在故障raid中的分配状态和lun分配的数据块,然后根据数据MAP导出LUN的数据。

6、解析EXT3文件系统:

由于是使用热备盘虚拟重组的RAID,EXT3文件系统无法正常挂载,只能提取出oracle数据库文件。利用北亚自主开发的文件系统解析程序对其进行文件系统解析并导出oracle数据库文件,然后把数据库文件移交给数据库恢复工程师进行校验和验证。

7、修复数据库,检测数据文件完整性:

使用Oracle数据库文件检测工具检测每个数据库文件的完整性但是发现错误。于是使用北亚自主研发的Oracle数据库检测工具进行检测,发现部分数据库文件和日志文件错误, system和sysaux表空间存在许多坏块,控制文件全部损坏,eschoolspace表空间的文件的坏块更多,undotbs02丢失;北亚数据库数据恢复工程师对这些文件进行手工修复。

华为raid卡修复(服务器存储数据恢复)(1)

北亚数据恢复——OceanStor存储数据恢复

华为raid卡修复(服务器存储数据恢复)(2)

北亚数据恢复——OceanStor存储数据恢复

北亚数据库数据恢复工程师创建控制文件、undo表空间,启动数据库到mount。由于system数据文件存在坏块,数据库不能open,各种隐含参数也不能绕过system的坏块。搭建数据库环境并使用dmp文件还原数据库,最终导入10G左右的数据。

华为raid卡修复(服务器存储数据恢复)(3)

北亚数据恢复——OceanStor存储数据恢复

数据验证:

由用户方配合启动Oracle数据库,在本地虚拟机安装OA客户端,通过OA客户端对数据记录进行验证,并且让用户安排不同部门人员进行远程验证。验证通过,数据恢复成功。

,