数据恢复故障描述
一台HP 服务器,挂接一台HP MSA50磁盘阵列,内接5块1TB硬盘,原先结构为RAID5。
使用一段时间后,其中一块硬盘掉线,因RAID5支持一块硬盘出错的冗余保护,所以数据并无出错。接着运行很短时间后服务
出现故障,遂找人维修,维修人员未完全了解情况,将剩下的4块硬盘重新创建了一组全新的RAID5并完全同步完成,导致原来数据全部丢失。
已经有几家数据恢复公司处理过,无法恢复。
数据恢复故障分析
HP SMART ARRAY在创建一组新的RAID5时,默认会全盘重建所有块校验,也就是说在组成RAID5的任一条带中,总有一个校验块的数据是创建时生成的,相对于原先的有用数据而言,即是破坏的。经过分析,后生成的4块盘RAID5是按双循环,64K块大小,16次条带换校验的方式组织的,也就是说在4块磁盘成员中,大约每隔3M便会有1M的数据是错误的。
同时,分析得知,原先的5块盘RAID5的组成结构为双循环、128K块大小、16次条带换校验。
要想恢复数据,首先必须修复早掉线的硬盘,同时可恢复率仅可恢复到早掉线磁盘与新盘的组合,取决于早掉线盘之后的数据变更是否多。
解决思路是,通过对前后两次组成结构的差异性分析,用之前掉线的盘重新补回之后重建RAID时破坏的校验信息,再虚拟重组RAID,解释文件系统,导出文件。
数据恢复过程记录
1、备份源介质
2、根据破坏前后的数据痕迹,得到破坏前后的RAID结构。
3、分析差异,写校验修正程序,同时按之前的RAID结构虚拟重组,生成重组后的镜像文件。
4、修正重组后的镜像文件系统错误(因数据变更很少,帮错误极少)。
5、部分分区导出数据,部分分区在无错的前提下完全镜像到新空间。
6、测试、验收
数据恢复结论
历时24小时,数据恢复成功,成功率接近100%,用户对数据恢复结果非常满意。