服务器数据恢复
____整个服务器的存储结构由一个控制器、三个扩展柜和28块组成FC 300G由硬盘组成。由于两个磁盘脱线,存储一些磁盘LUN不,有些LUN丢失。由于服务器由于某些磁盘脱线而导致整个设备不可用。因此,在接收磁盘后,数据恢复工程师首先对所有磁盘进行物理检测,检测后发现无物理故障。然后使用坏道检测工具检测磁盘坏道,发现无坏道。磁盘坏道检测日志如下:
二、服务器数据恢复备份数据____考虑到数据的安全性和可还原性,在进行数据恢复之前,需要备份所有源数据,以防数据在操作不当时无法再次恢复。winhex将所有磁盘镜像成文件,源磁盘的内容很多,备份数据需要很长时间。备份的部分数据如下:
三、故障分析及服务器数据恢复过程____1.分析故障原因
____由于前两步没有检测到磁盘的物理故障或坏道,推断可能是由于某些磁盘读写不稳定。EVA一旦某些磁盘性能不稳定,控制器检查磁盘的策略非常严格,EVA如果控制器认为是坏盘,则将认为是坏盘的磁盘踢出磁盘组。一旦某个磁盘被认为是坏盘LUN在同一条带中掉线的盘到达极限,那么这个LUN将不可用。即如果EVA中所有的LUN所有这些掉线盘都包含在内,所有这些掉线盘都包含在内,所有这些掉线盘都包含在内,所有这些掉线盘都包含在内,所有这些掉线盘都包含在内,所有这些掉线盘都包含在内,所有这些掉线盘都包含在内,所有这些掉线盘都包含在内,所有这些掉线盘都包含在内,所有这些掉线盘都包含在内,所有这些掉线盘都包含在内,所有这些掉线盘都包含在内,所有这些掉线盘都包含在内LUN所有这些都会受到影响。掉线两个盘子会导致整个存储LUN不可用的情况很正常。目前的情况是现有的8个LUN,损坏7个LUN,丢失6个LUN。一切都需要恢复LUN的数据。
____2、分析LUN的结构
____HP-EVA的LUN都是以RAID以条目的形式存储数据,EVA组成每个磁盘的不同块RAID条目,RAID有很多种类型的条目。我们需要分析组成LUN的RAID以及这个RAID条目由哪些盘子和块组成。这些信息存储在LUN_MAP中,每个LUN都有一份LUN_MAP。EVA将LUN_MAP分别存储在不同的磁盘中,并使用索引*其位置。所以去每个磁盘找到这个方向LUN_MAP可以找到现有索引LUN的信息了。
____3.分析服务器丢失的分析LUN
____虽然磁盘记录了指向LUN_MAP但它只记录现有索引,LUN,丢失的LUN索引不会被记录为EVA中删除一个LUN这个只这个LUN该索引不会被清除LUN的LUN_MAP。此时,有必要扫描所有磁盘,找到所有符合要求的磁盘LUN_MAP的数据块,然后排除掉现有的LUN_MAP,剩下的LUN_MAP不一定全部删除,有些以前是旧的,但这个时候不可能LUN_MAP筛选只能通过程序筛选所有LUN_MAP恢复数据,手动检查什么LUN是删除的。
____4.分析服务器脱线磁盘
____根据之前的故障分析,虽然磁盘没有明显的物理故障,但也没有磁盘故障。但由于性能原因,它仍然会从EVA磁盘组中的分离。一些旧数据存储在这些分离的磁盘中,因此在生成数据时需要排除它们。但是如何判断哪些磁盘脱落呢?LUN的RAID大多数结构都是RAID5.只需要一个LUN的RAID条目通过RAID5的校验算法计算校验值,然后与原校验值进行比较,判断本条目中是否有线盘脱落。并将一个LUN的所有LUN_MAP再验一遍就能知道这个LUN中哪些RAID条目中有掉线盘。而这些。RAID条目中存在的盘必须是掉线盘。排除线盘,然后根据LUN_MAP恢复所有LUN数据就可以了。
____5.编制服务器数据恢复程序
____上述故障分析和解决方案终需要编程来实现。编写扫描LUN_MAP的程序Scan_Map.exe,扫描全部LUN_MAP,结合人工分析得出精确的LUN_MAP。编写检测RAID条目的程序Chk_Raid.exe,检测所有LUN结合人工分析,中掉线磁盘排除掉线磁盘。LUN数据恢复程序Lun_Recovery.exe,结合LUN_MAP恢复所有LUN数据。
____6、恢复所有LUN数据
____根据编写的程序实现不同的功能,后使用Lun_Recovery.exe结合LUN_MAP恢复所有LUN数据。然后手动检查每个数据。LUN,确认是否与甲方工程师的描述一致。LUN数据恢复如下:
四、数据验证____客户检查数据恢复的所有数据,数据完整,服务器数据恢复成功
未来数据安全建议1.安排员工定期检查机房,及时处理报警信息。
2、管理人员操作存储要谨慎,避免误操作导致数据丢失。
3、现场发现EVA部分控制器模块不稳定,应及时换。
4、由于EVA存储故障是由磁盘不稳定引起的,这部分磁盘应该是同一批磁盘。因此,如果可能的话,这些磁盘的性能也会达到极限。
wbz089.cn.b2b168.com/m/
515291766