可能会导致业务系统中断的原因

随着局域网存储(NAS)技术、光通道技术、存储局域网(SAN)技术的发展,基于SAN+NAS模式的存储备份解决方案已经日趋完善。存储备份系统拟采用SAN技术进行系统集成数据系统是内部信息系统的核心组成部分,担负着众多的极其重要的工作;而系统中的数据,更是核心中的核心,数据的安全性关系到整个系统能否正常的运行,最终关系到能否提供正常的服务。所以对数据系统的数据做好数据保护是至关重要的,是保证提供正常服务的最后一道防线,当各种影响数据安全的情况发生时,能以最短的时间恢复受损的数据。

对数据的保护,有多种方法,包括备份和数据容灾。目前用得最多、最有效的手段是数据备份。而备份的方法也很多,有手工备份、自动备份、LAN备份、LAN-Free备份等。不同的备份方法,其效果不同,主要表现在性能、自动化程度、对现有系统应用的影响程度、管理、可扩展性等方面。

由于该业务系统是关键系统,需要不间断为客户提供服务。即使发生短暂的业务中断,也会导致难以估量的经济和名誉损失。为此,我们分析以下可能会导致业务系统中断的原因:

A. 系统硬件故障

如数据/系统磁盘的损坏将导致数据不能访问,并进而可能导致应用进程终止或系统停机,甚至系统不能重启动;网卡的损坏可使终端用户无法访问系统服务;CPU或内存的失效则会导致系统的死机;

B. 应用程序或操作系统出错

由于操作系统或应用程序中可能存在不完善的地方,当碰到某种激发事件时,应用程序非正常终止或系统崩溃(只能通过改善程序或系统来解决);

C. 人为错误

一些人工的误操作,如删除系统或应用文件,终止系统或应用服务进程,也会导致系统服务的无法访问;

D. 电脑病毒/黑客入侵

由于目前的大多数计算机系统均连接在网络上,若缺少有效的防范机制,很容易遭受病毒的感染或黑客的入侵,轻者数据被损坏,重者系统瘫痪(只能通过加强管理杜绝);

E. 自然灾害

由于一些意外的不可抗拒的因素,如雷击、火灾、洪灾等导致的计算机系统破坏,将会使一般系统的恢复非常困难和耗时,导致业务系统长时间的中断(通过容灾系统来解决)。

F. 正常的停机

主要指计划内的系统升级、安装软件、系统备份等过程。

由上可见,影响系统正常运行的因素有很多,因为在系统中断时能够在最短的时间内恢复数据是最重要的,所以需要采用一套自动集中的数据离线备份系统对数据库中的数据进行保护。目前,数据系统没有采用合理的备份方式,没有考虑性能、自动化程度、对现有系统应用的影响程度、管理、可扩展性等方面的因数。随着数据量的不断增大,数据维护的复杂程度不断提高,备份对业务系统的影响越来越大,并且系统管理人员很难管理备份介质。当对同一个数据库的容量超过一盘磁带的容量时,如果采用手动备份就变成了一个极其复杂,效率极低、风险很大的工作了。同时,由于其自动化程度低,出错的可能性也越来越大,所以现有的备份手段已经不能保证快速、有效的保护数据,并且直接影响到业务系统的正常运行。所以,必须要采用自动备份方式。

因此,在考虑一个完整的数据备份/恢复解决方案的时候,需要参考以下三点:

  • 软件功能强大
  • 架构模块化
  • 应用简单化。

Quest的旗帜产品NetVault:Backup正好符合了上述的三个参考值,而且NetVault: Backup本身就是按照这三个数据保护解决方案的用户参考指数来设计的。

我们拥有最强大、最全面的功能,通过模块化设计的最大的灵活性、最好的升级性,和使用、配置的最简易性,我们为用户提供的是最低的总体拥有成本。所以在这里,我们建议采用Quest公司先进的NetVault:Backup软件来实现统一集中并且自动化的备份管理。