从传统归档到云存储归档的演变
在过去的几年里,人们在数据归档方面的兴趣有增无减。由于公司数据的爆炸性增长,同时也为了满足某种法规要求,不得不保留更长时间的数据;以及减少成本的要求使数据归档越来越被人们重视。现在数据归档已经进化为基于云的归档解决方案。
我们都知道,大约网络中20-30%的数据是归档数据,其中70-80%的数据是静态的或非活动的,这些静态数据很少变化也很少被访问。把这些非活动数据保存在**层存储是非常昂贵也是效率极低的一种方法。尽管如此,通常是有必要或有某种要求来保留这些非活动数据以备将来参考或满足某种法规要求的。那么在保证数据**,保证法规遵从的前提下,把他们保存在价格低廉的可用媒介上是有意义的。
要满足这些需求,通常的方法是通过归档。归档不像备份,它是把非活动数据从主存储上转移到另一个容易访问的,价格也更低廉的二级存储层上,然后在本地磁盘资源上删除它。这样可以通过释放昂贵的主存储更多空间来减少成本,减少备份窗口,增加操作的高效性,并长期提供数据保护的可靠性。一个可行的、高效的数据归档应该可以提供:可扩展性、成本高效性、可用性、数据保护长期性。
在本文中,我们将深入看一看数据归档进程的演变和不同的数据归档方法,这些方法是:
1、传统的磁带归档
2、基于磁盘的数据归档
3、云存储归档
传统归档
这种备份归档是传统的基于磁带上的归档。作为备份过程的一部分,应用备份软件或系统设备把数据写入磁带或自动磁带库内,数据从磁盘上被保存到磁带上。这些磁带和它们所包含的数据按普通备份和指定一个漫长的保留期间被区分开,通常是从10���到无限长。当数据备份从服务器的磁盘驱动器中删除的时候,这些归档磁带被送到异地存储设备长久存储。
这种方法的好处就是磁带相对便宜,易于管理,保存时间长,并且提供非常可靠的存储,存储大量数据非常高效。为了增加存储容量,你只需要简单的增加磁带就可以了。你也可以通过用某种类型的备份设备创建数据副本或主要数据磁带来提供额外的数据冗余。
磁带的不利就是在你可以取回数据前不得不等磁带从异地取回,然后也需要时间来扫描磁带,找到需要恢复的数据,重新创建磁带存储数据。此外它限制爆炸性的数据增长导致以往缩小备份窗口,限制保留的能力,没有切实可行的手段来验证磁带介质及其数据存储年限的完整性。
基于磁盘的数据归档
过去的几年中大量的数据急剧增长,在当今的商业环境存储和访问大量的归档数据的要求也日益增长。大多是新的法规遵从要求,如SOX,随着全球化以及传统的公司结构的瓦解,不再像以前一样有一个或两个集中地点,现在公司已拥有多个办事处,分散在不同的区域,需要快速便捷地获得大量的档案资料,研究以及其他业务合作,这样就诞生了基于磁盘基础上的归档系统。
为了满足这些新的要求,如访问数据更高效,存储大量增长的新的数据,包括电子邮件,数据库等。公司开始在寻找其他存储以便满足这些需求,有效控制成本。
归档进化和现代化的**步是基于磁盘的解决方案的部署。使用廉价的shelf硬件和SATA驱动器以及廉价NAS设备。这样公司可以把他们的数据保留在他们可以很方便,快速访问的站点。然而,这些早期实现并不能充分满足他们归档的独特需求,如扩展到Pb来适应大量数据增长的能力,以及冗长的数据保留期,在超出基本RAID6的基础上提供方法来保护并确保数据的完整性,以达到满足法规遵从的要求。他们也缺乏自动管理归档进程的能力。
这样就有了下一步,也就是设计管理数据归档进程的特定归档系统的引进。这些系统提供快速,易于管理存储,在容量方面可以轻松扩展,应用必要的工具和软件来管理归档进程。这些系统也提供超出RAID6的数据保护特征,数据保留,数据验证完整性以及WORM(一旦写入可多次访问)能力。
这种归档方法的好处是数据副本可以在线存储,并能轻松快速被访问。这也就免去了磁带要从异地站点取回的麻烦,也不需要特定的硬件或备份软件来从磁带存储数据。它也非常容易检索和搜索磁盘上的特定数据。你也可以通过简单的复制要求来从一个地方的数据移到另一个网络。可以很容易的扩充这些系统的容量来满足数据增长的需求。*大的好处就是减少了主存储要求,因此避免了经常购买额外的昂贵的主存储。
对于企业来说磁盘基础上的归档的不利就是企业在购买磁盘时,不得不在*初时购买大约50TB的磁盘。对于许多企业来说,它既不实际也不节省成本,他们买了这么大的磁盘空间,而他们*初也许只需要一到二TB。实际上,你不得不为也许几年也没有完全利用的存储磁盘买单。也有很多随之而来的电力、制冷、管理、维护和升级这些系统以及他们的支持架构的成本。
云存储归档
面对着预算越来越少,员工逐渐减少,而数据存储需求却在不断增长的情况,企业开始寻找其他更加成本高效的方法来扩展他们的存储容量。现在,企业正在关注*新的发展如云计算,存储即服务(SaaS)作为一种可能的方法来满足他们日益增长的存储需求,同时满足减少成本,人员,硬件,架构等的需求。
在云存储这个新领域的服务供应商对企业几乎提供无穷大的可扩展的存储,这种服务是在应用基础上的一个固定的成本。这允许企业在需要的基础上扩展他们的存储,不用再为通常的成本担心,通常是扩展磁盘环境,如创建更多架构,雇佣,培训更多人员来管理额外的存储,为额外的存储增加制冷、电力成本等。在其他优点中,这个服务模型也提供地理上的多站点架构。它允许不同区域的多站点业务任何时间点从网络**问他们的数据。所有的这个访问透明的提供给用户和出现者。给所有数据传输提供**连接的时候这些解决方案通常应用企业现存的架构和应用很容易整合。
这种类型服务的好处是你几乎可以瞬时扩展你的存储,而不会在之前产生硬件或扩展网络架构,雇佣,培训更多人员来管理额外存储的资本支出。同时你也避免了随着时间的推移升级和更新存储硬件的成本。
这种类型服务的不利之处是公司的数据存储在其他人的系统上,而不是公司本地系统。因此在转向云时,你要仔细分析什么类型的数据归档到云上,也要了解是如何保护数据的。在这种情况下,找一家有归档和**存储数据良好记录的公司是非常重要的。
因为改进的数据归档的访问和可靠性使用户更倾向于从主存储上转移数据。这样做不仅减少了主存储上的成本,也减少了数据保护和灾难恢复的成本。