多语言展示
当前在线:1609今日阅读:61今日分享:18

让数据迁移更加简单

数据具有“引力”和“惯性”听上去是不可思议的事情,但是在将数据从存储基础设施的一个位置移动到另一个位置的时候,机构会发现这是一个艰难的过程。至少,过去是这样。而现在,在合适的工具和基础设施条件下,传统的数据迁移过程中涉及的许多困难点都可以消除。为什么数据迁移是个问题:一份来自Hitachi Data Systems报告详细的整理了来自IDC和451的调研。报告表明数据迁移项目占据了大型企业IT项目的60%,并且,几乎一半的IT预算用于运维开销——一个明显的信号即数据迁移消耗了大部分的IT预算。据估计,迁移1TB数据的成本是1万5千美元,因此,数据迁移对很多IT部门来说是令人发憷的。而数据迁移困难之处,有许多原因:
复杂性:

当今许多庞大的存储阵列已经变得很复杂,支持几千个LUN或卷,然后连接到许多主机。而这些主机通过光纤通道(FC),iSCSI和 FC over Ethernet 网络连接。这些存储阵列间因为厂商、版本等原因,很多高级远程复制功能无法部署。

技术依赖

现有的存储阵列系统已经部署了很多年,其中的硬件、软件、固件以及设备驱动等可能变化很大。在数据迁移时这些组件都可能需要升级或者刷新。在某些情况下,设备可能不再被支持,这就表明了一个风险项,或者表明需要投入成本来升级软件或者硬件。

运维依赖

现有的存储阵列系统已经部署了很多年,其中的硬件、软件、固件以及设备驱动等可能变化很大。在数据迁移时这些组件都可能需要升级或者刷新。在某些情况下,设备可能不再被支持,这就表明了一个风险项,或者表明需要投入成本来升级软件或者硬件。

存储容量规模

存储阵列可以存储大量的数据,越来越多的存储容量向着PB级别扩展。数据迁移速率限制也表明PB量级的数据迁移将花费很长时间来传输,在此期间,必须保证对生产应用没有或者很小的性能影响。

异构的基础构架

随着公有云、混合云以及私有云的大规模应用,越来越多的数据需要在异构的基础构架之间迁移。管理者不但要面对传统的挑战,还需要面对诸如:物理主机/云主机之间的兼容性、云服务商隔离与锁定等新的挑战。

成本

数据迁移需要认真规划,并有效执行,从系统开发商到维运团队,都需要随时验证数据迁移成功完成与否。在迁移中也有成本,需要维护设备。 所以,迁移所需时间越长,保持额外复制硬件的成本就越高。

常见的迁移场景

数据迁移里最常见的一个需求就是在存储阵列间或者存储设备间移动数据。目前我们考虑块级别的协议数据的迁移,一般的方法有:

基于存储阵列的数据迁移

利用存储阵列级数据迁移工具在阵列间进行数据迁移,对于一致性传输(源和目标设备都是同一个厂商或者相同型号),可以使用原生的复制工具;但是对于异质迁移很难找到合适的工具。不过各个存储厂商都在尽力的改变这样的局面,例如EMC的Open Migrator或者HP 3PAR的Online Import 允许某些第三方存储阵列导入数据到自己的阵列中,但无法提供在线迁移等高级功能,并不能降低很多的成本。

基于虚拟机监视器的数据迁移

服务器虚拟化的好处之一是增加了如VMware的vSphere Storage vMotion和Mirosoft的Hyper-V Live Migration,即在线迁移虚拟机功能。这些工具可以实现虚拟机在不同存储阵列间的迁移,它提供了一个附加的好处,即能够实现跨协议数据迁移,例如在vSphere情况下,可以从块协议迁移到NFS。采用虚拟机监视器进行数据迁移需要授权成本,但也确实减少了大量的数据迁移的运维问题。不过这类技术都仅能在同一厂商的同一个集群内进行实施,无法满足多厂商、多集群的环境。

基于虚拟磁盘阵列的数据迁移

随着软件定义存储的崛起,虚拟磁盘阵列也开始慢慢进入生产环境中。通过软件的方式屏蔽物理虚拟磁盘阵列的差异,提供可以虚拟化外部存储并在阵列间无缝迁移数据的功能。甚至最新的产品中允许数据在一致性阵列间迁移而不需业务暂停就能够进行迁移。不过这类技术都还没有经过大规模商业应用,而且将数据迁入其中也并不能保证能够方便的迁出。

基于文件级别的数据迁移

采用基于文件协议的数据迁移相当复杂。在大多数情况下,数据迁移的主要问题不是数据的传输,而是在迁移过程中和迁移后,不改变数据的逻辑位置而使数据对用户可用。而不幸的是要确定哪些文件需要按照怎样的规则进行迁移,只有系统开发商才能执行。即便系统没有超过维护周期,迁移的时间与成本也是极高的。

基于卷级别的数据迁移

基于卷级别的数据迁移,将面对和基于文件级别的数据迁移类似的问题。因为数据的粒度更大,所以能够缓解一部分问题。但是面对无法直接迁移的卷(例如:操作系统所在的卷),依然需要依靠手工备份、手工重建等需要花费极高成本的方式,才能让数据真正的运行起来。

基于数据库级别的数据迁移

仅仅在同构数据库之间迁移数据,相对而言是较为舒心的过程。但是准备同构数据库的成本就需要小心评估了。在因为数据库应用所需要的中间件、系统软件、计算机硬件、网络设备等每一项都需要严格检查其有效性。在异构的数据库之间迁移数据就是一个更大的话题。需要数据库厂商、应用开发商、维运团队等多方努力才能够执行的项目。其复杂程度以及随之而来的成本,导致几乎很少进行这样的迁移。

基于主机级别的数据迁移

基于主机级别的数据迁移,因为其迁移的粒度适中,所以有较大的成本优势。该技术将操作系统、数据库、中间件、应用软件以及相关数据作为一个整体进行迁移;迁移到目的地后,大部分时候仅需要修改少量配置信息,就能在全新的环境中提供业务服务。对于某些集中部署在单一主机内的系统,甚至无需修改任何配置。不过在主机级别的数据迁移方案,依然存在如下的挑战:1.    在数量众多的运行平台(物理平台、公有云平台、私有云平台、超融合平台)面前,需要保证在异构的平台上能够正常的工作2.    在大量数据面前,需要保证业务停止的时间尽可能短3.    在正式迁移主机数据前,需要提供更加便捷的验证手段面对以上挑战,科力锐使用独有的“虚拟PCI总线技术”,让迁移后的主机能够适应各种不同的运行平台。同时使用创新的“快速重建技术”,让迁移过程中仅需要暂停业务数分钟,而无需等待所有数据在物理上全部都迁移到新存储中,满足对停机时间的要求。为了让迁移过程更加简便和安全,科力锐通过“持续数据追踪技术”,能够在正式迁移主机前,仅需要配置3项参数,就能将任意时间点的主机状态迁移到新的环境中进行验证。

迁移的未来

随着技术的进步和成熟,各种新兴的存储方式即将变得普通和常见,例如:“对象存储”、“横向扩展存储”、“大数据存储”等等。新的构架将带来新的问题,业内也将投入更多的精力来应对更多的挑战。

推荐信息