`

我曾经对重复数据删除的一些误解(二)

阅读更多


    在上一篇文章中主要讲解的是,我曾经对后期重复数据删除技术的一些误解,如果有和我一样的朋友希望你们在读完我的文章后可以消除一些误解,来重新看待重复数据删除这项技术,总体而说这项技术现在还是很不成熟,但是我觉得通过不断改进可以使他变得的成熟,毕竟这项技术对于我们还是很有帮助的,减少无效的数据,提高存储设备的使用效率,节省企业的不必要开支,后面我继续写一些关于重复数据删除技术的误解。

降低备份数据流读取速度是否不利于数据备份。

    从技术上说,在同等条件下采取重复删除技术,肯定会在一定程度上降低备份数据流的读取速度。后来我明白了一点,评价一个技术是否合适,并不能够只看一个指标,而应该从总体上去评价。简单的说,需要评价一下总体的备份时间是否有所缩短?复杂一点,需要判断备份过程是否能够满足备份窗口,或者RTO的需求?在实际工作中,有些指标可能比备份数据流的读取速度更加的重要。如RTO需求就是如此。

    另外还有一点,如果采取重复数据删除技术的话,一般要求相关设备要有比较高的配置或者性能。因为从数据备份的任务来看,其实包括两个部分,分别为数据的传统备份与重复数据删除作业。虽然说这两个作业可以独立运行,但是其运行所需要的时间是不同的。而只有重复数据删除处理结束之后,整个备份作业才算真正完成。故如果后期处理重复数据删除设备的性能比较差时,就会降低系统的重复数据删除比。所以在部署这个项目的时候,往往会对重复数据删除设备进行评估与测试,看其性能上是否能够满足要求。

    在我曾经的工作中有很多案例可以说明,虽然采用重复数据删除技术后会在一定程度上降低存储数据流的读取速度,但是却可缩短整个备份作业所花的时间,能够满足RTO的需求。有句俗话说的好,只看结果不看过程。评价任何一门技术都是如此,应该从一个整体上进行评价,而不能够某几个个别的指标。否则的话,就可能会引起用户的误判。

重复数据删除技术与备份数据流写入作业真的是无法同时完成吗

    曾经我一直认为重复数据删除技术与备份数据流写入作业无法同时完成,但是后来我才知道如果备份数据流在写入的时候,只对同一个磁盘进行操作,那么这个问题确实存在。但是在现实工作中,这是根本不存在的。因为在实际应用中,重复数据删除技术往往是跟虚拟存储等结合使用的。也就是说,一般会将备份数据流写入到多盘虚拟磁带介质中。而实际写入磁带的数量往往会远远大于实际拥有的磁带驱动总数。这说明一个什么问题呢?也就是说,当其他磁带正在进行复制或者读写等操作的时候,重复删除技术可以在其他磁带介质上进行重复数据删除的作业。换句话说,就是重复数据删除作业与数据复制、写入等到作可以并发的运行。只是其操作的对象不同而已。两者可以互不冲突的独立运行。

    我现在担心的是如果数据读写作业要对某个磁带驱动器进行操作,而这个虚拟磁带库正好在进行重复数据删除作业,此时这个作业就会停下来。从而产生冲突。可是凭现在的技术还很难从根本上解决这个问题,只可以曲线救国。如将虚拟磁带库的容量设置的小一点,让这个冲突产生的几率降低。

    另外据了解,已经有厂商在往这方面努力。如他们尝试着通过分割磁带数据区域的方法来实现并发读写。如果这个技术能够实现的话,那么当备份软件正在对某个磁带介质进行写入操作的时候,就可以对这个介质的其他部分进行重复数据删除处理。这个原理很简单,就是将某个磁带数据区域再进行划分,以实现不同区域的并发处理。

    总之,还是那句话:技术不成熟有待改进,但是现阶段我们还是可以使用的,只要是设置好规则,这项技术还是对我们的帮助还是很大的。

分享到:
评论

相关推荐

    自己动手写操作系统(含源代码).part2

    我曾经翻遍了一本《操作系统:设计与实现》,也没有找到实现一个操作系统应该从何处着手。并不是这些书不好,也不是前人的代码不优秀,而是作为一无所知的初学者,我们所不了解的不仅是高居庙堂的理论知识,还有让...

    自己动手写操作系统(含源代码).part1

    我曾经翻遍了一本《操作系统:设计与实现》,也没有找到实现一个操作系统应该从何处着手。并不是这些书不好,也不是前人的代码不优秀,而是作为一无所知的初学者,我们所不了解的不仅是高居庙堂的理论知识,还有让...

    超级有影响力霸气的Java面试题大全文档

    抽象包括两个方面,一是过程抽象,二是数据抽象。 2.继承:  继承是一种联结类的层次模型,并且允许和鼓励类的重用,它提供了一种明确表述共性的方法。对象的一个新类可以从现有的类中派生,这个过程称为类继承...

    multiCCL_f

    定位过程中将删除里面的一些文件。 另一个简单的做法是:先手动在样本所在目录下建一个名为  output 的子目录,然后在选择目录的对话框点 “取消”,这样输出文件就都放到这个output 目录下了。 3. 设置...

    软件病毒特征码定位软件multiCCL

    定位过程中将删除里面的一些文件。 另一个简单的做法是:先手动在样本所在目录下建一个名为  output 的子目录,然后在选择目录的对话框点 “取消”,这样输出文件就都放到这个output 目录下了。 3. 设置...

    java 面试题 总结

    抽象包括两个方面,一是过程抽象,二是数据抽象。 2.继承: 继承是一种联结类的层次模型,并且允许和鼓励类的重用,它提供了一种明确表述共性的方法。对象的一个新类可以从现有的类中派生,这个过程称为类继承。新类...

    JAVA面试题最全集

    1.Java有那些基本数据类型,String是不是基本数据类型,他们有何区别。 2.字符串的操作: 写一个方法,实现字符串的反转,如:输入abc,输出cba 写一个方法,实现字符串的替换,如:输入bbbwlirbbb,输出...

    视易神通夜总会5.0安装包

    74.增加按时间段删除营业数据. 75.代码优化并增加数据分发服务器. 76.日报表和帐单查询增加显示折扣率. 77.增加触摸屏点单界面. 78.进入退单默认为当前选中的包厢. 79.主界面的包厢按拼音排序. 80.主界面右键...

    LFMessS 岭峰网行业专用留言系统

    (严重程度:中) 17、改进系统语言包中关于数据库库压缩优化功能的描述,为了避免用户误解该功能是类似压缩软件效果,而不是真正的优化提速,现全部改为优化数据;(重要程度:高)18、改进系统语言包中部分描述不...

    VC++做异形窗口 透明效果

    一种方法是OnInitDialog()处理,但这样会在从启动程序到窗口出现有相当的延迟,易引起程序尚未启动的误解。再一种方法就是在OnPaint()处理,但为了避免重复处理,可以加上一个判断标志。以下是OnPaint()的代码,正体...

    测试培训教材

    添加对“View Reservations”需求项的覆盖 -- Linking Tests to a Requiremnet 将测试链接到需求 在需求模块,选择菜单“视图->需求范围” 将测试用例“Cruise Search”链接到需求项“Cruise Booking”: -...

Global site tag (gtag.js) - Google Analytics