当前位置:首页 > 消费电子 > 消费电子
[导读]身处金融危机的危局,企业可谓是四面楚歌,危机重重,但是来自爆炸性数据增长的压力并不会因此有所减轻。据IDC统计,用户每年都会有54%左右的数据增长,这等于是18个月用户的数据就会翻一番。长此以往,用户的存储系

身处金融危机的危局,企业可谓是四面楚歌,危机重重,但是来自爆炸性数据增长的压力并不会因此有所减轻。据IDC统计,用户每年都会有54%左右的数据增长,这等于是18个月用户的数据就会翻一番。长此以往,用户的AN onmouseover=_tipon(this) onmouseout=_tipoff()>存储AN>系统很快就会不堪负荷,形式非常严峻。

对于企业而言,另外一个需要引起注意的是:今年7月1日,中国将颁布《企业内部控制基本规范》,相当于美国的萨班斯法案,对于企业有关商业数据举证,从法律上进行了规定,这对于企业的数据保护和存储都提出了更高的要求。以邮件为例,萨班斯法案中明确规定,企业所有电子邮件以及其他电子记录,必须保留5年或7年以上,同时要求在规定时间内完成高速检索。如果无法提供所需的电子邮件记录——或由竞争对手来提供这些记录——会带来严重处罚。中国将要实施的规范,是否会有这样严厉,尚不得而知。但是强制加强有关数据的保护是一个趋势,需要企业认真加以重视。

应对从数据分析入手

面临数据爆炸性的增长,单纯扩容存储肯定不是一个办法,仅从成本上就走不通。那么,计从何处?前不久访华的IBM ProtecTIER全球销售总监Mike Doran,IBM ProtecTIER解决方案亚太区域销售总经理Justin Hildebrandt在接受本报记者独家专访时,带来了一些解决问题的思路。

Doran先生指出,根据IDC的统计,当今世界结构化数据增长率大概是32%,而非结构化数据增长已达到近两倍(63%),也就是说,企业大量的数据增长压力来自非结构化数据,最明显的例子是E-mail,收到别人发来的一封电子邮件,随即转发,如此就形成了大量的重复数据,如果能够从技术上,对此加以鉴别,就可以有效减轻来自数据爆炸性成长的压力。

Hildebrandt指出,最有效的办法就是采用重复数据删除技术。据他介绍,目前在市场上有两种重复数据删除技术,一种是Post Processing(后处理),另一种是Inline Processing(在线处理)。其中,后处理是把完整的数据1:1备份到存储设备上,等所有数据全部备份成功,在一个固定时间,进行批处理压缩,实现重复数据的删除;其弊端显而易见,当数据量过大后,备份窗口过长将导致用户不堪重负;此外,由于承担备份存储的虚拟带库不中断运转,很难完成把虚拟带库的数据离线克隆到磁带上。

在线处理能够解决后处理面临的问题,但是,对于用户而言,有些问题也需要加以注意。首先,数据的恢复速度问题,恢复速度如果太慢,那么采用重复数据删除技术将得不偿失。此外,有些厂商的系统,其重复数据删除技术性能有限,无法处理超过100TB的数据。这些问题都会对用户使用造成障碍。

Diligent的选择

Diligent是全球著名的从事在线处理重复数据删除技术的公司,去年IBM收购了Diligent之后, 由Doran来出任其全球业务总监,负责美国、欧洲、以及大中华的市场。

IBM收购Diligent之后,针对市场需求发布了IBM System Storage TS7650G ProtecTIER新产品。作为一种在线处理重复数据删除技术产品解决方案,它通过一个ProtecTIER服务器,对虚拟磁带库(VTL)提供支持,其中,ProtecTIER提供HyperFactor的在线处理方式的重复数据删除技术,它可以提供的压缩比为25:1,在一些特定的情况下,可以达到30:1。

据Hildebrandt介绍,较之市场上其他的在线处理重复数据删除技术产品,Diligent有两大独创的技术:缓存驻留索引和专利精简算法。其中,缓存驻留索引,使得其索引比可以达到250000:1,它的价值在于可以确保系统的性能。一方面它可以确保ProtecTIER备份服务器不成为备份的瓶颈,另外一方面它对于备份数据恢复的性能也直观重要。此外,由于采用缓存驻留索引的技术,系统就可以极快的速度计算索引、比较索引,当比较结果相同时,会再度进行二进制比较,确保数据一致性。其专利的精简算法,可以避免著名的哈希算法(Hashing Algorithms)的不足。

所谓哈希算法,是通过复杂的哈希算法,计算出一个8K的索引值,再通过该索引值进行比较,来确定数据是否为重复数据。但是哈希算法毕竟是一种算法,存在所谓的哈希冲突,也就说有可能两个数据虽然完全不同,但计算出的哈希值是一模一样的。如果重复数据删除技术据此进行数据删除,就导致数据不一致性,这是一场灾难。Diligent专利精简算法,当有新的备份数据读入时,在内存里先把特征值进行定位,然后跟内存做比较,如果一旦有相似的特征值,再去从磁盘把相关的值读出来,真正做一次二进制比较,确保数据不会有误删除的现象。通过这种计算差异以后,再把新的数据,通过2:1的LZH标准压缩格式存。一方面性能更高,同时可靠性比哈希算法更强,不会出现任何冲突。

 
 尚需努力

针对国内市场,Doran指出,数据增长主要分为两部分:一是on site,一是off site。所谓on site是每天在线处理的生产数据,而off site是指备份数据。在美国,这两部分数据增长是相差无几的;在中国,比较偏重on site。这说明中国的数据保护做得不够好。他表示,随着有关法律、法规的实施,中国对于数据备份的需求,将会呈现快速成长,而重复数据删除技术,将可以有效帮助用户减缓数据存储的压力。

针对主存储系统,也存在着一定的重复数据,对此,Doran表示,IBM也对主存储的重复数据删除密切加以注释,将视用户的需求,适时推出有关产品。但是现在的重复数据删除的重点还主要集中在数据备份领域。在这个领域,Diligent ProtecTIER为用户提供了选择。
本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭