当前位置: 首页 > 范文大全 > 公文范文 >

面对大数据,如何部署下一代存储基础设施?

时间:2022-03-20 08:27:13  浏览次数:

zoޛ)ji<^rRmz(n׫~\^r5
O]4Lto$5L{M?Ck#<DCk-ԡ^rCk)iDQ�k$@ 4@ 6方案中,每个数据的副本都被镜像,并存储在阵列的不同磁盘上,确保数据完整性和可用性。但这意味着每个被镜像和存储的数据都会变大,需要比数据大小大五倍多的存储容量。随着RAID阵列中使用的驱动器变得容量更大——从密度和功耗的角度来看,3TB容量的驱动器很有吸引力,让故障驱动器的替换驱动器恢复到完全奇偶校验所需的时间也变得越来越长。

Day说:“实际上,我们的RAID没有遇到任何操作问题。我们看到的是,随着驱动器容量变得越来越大,当我们遇到任何部件故障时,恢复到完全冗余系统所需的时间增加了。生成奇偶校验与相应数据集的大小成正比。我们在基础设施中开始使用1TB和2TB驱动器后看到的是,恢复到完全冗余状态的时间变得相当长。趋势没有朝着正确的方向发展。”

对Shutterfly而言,可靠性和可用性至关重要,这表明需要企业级存储。Day表示,但急剧增长的存储成本使得价格实惠的大众化系统变得极具吸引力。当Day及其团队在市场上调查潜在的技术解决方案以控制Shutterfly的存储成本时,他们对于一项名为纠删码(erasure code)的技术产生了兴趣。

采用纠删码技术的下一代存储

里德-所罗门纠删码最初作为一种前向纠错码(FEC)来使用,用于通过不可靠的通道来传送数据,比如外层空间探测器的数据传输。这项技术还与CD和DVD结合使用,处理光盘上的瑕疵,如灰尘和划痕。但是几家存储厂商已开始将纠删码采用到各自的解决方案中。使用纠删码,就可以将一个数据细分成多块,每一块数据本身毫无用处,然后它们被分散到不同的磁盘驱动器或服务器。数据随时可以用一小部分数据块来完全重组,即使多个数据块因驱动器故障而已丢失。换句话说,你不需要创建多个数据副本;单个数据实例就可以确保数据的完整性和可用性。

早期提供基于纠删码的解决方案的厂商之一是总部设在伊利诺斯州芝加哥的Cleversafe公司,它添加了位置信息,以创建其所谓的分散编码(dispersal coding),让用户可以在不同的地理位置(如多个数据中心)存储数据块,即该公司所说的数据片。

每个数据片本身从数学上来讲毫无用处,这就能确保隐私性和安全性。Cleversafe表示,由于信息分散技术只使用一个数据实例来确保数据完整性和可用性,而不是像RAID那样使用多个数据副本,公司可以节省多达90%的存储成本。

Cleversafe公司的产品策略、市场营销和客户解决方案副总裁Russ Kennedy说:“当你重组数据时,不一定要有每一块数据。我们把生成的数据块的数量称为宽度,把重组数据所需的最小数量称为阈值。你生成的数据块的数量与重组需要的最小数量之间的差异决定了其可靠性。同时,即使你丢失节点和驱动器,仍能恢复原来形式的数据。通过RAID所能获得的最高可靠性是双奇偶校验。也就是说,你可以丢失两个驱动器。借助我们的解决方案,最多可以丢失六个驱动器。”

纠删码还是一种基于软件的技术,这意味着它可以与大众化硬件结合使用,从而进一步降低扩展成本。

构建下一代存储基础设施

Day说:“我们确定了合适的技术后,比较了在这个领域提供解决方案的多家厂商。我们曾考虑自己来构建,但是觉得如果我们能找到一家完全满足我们的要求,其系统又相当可靠的公司,那么这个方法对我们来说明智得多。”

Shutterfly在其实验室对四家厂商的解决方案进行了评估,并为其数据中心所需的存储设备建立了原型。Day表示,他关注性能、可用性、容错性和可管理性这几个方面。

他解释:“我们有一个工作人员专门管理照片库。2010年面临的最大问题之一是,我们发现照片库越来越庞大。因此,我们不得不扩大员工队伍,但这不是很有吸引力。”

Day表示,后来发现Cleversafe最适合Shutterfly,这主要是由于该公司愿意与Shutterfly合作,根据Shutterfly的需求来调整其解决方案。这两家公司开始进行了一系列概念证明测试,包括在Shutterfly实验室进行的负载和性能测试。Shutterfly熟悉了操作和性能方面的特点后,在生产环境中部署了一套并行存储基础设施,由其来模拟处理Shutterfly的全部流量。

Day说:“上传的每张照片都写入到我们的遗留基础设施和Cleversafe基础设施。这套系统我们运行了六个月,包括节假日。”

节假日对Shutterfly来说是高峰期,这时候许多用户建立了照片簿。

Shutterfly在2011年将Cleversafe的存储解决方案完全投入到了生产环境,用于其照片库;并且从此以后,一直将其用作主照片库。

基于纠删码的存储总体拥有成本如何?

Day说:“这本质由是个软件解决方案,让我们可以部署非常具有成本效益的硬件。从总体拥有成本的角度来看,这给我们带来了巨大的变化。我们与硬件厂商打交道时有了更大的灵活性,并可以保证我们买来的驱动器和支持它们的基础设施是价格最实惠的。”

Day表示,管理存储池也大大简化了。

他说:“基本上我们只要添加另一批存储系统,它会自动添加到我们为其指定的任何存储池。以前,每当我们添加额外存储容量时,都不得不做一些相当复杂的管理工作。”

而现在,驱动器出现故障或停止运行时,Shutterfly的存储基础设施就能将其标记为不可用,将数据改而存储到其他驱动器,同时透明地恢复该驱动器上的数据。Day表示,其团队现在发现故障后,可以按照预定的维护时间表更换受影响的基础设施,而不是像以前一个或一组驱动器出现故障时,面临“全体人员各就各位”的情形。

他说:“我们不用再像以前那样迅速增加人员了。我们的人员仍在增加,但比使用前一代系统时慢得多。日常维护工作量有所下降。管理员能够把更多的时间花在有意义的积极项目上。他们的工作已转移到我所说的增值工作。这从发展的角度和工作满意的角度来看是好事。”

存储数据后,洞察力会随之而来

Shutterfly这家互联网公司处理的数据量比如今大多数企业处理的数据量大多了,但各行各业的公司在存储数量越来越多的数据。

Day表示:“五年后,我们照片库的大小看来会相当普通,不过仍会比平均大小大几个数量级。眼下真正值得关注的一个方面就是,在过去四五年间,我们看到许多应用软件和技术进入市场,因而让我们有可能处理非常大的数据集。这确实激动人心,因为它们让公司可以通过实际查看细粒度数据,更深入地了解公司业务。”

Day说:“这是业界非常可喜的一步。我们正处在大数据的早期阶段。另一个值得关注的因素是,随着企业开始更注重实时客户交互,更注重在线和移动,它们也在生产海量数据。现在可以分析这些数据,获得真正有影响力的商业洞察力。而这一切都有赖于我们能够可靠地海量数据。”

http://howto.techworld.com/data-centre/3351720/how-implement-next-generation-storage-infrastructure-for-big-data/

推荐访问: 基础设施 部署 面对 数据