分布式存储架构发展及技术分析与分布式存储典型问题解读.docx
《分布式存储架构发展及技术分析与分布式存储典型问题解读.docx》由会员分享,可在线阅读,更多相关《分布式存储架构发展及技术分析与分布式存储典型问题解读.docx(22页珍藏版)》请在优知文库上搜索。
1、分布式存储架构发展及技术分析存储域 SerVerServer z Scncr 国分布式施基于新型极简共享存储的DiCkSS架彻底座从云和互联网的业务场景来看,其存储域主要采用基于服务器部署分布式存储服务的融合方式,它面临如下挑战:1 .数据保存周期与服务器更新周期不匹配。大数据、人工智能等新兴业务催生出海量数据,大量数据需按照其生命周期策略(例如810年)进行保存。2 .性能可靠与资源利用率难以兼得。支撑业务的分布式存储系统大致可以分为性能型存储和容量型存储,它们均无法同时实现高性能可靠与高资源利用率。具体地,性能型存储主要运行数据库、虚拟化等关键业务,通常采用三副本或两副本并配合独立冗余磁盘
2、阵列卡模式;这类方案虽兼顾了性能和可靠性,但其大约30%的空间利用率却是对存储资源的极大浪费。容量型系统为了提升空间利用率,采用纠删码(EraSUreCode,EC)方式,然而,EC计算过程中的读写、重构等会消耗大量网络资源,导致系统重构效率低下、重构时间长,给系统可靠性带来风险(如图1所示)。云和互联网分布式存储系统性能可靠性影响大EC计算过程中读写、重构等消耗大量网络资源,系统存储资源利用率低常采用多副本方式保证可靠性不同系统烟囱式构建存储.无法跨系统池化存储重构效率低下、重构时间长图1分布式存储资源利用率3 .新型分布式应用的极简高效共享存储诉求。以无服务器(SerVerleSS)应用为
3、代表的新型分布式应用在近些年涌现,这类应用从无状态化向有状态化扩展,比如数据库、消息总线等组件纷纷容器化,数据共享访问的诉求不断增多。与此同时,人工智能和机器学习等应用需要大量异构算力协同,甚至产生共享内存访问的诉求,它们关注高带宽、低时延的访问能力,仅需要轻量、便捷的共享存储系统即可,不需要搭载具有复杂企业特性的传统存储。4 .数据中心税导致数据密集型应用效率低下。面向数据密集型场景,在基于以CPU为中心的服务器架构下,应用为获取数据所缴纳的“数据中心税”(datacentertax)日益加重。例如,服务器内的CPU为处理网络及存储IC)请求,需要消耗高达30%的算力3;此外,由于通用CPU
4、并不擅长数据处理运算,导致其能效比低下。传统存算分离架构将算力资源和存储资源(机械硬盘、固态硬盘等)分离至彼此独立的计算域和存储域,并通过以太网或专用存储网络(例如光纤通道)将二者互连,实现了存储资源的灵活扩展和高效共享(如图2左侧所示);该架构主要为复杂的传统企业特性设计,难以应对上述挑战,为了让云和互联网存储域服务兼顾资源利用率、可靠性、性能、效率等众多诉求,亟须基于新型软硬件技术构建新型存算分离架构。ECSI存储域 Server计算域 Server计Il无盘化直建存储模组 Mr. Nk V NOF似Mtn化M业务 Oia化 v9 三景YW 3y Bh 卜、Wl 2” KVanlaMnlJ
5、T内朗酝、J JsLUScncr分的W仓am出容凰FSfO分布式EC.和IHiS布JS 6. Hxk r RftMAtHMmt务M内在拉远谢匕大内存加速应用X、.*u.(1MMCSl(SI基于新型极筒共享存储的DiSIdeSS架构底座高通.数据总我名总线、弊总鼻11M机OPriealJe弊)图2传统存算分离架构与新型存算分离架构时比一、硬件技术趋势面对数据中心在容量利用率、存力效率等方面的挑战,近年来,专用数据处理器、新型网络等技术快速发展,为数据中心基础设施的重构提供了技术基础。首先,为取代服务器本地盘,很多厂商推出以太网闪存簇(EthemetBUnChOfFlash,EBOF)高性能盘框(
6、例如,近期陆续发布的西数OPenFlex、VaStDataCereS高性能盘框等)。这类盘框不再具有复杂企业特性,而是注重采用新型的数据访问标准,比如支持NOF(NvMExpressoverFabric)等接口,以提供高性能存储实现对本地盘的替换。NoF协议由NVMExpress(NVMe)标准组织在2016年发布,提供了NVMe命令到多种网络传输协议的映射,使一台计算机能够访问另一台计算机的块存储设备。同时,一些研究机构进一步探索远程内存池化技术,例如,韩国KAIST实验室实现了基于FPGA的CXL(ComputeExpressLink)互连协议;CXL为英特尔于2019年3月在Interc
7、onnectDay2019上推出的一种开放性互联协议,能够让CPU与GPU、FPGA或其他加速器之间实现高速高效互联,从而满足高性能异构计算的要求。其次,业界涌现出整来越多的数据处理单元(DataProcessingUnit,DPU)和基础设施处理单元(InfrastructureProcessingUnit,IPU)专用芯片,在数据流处理路径上取代通用处理器,提升算力能效比。同时,基于可编程交换机的网存协同也是研究热点,例如在网数据缓存的NetCacheKV-Direct,在网数据协调的NetLockSwitchTx,在网数据聚合的SwitchML.NetEC,在网数据调度的FLAIR、Al
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分布式 存储 架构 发展 技术 分析 典型 问题 解读
