各种存储性能瓶颈场景下的分析和优化.docx
《各种存储性能瓶颈场景下的分析和优化.docx》由会员分享,可在线阅读,更多相关《各种存储性能瓶颈场景下的分析和优化.docx(11页珍藏版)》请在优知文库上搜索。
1、操作Server端的文件系统数据,但也不能获取Server端的状态,当连接中断时,可以不停地连接重试.如图4所示,基于TCP的应用展协议的NAS存储数据IO流会更加灵活,适配性较强,但数据IO路径更长,数据一致性较差,还会存在数据泄露等安全问题,数据传埔效率也不高.SS=SSs图4.nfs协议下的NAS存楮数据10流图1.3分布式存储分布式存储系统是采用可丁展的集群架构,通过数据副本算法将数据分散存储在多台独立的设备上,分布式集群之间一般通过通用TCP/IP网络连接.相比于其传统的集中式存储阵列,分布式存储系统可以通过多台存储服务器来分担存催负荷,可以满足大规模存储应用的需要。常见的分布式存储
2、系统的形式包括分布式文件系统(如HDFS)和对茨存储(如Ceph).从架构层面来看,与集中式存储系统相比,分布式存储系统的部署架构相对简单,一般是通用服务器网络互联的方式,但其逻辑架构更加豆杂.分布式存储系统的核心设计思想是去中心化,去中心化的难点主要在于是主控节点的去中心化,有主控节点的架构比如HDFS的架构设计思路是map-reduce,化大为小,分而治之,再合并处理,其架构中需要主控节点来协调,只是主控节点的负载都分发到了数据节点,数据节点上则存放着数据副本,每个数据副本又都分布在三个不同的数据节点上,如图5所示;而无中心化的最大优点是解决了主节点本身的瓶备储点图6.无主控节点的Ceph
3、存储架构从存储的10数据源来看,不同于集中式存楮较少的数据通道,分布式存慵的数据人口可以更多更宽,但集群内部的数据流也更多,还是以Ceph的块存储为例,客户端应用访问的文件系统对应的是Ceph块设备,Block数据通过网络访问Ceph集群RBD服务,最终对应于三副本OSD的磁盘读写,流程如图7所示.对于三副本的分布式存储系统,为保障数据的强一致性,一个写IO,一般需要主副本和另外两个从副本都写完后,才能最终确认写完成。应用MockCePh块设备网络传输OSDPrimaiRBD服务OSDRePIiCaOSDReplica图7.Ceph存储IO数据流图2.存储性能分析顺序或随机读写峡序或随机读写的
4、差异主要表现在磁盘介质特性、预读取机制、缓存命中率等方面.对于机械硬盘来说,顺序读写的IO可以减少磁盘寻道时间,随机读写的IO则响应时间变长,可以通过提高缓存命中率的方式,将缓存中的数据转化为顺序读写到磁盘;而SSD硬盘则不存在机械寻道,随机读写能力会大大优于机械硬盘.2.1.2性能瓶颈分析存储性能分析的关键是对性能瓶颈进行分析,包括两方面的内容:一是触发性能瓶颈的因素;二是性能瓶颈的定位,找出存储IO拥塞的位置.1)触发性能瓶颈的因素存储热点:存慵热点是规划设计中的缺陷,典型场里包括数据IO负载过于集中在某个存储节点、端口、磁盘等,存佛资源争用、锁竞争,软硬件参数的限制等.性能尖峰:常见于数
5、据IO高并发、性能需求短时间集中释放的场景,性能尖峰更会充分展露出存在的热点问题,从而触发存储性能瓶颈,典型场景包括虚拟案面启动风褰、秒杀类业务等.服务能力下降:常见于故獐场景,存储服务能力下降科加数据1。繁忙阶段,会导致触发存储性能瓶颈.典型的故障场景包括SAN存储单存阵控制器故障、磁盘rebuild等;分布式存储更容易出现性能抖动,主要也是由于某个节点或磁盘掉线或里建数据副本或某个数据副本响应变慢;客户姚服务器的CPU.内存资源不足等.2)性能瓶颈的定位存储性能瓶颈的定位需要结合存储系统的架构来分析,按照存储系统的构成大致可分为以下几类性能瓶颈位置:数据传输网络:存储外接和内接数据传输网络
6、的带宽、端口速率、传输协议、传输路径的负载均衡度存储控制器:控制器的CPU处理能力缓存:主要分为客户端缓存和存储缓存,包括缓存大小、缓存命中率、读写缓存的分配比例磁盘:主要分为机械硬盘、闪存盘等磁盘介质,包括磁盘转速、单盘读写的IoPS、磁盘容量大小、磁盘数量、磁盘冗余(RAID、副本或纠删码)算法客户端:体现在客户端的CPU、内存等资源的使用情况、其他应用对存储资源的占用等外部环境的影响2.2定量分析定量分析是从数据指标角度来分析解决问题,既可以从存慵侧来度量存储系统的服务能力,也可以从用户应用恻来衡量存储IO体蛤,一般来说,存储侧的定员分析排除了存储网络和客户端的影响,性能数据能说明存储系
7、统本身是否存在性能瓶颈,可用于存储系统的性能监控;而用户应用侧的定量分析主要用于一些性能测试场景,通过基准测试工具,可以形成当前系统环境的性能基线.2.2.1 三大性能指标无论是存储侧还是用户应用侧的定量分析,都离不开三大存储性能数据指标:IOPS、吞吐果(Throughput)、延时(1.atency).因此有必要弄清楚三个性能数据指标的含义及其关联关系。IOPS:代表存储每秒所处理的IO操作数量.对于存储系统来说,我们在性能分析时,既需要关注整体的IoPS,有时也需要分析单个控制器、单个IUN或者单个磁盘的IOPS,甚至可能还需要区分读或者写的IOPS.吞吐量(Throughput):代表
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 各种 存储 性能 瓶颈 场景 分析 优化