云平台存储运维中如何进行故障诊断.docx
《云平台存储运维中如何进行故障诊断.docx》由会员分享,可在线阅读,更多相关《云平台存储运维中如何进行故障诊断.docx(3页珍藏版)》请在优知文库上搜索。
1、随着云计算、大数据等新兴技术体系的快速发展.云数据中心运维需求应运而生,传统的运维人员,以往接触最多的是硬件,如服务器、集中式存储、网络设备、空调、UPS等,但是在云数据中心时代运维人员已经从面向物理设备,逐步转变为面向虚拟化、SDS(软件定义存能)云的管理方式.从云计算概念和实践中延伸出了一种新的存储模式云平台存储,我们可以从两方面理解云平台存储的定义:第一,在面向用户的服务形态方面,它是一种提供按需服务的应用模式,用户可以通过公/私网络连接云端存储资源,在公/私有云端随时随地存储数据;第二,在平台云存储服务特性方面,它是通过分布式、虚拟化、智能配声等技术,实现海量.、可弹性扩展、低成本、低
2、能耗的共享存储资源。那么云平台存储运维如何进行故障诊断呢?首先,在传统集中式存储故障诊断过程中,我们一般按照先定位外部,后定位内部的原则.在进行系统的故獐定位时,应该首先排除外部设备的问题,外部设备问题包括光纤、光缆、客户设备和断电等向超,内部问题包括硬盘、控制器、接口模块等故障问题.具体的发生故障收集信息诊断过程包括但不限于:1)检肯主机端信息.如检肯多路径是否安装正确,直看物理珞径状态、虚拟磁盘信息、逻辑路径状态、多路径和舌是否正常。2 )收集文件系统故障信息.如收集NTFS/EXT3/EXT4/JFS2等文件系统的故障信息日志等.3 )收集卷管理故障信息.收集1.VM配置及1.V/PV/
3、VG等相关信息,是否有损坏或告警.4 )收集数据库故障信息。查看存储磁盘的相关报错代码.5 )收集HBA信息.直看HBA卡的生产厂商和型号,收集HBA卡驱动的版本号信息是否存在兼容性问题.6)收集交换机信息.Si看端口、SFP信息,分析链路质量、SFP发光功率是否存在问题.7)收集传统集中式存储信息.查看告警日志,导出Support日志,与厂商共同分析日志报错,查明原因.传统集中式存储可以通过收集上述信息并联合存储厂商进行诊断,基本能够在短时间内快速的排除故障.由此可见传统存储呈现给用户更多的像一个黑盒子,通过自带的告警日志能够较快速的定位、解决问题,而云平台存储在故障诊断方面会略显且杂,从某
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 平台 储运 如何 进行 故障诊断