银行IT智能运维一体化建设实践分享.docx
《银行IT智能运维一体化建设实践分享.docx》由会员分享,可在线阅读,更多相关《银行IT智能运维一体化建设实践分享.docx(11页珍藏版)》请在优知文库上搜索。
1、某农商银行高度电视信息化的建设与发展,不断引入新的信息科技技术和理念,逐步促进银行服务的形态和内容更新,在服务理念、经营模式等多个方面实现黄型升级.伴随而来的是某农商银行科技信息系统规模的不断扩大,虚拟化、大数据、智能化等新技术的不断应用,导致IT运维管理的规模和复杂程度不断增加.为了提高某农商银行运维管理能力,增强运维管理效率,实现对信息科技系统运行的全方位管控,某农商银行不断学习借鉴前沿的运维管理技术理念,并结合银行信息科技发展现状,讲究并实践出一条符合中小金融机构的智能运维一体化发展路线,并在此基础上不断实践完善.建设背景伴随着某农商银行信息科技的迅建发展,早期分散式、粗粒度、低效率的1
2、1运维管理模式已经难以满足现有规模大、多层级、全覆盖的运维管理需求,迫切需要通过省理和技术手段来提升运维能力.近年来提出的AIOps表达了智能运维一体化的先进理念,并在大型的金融和互联网机构形成了一些成功的应用案例,但是作为中小金融机构,从IT规模、人员配备、投资预算各方面都难以支撑商业大型一体化运维管理平台的实施与应用,所以某农商银行必须走一条符合自身条件、可行可控,并能缪迭代发展的AIOps建设之路.(一)建设思路1,流程驱动运推:借鉴ITI1.运维流程标准,定制适合某农商银行实际的运维管理流程平台;3、工具驱动运维:采用运维开发模式,实现运维任务的自动化、工具化、可视化;3、数据驱动运维
3、:基于大数据采集、存储、分析技术,对运维数据进行全面挖掘和分析,实现数据驱动运维;4、平台驱动运维:通过建立统一运维平台,整合贯通CMDB,流程平台、监控平台、作业平台、数据分析处理平台,形成智能运维一体化解决方案.(二)实现路径按照以上建设思路,结合某农商银行的实际情况,将智能运维一体化建设的实现路径划分为五个阶段的演进过程.阶段一,可视化运维通过对原有监控平台的基础功能发掘扩展,并结合BPC(旁路式业务性能监控)、Web拨测、统一日志分析审计系统等技术,实现监控平台全方位展示业务健康状态指标.阶段二,标准化运维制定体系化的运维管理制度.规范运维管理流程,井结合CMDB配理平台,实现资产和运
4、堆管理的标准化.阶段三,自动化运维采用自动化运维工具和统一作业平台,通过运维流程编排、自定义脚本开发,实现批豌巡检、补丁升级、安全加固等不同场景的自动化维护.阶段四,数字化运维通过将所有运维和监控所采集的数据在大数据平台上进行转换、清洗和管理,实现数字化建模,用于支撑运维场景优化、故障原因分析和智能决策.阶段五,统一运堆管理平台通过搭建统一运维管理平台,整合CMDB,流程平台、作业平台、大数据平台等组件功能,实现各个组件之间的数据共享和联动,最终实现智能运维一体化建设.阶段一:运维可视化建设运维可视化建设的总体目标,一是实现某农商银行科技信息系统运行状态的妥维度展现,二是实现对业务系统故障的精
5、确告警,三是实现运行数据的采集,同时提供接口为后期的大数据平台提供数据支撑.为实现上述目标,某农商银行采用了商用智能监控管理中心、开源监控平台、BPC旁路流量分析系统和日志分析审计系统相结合的方式.(一)监控平台的实施及第展智能监控管理中心是下一代业务智能管理平台.它以统一的风格提供与网络、主机相关的各类管理、控制、监控功能,同时以开放的、组件化的架构向其承载业务提供分布式、分级式交互管理.智能监控管理中心是某农商银行进行网络和主机监控的统一平台.某农商银行初期通过智能管理中心实现了对数据中心网络、主机的基础硬件、系统容量、性能等基础指标的监控和告警功能,但是针对业务系统、批a作业、应用日志的
6、监控告警还需通过人工操作进行.为了实现可视化管理,并能够做到业务系统故障能缪及时准确的在监控平台上统一展现,同时各项数据能够进行统一收集存储,某农商银行对智能管理中心进行了定制化改造,通过整合监控平台、应用系统日志、操作系统日志,并结合自定义脚本程序等方法,实现了对数据中心基础硬件环境和业务系统的统一监控管理,所有服务器操作系统采用Syslog协议将系统错误、应用告警、跑批告警信息等ErrOr级别信息,通过监控脚本发送至I告警平台,Info级别信息,发送至日志审计。已知业务告警均为脚本触发,触发级别为3(Error),经过和告警平台商定,根据大屏告警关键字为JTG1.,实现所有告警都会被记录,
7、并实现有关键字的告警会有额外提示。(二)网络流量智潴分析系统通过智能管理中心,我们实现了对操作系统、数据而、中间件等IT基础环境的统一监控能力,但是无法通过应用系统的实际业务应用情况对事件进行判断和预警.为此我们引入了BPC产品来进行可视化省理的补充.BPC(BusinessPerformanceCenter)产品基于先进的协议解码技术,将网络真实数据作为客观实时的数据源,经处理后,呈现出高价值的业务可用数据源,BPC对网络真实数据的解读准确率可以达到100%,并自动发现业务访问与依赖关系。此外,还可应用于实时风险透视,大大强化了金耿企业的风险检测能力。某农商银行采取对数据中心核心网络节点实时
8、流量进行镜像,将镜像流量导入BPC平台,并针对特定业务的交易数据流进行分析处理,实现对流显、应用、节点、会话四大类数十种预制报表的自动生成,并支持Netflow,NetStream、Sflow等多种性能数据格式.使用特定处理的数据能塔建立告警基线,实现异常流最自动告警.并能够实现对故障原因的分析预判和准确定位。整体架构如下图所示:(三)日志集中管理系统各类网络设备、操作系统、数据库、中间件及应用系统日志的集中处理,能够准确分析某农商银行IT系统的安全、性能、容量、及软件缺陷,并为优化改进提供可靠依据.为此某农商银行同时进行了日志分析系统的建设.通过采购日志分析审计设备,实现了对网络、主机及应用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 银行 IT 智能 一体化 建设 实践 分享
