从系统的观点谈银行IT安全生产.docx
《从系统的观点谈银行IT安全生产.docx》由会员分享,可在线阅读,更多相关《从系统的观点谈银行IT安全生产.docx(10页珍藏版)》请在优知文库上搜索。
1、本文针对提升商业银行IT系统的运行保障水平,从系统科学和控制论的观点出发,对银行IT系统提出了一种基于系统关联分析的故障定位方法,对报警信息整合和利用进行了研讨。我国商业银行IT系统稳定运行面临的挑故随着我国商业银行IT系统建设日益全视臼主可控技术,分布式核心、主机卜移在未来-段时间内逐渐成为趋挎。一方面信息系统日益更杂,另一方面新技术新产品存在个逐渐成熟的过程,都对IT系统的稳定运行提出了新的挑战。数据中心如何才能保障IT系统的稔定运行?一旦发生故障如何做到快速响应、快速定位、快速解决、第一时间恢第生产?本文试图应用系统科学、控制论的观点探讨银行IT系统的子系统关联流程分析、报警信息整合、故
2、障定位和处理,并结合行业实践和本人经验,给出些可供参考的建议。从系统科学、控制论观点看银行门系统控制反愀IT系统运维的系统,控制论观点系统科学是研究系统的结构与功能关系、演化和调控规律的科学,是一门新兴的综合性、交叉性学科。它与控制论有着紧密的联系。系统/控制理论的基本观点包括系统观点、信息观点、反馈观点和控制观点。I、系统观点系统论从整体上研究事物,把事物(对象)看成是一个由各个部分(要素)组成的系统。对这个系统,要研究其各部分功能上的联系。控制论把系统与其它事物的战系概括为“输入“(外部对系统的影响)以及“输出”(系统对外部的影响)。根据系统观点,对于银行IT系统,本身可以看作一个大的系统
3、,各个应用和基础架构(应用服务器、数据库服务器、网络交换机、通讯链路、各种终端、负载均衡设备和其它类型设备等)可以看成是这个大系统的子系统。我们可以对银行IT系统的多个子系统建立因素关联分析法。对于每个系统列出支持系统,上游系统和下游系统.在故障发生时,及时对关联的系统进行关注和处理。例如,由于系统同时发生故障的几率较小,在多个系统同时发生故障时,如果这些系统并非互相依赖,则可以找出这些系统的共同支持系统,从而迅速判断故障定位。2、信息观点控制论耍解决的是时系统的控制问题,而时各系统的控制需要以一定的信息为依据。没有信息则无法进行控制。监控平台和各子系统的运行及报错信息,在系统保障中发挥着重要
4、作用。很多IT系统都建立了汇集和处理各子系统信息的集中监控平台,在系统保障中发挥着重要作用。对于系统维护人员,重要的通讯录、系统命令手册和信息查询手册应该触手可及,以提高应急工作的效率。关于系统信息的利用,主要的考虑点包括:(1)建立统一的信息展示和报警平台所有子系统的信息可以在子系统自身的监控界面上供子系统运维人员及时显示和查阅:重要信息应该发往统一信息监控告警平台,方便集中监控和运维处理。在报警平日的实现上,可以运用人工智能的模式识别技术和自动应答来提高运行效率。(2)从开发初期即考虑错误返回码的设计各子系统格式应该尽量统一,方便监控和技术人m统一处理“错误返回码应该包括(应用)产品标识、
5、问题解释、系统动作、参考回应等等。信息的查询应该做到准谕详细、方便快捷。以IBM大型机操作系统信息为例,错误返回码包括问通解释(Exp1.anation)系统动作(SyS1.emaction)操作员回应(Operaiorresponse).系统程序员回应(Sysiempmgrainnierrespong,模块(Modu1.e),过程名(PrOCCdurCnamc),各个子系统的MessagesandC1.cs信息非常丰富和规范,可以用手机APP或PC上网或卜载后脱机查询,对于问题的解决很有耕助,值得我们借鉴。(3)注意重要信息出现的时间和顺序如果能够知道故障的具体发生开始时间,对问题的解决是有
6、相当的帮助的。在找故障发生时点时,第一个异常信息往往具有特别重要的提示功能,在多数情况下问题的发生是连续的,彼此之间仃密切的关联。第个问题往往是故障的起因。抓住/第一个问题.有利于我们瞅藤摸瓜,掌握故障的前因后果,从而最终解决问题。(4)注重红盘和信息的保存在故障消除之后,通过对问题的定位和处理,使得我们增加了对系统的了解,是花费/代价换来的宝贵知识.无论是经验还是教训,都是系统和分析人珏反馈给我们的全要信息,非常值得利用这个时机认我复楸,总结和保存经验教训,形成应急预案或问题案例进入知识库,从而在未来更好地对IT系统进行控制,使其达到我们期望的效果。3、反馈观点系统输送出的信息作用于被控制对
7、象后产生的结果再输送回来(回输),并对信息的再输出发生影响的过程就是反馈。变更及变更回退可以看成是一种回馈。根据统计,80%的系统故障发生与变更有关。个运行良好的系统,不会无缘无故地发生故障.对系统和应用变更的实施一定要有一套完整的管理制度和网退及应急方案。作为故障处理人员应当知道变更的原因、内容、影响范围、回退办法和应急预案。4、控制观点系统、控制论的最终目的是要对各系统进行最优控制,根据反馈原理,调整各部分的功能,以达到系统的最佳状态。在银行IT系统中,保障系统安全稳定运行可以看成是通过一系列控制手段,预防、解决和消除不稳定和故障因素,从而使系统运行成本、信息输出、实现功效符合期望的过程,
8、在控制过程中建议注意以下几点:(I)人是系统稳定运行的关键和核心。在系统运维时一方面需要注重自动化,同时要不能忽视人的因素,在严格遵守制度的同时,在岗位上要注意发扬敢于负货,勇于担当,求实善战的工作作风,只有具备这样的精神的人,才能在应急时刻迎难而上。2)事前预防至于临时灭火。一个优秀的系统维护人员如同一个好的医生。需要具备“上医治未病”的理念。要注重平时的系统检查,对系统性能指标要心中有数。要保持监控画面的简单有效,平时要消除多余的干扰信息,避免问题来临时真正重要的信息被其他信息掩蛊而忽视.在监控中,可以借鉴设备维护的红黄绿三色灯的概念,来实时显示系统的健康、警告和故障状态。(3)要减少控制
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 系统 观点 银行 IT 安全生产
