《XXXX网管系统内存扩容实施方案 .docx》由会员分享,可在线阅读,更多相关《XXXX网管系统内存扩容实施方案 .docx(11页珍藏版)》请在优知文库上搜索。
1、XXXX网管系统内存扩容实施方案时间:项目名称:制定人:批准人:目录1 说明31.1 目的31.2 主要操作313需提前准备的工作31.4 操作的主板示意图32扩容前后系统对比53本次扩容过程对业务的影响54本次内存扩容人员和时间安排54.1 故障处理人员安排:54.2 扩容时间安排:65扩容内存操作步骤65.1 网管服务器扩容内存65.2 网管服务器测试106回退步骤106扩容风险及应急预案116.1 扩容风险116.2 扩容应急预案111编制说明1.I项目目的XX机务站网管中心2台XX型网管服务器系统内存为16G,由于设备更新扩容,已经不能满足日常需要,需将内存扩容至32G,即增加8个2G
2、内存,并进行相关的FirmWare升级,以提升主机性能。具体操作如下:将每台T5240的内存,扩容为32GB。现将每两台设备(限于同一地点服务器)中的一台设备的原所有2GB内存(每台16G),都挪到另一台设备上,使该设备达到32G内存;内存空出的设备,插入(具体配置:SE4GBFBDIMM(2*2GB),1.5V,T5240内存2*2GB)8组,共计32GB内存。由于新的内存条为L5V电压的内存条,根据原厂手册,需要对安装新内存的设备的固件(firmware)进行升级;安装老内存的设备,无需固件升级。1.2主要操作程序1 .数据库数据备份2 .确认备机没有业务进行关机3 .备机安装新的16个内
3、存条扩容至32G;并检验。4 .主切换备5 .验证业务登陆情况6 .主机安装备机拆下的原来内存条16G,扩容至32G;并检验。7 .备用切换主8 .验证业务登陆情况1.3 需提前准备的工作本次服务器升级需要提前准备好扩容的内存,并需要额外准备一组备用(2条内存),荣之联工程师提前准备最新的T5240的FW升级包。1.4 操作的主板示意图T5240图:2扩容前后系统对比扩容前扩容后涉及的设备名称XXXXX网管双机服务器涉及的设备IPXXXX涉及的设备位置XX机房涉及主机名H-ZZ-NMS-SVR-PP1-SAH-ZZ-NMS-SVR-DB1-ST5240具体配置对比3本次扩容过程对业务的影响本次
4、内存更换操作过程,主要是对网管应用服务器双机,需要将应用服务器1的资源切换到应用服务器2上,在内存扩容完成之后,再将资源切回到应用服务器1上,在资源切换过程中,网管系统会有30分钟(每次切换需要约15分钟)的时间停止运行。受影响的范围包括所有网管平台实时监控及snmp业务接口。4本次内存扩容人员和时间安排4.1 故障处理人员安排:姓名公司名称电话4.2 扩容时间安排:20XX年XX月XX日21:0023:505扩容内存操作步骤5.1 网管服务器扩容内存步骤时间责任人扩容内存具体操作步骤完成情况说明XX月XX日必须先将应用0点前完成网管系统检查及应用服务器系统备份。应用服务器1更换内存条前,资源
5、切换到应用服务器2上,然后关闭服务器。以root账户登录系统10.89.200.14,AH-ZZ-NMS-SVR-DBI-S#scstat-p(查看SC状态)10:00-0:10XXX#scswitch-z-gPKGAHNMS-rg-hAH-ZZ-NMS-SVR-APPI-S(切换到主服务器)以下在主服务器验证(如果没有跳过步骤):# ps-eflgrepora_(查看nms数据库启动是否正常,切换是否正常)# PSYfIgrePNmS(为14个网管后台程序进程是否正常运行)# ps-eflgrepGCD(为3个网管局数局程序是否运行正常)# ps-eflgrepCnIiSeI(为3个网管自动
6、巡检管理程序是否正常)# ps-efgrepUIP(为3个应用集成程序是否运行正常)# PSYfIgrePPASM(为3个权限认证程序是否运行正常)# ps-eflgrepIPM(为IP地址管理程序是否运行正常)查看各个Probe运行是否正常,是否被自动拉起。查看各个后台网管程序日志是否报错、是否稳定。是否20:10-0:15XX通过浏览器访综合分析(WEB:58045/ucas)报表、综合监控(NMS监控软件)、综合维护(局数据、巡检系统、IP地址管理等),查看登录及监控是否正常是否如果访问正常,则关闭10.89.200.14Ah-Zz-NMS-SVR-DBI-S是否30:15-0:25XX
7、#scswitch-S-hAiI-ZZ-NMS-SVRDBl-S(将该服务器上的SC资源切换到其他节点上)说明进入机房,扩容内存步骤时间责任人扩容内存具体操作步骤完成情况40:30-2:30XXX检查内存的PN号和FW升级包是否5XXX机器健康度检查是否6XXX关闭操作:1 .关闭应用服务器Ah-Zz-NMS-SVR-DBI-SA、通知用户系统将要关闭B、关闭该主机C、等待前面板电源灯熄灭2 .断开应用服务器连接的所有电源,网线,光缆,将服务器推出机架3 .打开服务器上盖4 .将防静电腕带一端戴在手腕上,一端联在主机金属内壁上。5 .拔出需要扩容的主机的内存A、将内存平放在防静电垫子上B、插入
8、需要扩容的新内存6 .升级该主机的FW(Ah-Zz-NMS-SVR-DBI-S)7 .启动应用服务器H-ZZ-NMS-SVR-DB1-S7XXX内存条板子下架I打开服务器上面的上面板2取下原来内存条,将新内存条插入服务器3将服务器上面板盖上是否8XXX服务器上架是否9XXX1加电开机2收集内存状态日志,确认内存是否正常。是否主备切换将业务切换到已经扩容的主机说明内存状态正常后,将应用资源切回应用服务器182:30-3:00XXX以root账户登录系统10.89.200.12,#scstat-p(查看SC状态)#SCSWitCh-Z-gPKGHNMS-rg-hAH-ZZ-NMS-SVR-DBI-
9、S(切换至备服务器)# SCStat-P(查看SC状态)以下在主服务器验证(如果没有进程跳过此步骤):# psYflgrePora_(查看nms数据库启动是否正常)# PSYfIgrePNmS(为14个网管后台程序进程是否正常运行)# ps-eflgrepGCD(为3个网管局数局程序是否运行正常)# ps-efgrepCrUiSer(为3个网管自动巡检管理程序是否正常)# PSYfIgrePUIP(为3个应用集成程序是否运行正常)# ps-eflgrepPASM(为3个权限认证程序是否运行正常)# ps-eflgrepIPM(为IP地址管理程序是否运行正常)查看各个PrObe运行是否正常,是否
10、被自动拉起。查看各个后台网管程序日志是否报错、是否稳定。是否93:00-3:10XXX通过浏览器访问综合分析(WEB:58045/ucas)报表、综合监控(NMS监控软件)、综合维护(局数据、巡检系统、IP地址管理维护等),查看登录及监控是否正常是否说明进入机房,扩容主机内存43:15-4:00XXX服务器下架是否5XXX内存条板子下架1 .关闭主用服务器Aii-Zz-Nms-SVR-APPI-S2 .断开服务器连接的所有电源,网线,光缆,将服务器推出机架3 .打开服务器上盖4 .将防静电腕带一端戴在手腕上,一端联在主机金属内壁上。5 .将刚才从备机拔下的内存,全部插入主机6 .启动主机AH-
11、ZZ-NMS-SVR-APP1-S,进行检测7 .备、主切换8 .检查业务状态是否6XXX服务器上架是否7XXX1加电开机2收集内存状态日志,确认内存是否正常。是否说明登陆服务器主机检查硬件状态变化,验证业务是否正常备主切换将业务切换到扩容的主机说明内存状态正常后,将应用资源切回应用服务器184:15-4:35XXX以root账户登录系统10.89.200.14,Ah-Zz-XMS-SVR-DBI-S#scstat-p(查看SC状态)#SCSWitCh-Z-gPKGHNMS-rgfAH-ZZ-NMS-SVR-APPI-S(切换至主服务器)#scstat-p(查看SC状态)以下在主服务器验证(如
12、果没有进程跳过此步骤):# ps-efgrepOra_(查看nms数据库启动是否正常)# PSYflgrePNmS(为14个网管后台程序进程是否正常运行)# PSYfIgrePGCD(为3个网管局数局程序是否运行正常)# ps-efgrepCrUiSer(为3个网管自动巡检管理程序是否正常)# PSYflgrePUIP(为3个应用集成程序是否运行正常)# PSYfIgrePPASM(为3个权限认证程序是否运行正常)# ps-ef|grepIPM(为IP地址管理程序是否运行正常)查看各个PrObe运行是否正常,是否被自动拉起。查看各个后台网管程序日志是否报错、是否稳定。是否94:35-4:40X
13、XX通过浏览器访综合分析(WEB:58045/ucas)报表、综合监控(NMS监控软件)、综合维护(局数据、巡检系统、IP地址管理等),查看登录及监控是否正常是否5.2 网管服务器测试测试方案测试编号测试编号1测试项目测试硬件状态测试主机主机/备机预置条件扩容内存之后,升级FW之后测试步骤进行最大化自检预期结果识别大小配置,并通过最大化检测测试结果口通过口未通过备注需要输出检查结果测试编号测试编号2测试项目测试FW升级完成预置条件升级FW后,重起主机后测试步骤通过命令查看预期结果正常识别内存.测试结果口通过未通过备注需要输出检查结果测试编号测试编号3测试项目应用检测预置条件扩容完成后,FW升级完成后测试步骤用户检测应用状态预期结果应用正常测试结果口通过未通过备注需要输出检查结果6回退步骤如果在扩容时出现不能正常扩容内存,或启动后不能进行正常业务流程,则可采用该回退方案,恢复成原始状态拆除新增内存1.关闭服务器电源通知用户系统将要关闭按下并释放前面板电源按钮等待前面板电源灯熄灭2 .把钥匙插入前面板插孔中,拧到强制关闭位置3 .断开服务器连接的所有电源,网线