当你拨通运维服务台的热线电话
话筒另一端照例传来
服务台妹子清甜的声音
但你知道吗?
你的服务请求,会被她发向哪里?
你的报障经过了多少次邮件、电话的流转,
哪些技术牛人参与其中?
据不完全统计,高校每季度要被动处理的宕机故障约10起,系统大规模上线、应用推广等阶段的高峰时段更高达30起!这边系统刚宕机,那边投诉电话即刻响起!
随着如今高校软硬件规模越来越庞大,架构也愈加复杂。系统宕机、访问慢等问题的处理涉及到网络、主机、操作系统、中间件、应用软件等多个组成部分,定位难、解决更难!
每当面临这些难以确诊的疑难杂症时,信息办老师们的内心都是崩溃的!恨不能立刻自建传送门把专业服务公司的维护人员快递过来!!啊医生,你在哪??
![360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的! 360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的!]()
如今的IT系统运维依赖于个人的知识积累和经验是难以完成的,往往需要自动化的工具、专业化团队、长期的经验积累来支撑。
今天,就由以上这位
“关爱信息办成长协会”
运维服务分会会长的老胡
带你扒一扒:
一个“支持了超过2000个业务系统7*24小时不间断稳定运行的服务体系”,它的运作流程和内部结构究竟是啥样的呢?
当用户端的系统发生故障或风险,一般通过以下两种方法提报:
一是故障已经发生,用户直接进行提报;
二是通过软件监测客户端的情况发现潜在风险或故障,进行预警。
故障出现了!
你第一个反应是打电话吧?
拿起电话的你
脑海中会浮出这样的形象吧?
![360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的! 360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的!]()
的确,电话线这头
服务台的人美声甜的软妹子正等着你!
也许你会惊讶
她甚至能够叫出你的名字!
因为400电话已关联了呼叫分发系统!
每一次呼入
系统都会自动向妹子提示
你所在学校的应用建设情况信息
让妹子快捷地进入工作状态哦!
![360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的! 360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的!]()
▲ 电话呼入服务台提示界面
对问题的受理,除了传统的电话、邮件,微信、QQ等渠道也是我们在持续扩展的。尤其待微信服务号推广后,发张照片就报障完成啦!
服务台通常有多个妹子互做备份,也就是即使上午值班的妹子下午出去约会了,下午换班的另一个也能随时跟你唠!
电话呼入高峰期,系统会自行分发——这样可保证99%的接通率。不信?打个电话试试吧!
在监控服务大厅里(下图),有一张大大的中国地图,地图中标识了每个上线应用系统的院校当前的运行状态。
但凡有风险或故障发生,系统实时报警。这样真正让我们做到了“足不出户,尽知天下事”!
![360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的! 360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的!]()
▲ 所有系统集中监控的界面
当显示某个高校存在故障时,我们可以下钻到学校,查看该校所有上线系统的运行状态和潜在风险哦!
![360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的! 360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的!]()
▲ 单个学校所有系统监控界面
最神奇的是,系统可以对故障进行自动预警及定位,将已经故障点信息直接发送到手机及邮箱。
![360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的! 360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的!]()
▲ 故障点信息提示
接到你的电话、邮件后,或获取监控系统预警后,妹子要在系统中登记故障内容,以及根据严重情况及影响范围确定事件优先级,并根据优先级分配给对应的一线人员受理。优先级别为“最高”的事件,将直接由二线工程师受理。后续,服务台还需要跟踪进度、调查用户满意度。
![360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的! 360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的!]()
▲ 问题申报系统故障登记界面
因此妹子们不仅人美、声甜、脾气好,还具备一定的故障分析能力。
服务台妹子派发任务后,指定的一线人员会立刻接到系统自动发出的电话或邮件,并立刻着手进行故障确认及远程调试。
一线人员一般是身经百战的工程师,“72变”解决用户现场发生的综合问题。当然,工程师能够如同“孙悟空”一般见招拆招,后端的知识库平台发挥了重要作用!
原来,对每一次故障处理的原因和处理方案,知识库都进行了记录和总结,并由专家审核补充。当故障在此发生时,系统会推送故障可能的原因,以供服务台和运维服务工程师使用,超智能有木有?
![360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的! 360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的!]()
▲ 问题申报系统与知识库关联
问题解决后,一线人员需在系统中登记处理过程,结项闭环。当一线工作人员在约定时间内不能解决,会调动后端的团队出场。
你是猴子搬来的救兵吗?
是,我们是四大天王!
![360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的! 360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的!]()
“四大天王”属于二线工作人员,为一线人员提供支撑。他们需要掌握专业的检测工具,还要熟悉各个硬件厂商、软件公司的技术文档,最重要的是对某个专业领域“有丰富的处理经验”。遇到复杂的疑难杂症,还需要集合团队的力量开会讨论。
同样,如在约定时间内,故障不能得以解决,那么该事件需升级到三线。
三线处理一般由各软、硬件原厂商来支持。通常,升级到三线处理的故障过程非常少,约占故障总量的1%。
在遇到与硬件有关的紧急故障时,可以在金智备件库里调取备件应急。一般行业主流的设备备件,如思科、IBM、华为等厂商的网络设备及配件、服务器设备及配件等,备件库里都有。
![360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的! 360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的!]()
▲ 备件库图
整个事件的处理过程中,工程师会通过QQ、电话、短信等方式与老师们保持信息互通;处理结束后,服务台会在当日对事件故障处理情况予以确认,并于两个工作日后执行故障处理情况回访,了解该事件是否再现,收集用户的建议。最终关闭case。
每个月,服务团队还会对基础环境例行健康检查:在指定的时间,远程或者现场对软硬件系统例行检查,发现隐患,并主动处理或防护。
对当月出现的问题汇总分析,对各问题输出解决方案、防护措施或优化,并针对性的应用到其它用户中。
![360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的! 360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的!]()
![360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的! 360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的!]()
▲ 分析及总结报告
你要是认为上面这就是运维保障体系的全部?那就too young too simple了!还有更多高大上的,如“配置管理、发布管理、变更管理、信息安全管理”体系,这些以后有机会再显摆吧(傲娇脸)
金智教育遵循ITSS服务管理体系
并结合自身业务特点建立了
以人员、资源、技术、过程
四大要素为核心的运维服务体系
目前支撑了全国
超过2000个业务系统
7*24小时不间断的安全稳定运行!
正是这样高质量、高标准的服务体系
才能让你尽情的玩耍
没有后顾之忧啊!
![360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的! 360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的!]()
![360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的! 360°无死角展示:支持千余高校业务系统稳定运行的运维体系是怎样的!]()
本文是金智教育研究院原创文章,转载本篇文章请注明原文出处(金智教育研究院)及本页链接:http://yjy.wisedu.com/info/1003/1051.htm