咨询
STEP 1 / PROJECT SPECIFICATIONS
我们将在一个工作日内回复,资料保密处理
yjy.wisedu.com
推荐专题 / News
推荐新闻 / News 更多>>
英迈思活动 / FAQ 更多>>
英迈思活动 / Video 更多>>

河南师范大学网络中心信息科科长陈艳浩:“智慧校园”运维服务模式的思考

来自:
日期: 2017-07-06
浏览: 255

6月23日,“WE+2017智慧校园新生态落地行”正式启动,首站选地河南郑州,为河南高校信息化管理部门,学工、人事、教务、研究生、校办等核心业务部门搭建了一个碰撞智慧火花的交流平台。大会还要请了近10位重量级嘉宾分享各自在智慧校园建设中的独特观点和亲历经验。今天,小编根据实录整理了河南师范大学网络中心信息科科长陈艳浩的运维服务新思考。

 

河南师范大学网络中心信息科科长陈艳浩:“智慧校园”运维服务模式的思考

 

教育信息化已成为高水平大学建设的一个重要支撑和发力点,信息化建设工作在高校中的地位和作用越来越重要,伴随着智慧校园建设工作的不断推进,越来越多的应用系统、教学资源、图书资源、管理数据进入数据中心,给高校信息化运维工作带来了巨大压力和挑战。

 


一.    河南师范大学信息化工作简介


河南师范大学概况

河南师范大学位于豫北名城新乡市,是河南省人民政府与国家教育部共同建设高校、国家中西部高等教育振兴计划支持高校、博士学位授权高校、全国文明单位。目前在校生5万人。位列全国高校学生数排行榜第19名,有24个省级重点学科,16个博士学位授权点,135个硕士学位授权点,9个专业硕士学位授权点以及24个国家级教学示范中心。

 

学校信息化建设历程

我校的信息化起步比较早,但真正快速发展始于2009年。


 河南师范大学网络中心信息科科长陈艳浩:“智慧校园”运维服务模式的思考


(河南师范大学信息化建设历程)

 

l  2009年——2010年,我校启动了三大平台建设,即“信息门户平台”、“数据交换平台”、“身份认证平台”。

l  2011——2014年,我校完成了业务系统的期验,学工、人事、宿舍管理,以及研究生教学、本科生论文、本科生实习管理等业务系统的建设。

l  2015年——2016年,我校主要完成了邮件系统的升级,安心守护项目以及基础数据库项目。

l  2017年,我校准备做门户平台升级、学生区第三方运维、自助打印系统以及教务系统升级、科研系统升级、办公系统升级三大系统升级工作。

 

目前有30多个系统提供师生服务,覆盖学校管理、科研、教学、生活服务等各个方面。后台还有将近20个业务系统提供支撑,比如高性能计算、备份系统、监控系统、虚拟化平台等,这些业务系统是面向管理员、面向信息中心的,很多不直接面向普通师生,总计我校目前有将近50套业务系统在运行。

 

河南师范大学网络中心信息科科长陈艳浩:“智慧校园”运维服务模式的思考

(河南师范大学业务系统概览)


这50套系统由全校200余台服务器和30余台存储设备提供服务支持,服务器规模比较大,但专业运维人员很少,运维压力非常大。

 

 

二.“智慧校园”对传统运维服务模式的挑战


目前很多高校都在进行智慧校园建设,在新的建设智慧校园的大环境下,运维服务模式出现了一些变化:

 

l  第一个变化:信息化技术体系的转变

 

校园信息化建设初期,仅有几台核心设备,规模小,技术架构简单,往往单个应用只需要一台服务器,维护起来也容易。

 

随着校内各类业务系统逐步上线,校内技术体系发生转变,各种IT基础设施、云计算、大数据、高性能存储、移动技术纷纷进入高校,学校的IT基础设施规模从早期的零星设备逐步升级到庞大的数据中心环境,拥有大量的厂商、硬件解决方案、应用系统等,技术体系发生了量的改变

 

l  第二个变化:信息化建设深度的转变

 

随着信息化应用系统越来越多,师生用户的体验要求也越来越高,移动、虚拟化、云计算、大数据等高端技术融入校园信息化建设,应用系统的架构变得更加复杂,维护难度也加大。一个应用要关联数据库、中间件、虚拟化、存储等众多技术,对信息中心工作人员的技术要求提出了更高的条件,同时也给了信息中心带来了大量的维护工作,我们认为这是信息化建设带来了的质的改变

 

河南师范大学网络中心信息科科长陈艳浩:“智慧校园”运维服务模式的思考

(基础设施、软件架构、应用软件均规模庞大)

 

随着学校信息化建设的不断深入,确实也出现了很多运维层面的问题:

 

运维工作繁重,运维人员压力大

 

信息化日常工作80%是运维工作,运维人员面临的压力很大,工作也最繁琐,同时这部分工作又不出彩,不容易被领导重视。

 

管理人员的被动响应

 

学校信息化运维人员在发生故障的时候,往往属于后知后觉。用户发现故障之后打电话报告,或者通过其他途径反馈到管理员时,管理员才知道某个业务系统出现了故障,需要我们运维人员去处理。这样就导致业务系统中断的时间过长,被用户投诉。

 

人员难培养成普遍问题

以前管理员可能只会使用服务器就可以,现在除了需要具备服务器的管理经验,还要会虚拟化,还要懂存储,还要懂备份,各式各样的知识都需要掌握。

 

软件厂家响应速度慢

在做数据中心运维的时候,遇到硬件或操作系统层面的故障,管理人员只是麻烦一点,耗时长一点,还都能够处理。如果遇到业务系统的问题,比如说某个业务系统本身存在漏洞。这时管理员是无法进行修补的,往往需要业务系统原厂家的支持。但实际的场景是,从系统维护出现漏洞,到漏洞修补完成原厂家甚至需要一周到两周,还有可能更长时间。而在此期间一些关键业务系统又不能带“病”工作,给运维工作带来了很大困难。

 


三.“智慧校园”运维服务的应对措施

 

以上四个问题,都是各高校信息部门头疼的问题,但经过梳理之后会发现这些问题归根到底都是人的问题:人员短缺情况严重。在目前人员短缺的情况下,如何解决运维面临的问题,我校也做了一些工作和尝试。也许不一定算很成功,这里与大家分享一下:


河南师范大学网络中心信息科科长陈艳浩:“智慧校园”运维服务模式的思考


第一,摸清家底,确立边界

做软件的时候,程序员怕用户的需求不停地变,今天一个需求,明天一个需求,根本服务不完。我们运维工作同样面临到这个问题,我们必须把这个服务的边界给划出来,具体信息化部门负责哪些工作,业务部门管哪些工作分清楚。简单来说就是,按照“谁主管谁负责”原则。业务部门的业务系统,比如说教务、学工等这些系统,各单位自己管。我校现在借助最近做的等级保护工作,还有网络安全法的教育工作。借这两个机会把工作内容明确,从去年开始一直执行到现在。

 

第二,组好队伍,加强培训

第二,组好队伍,加强培训

我们网络中心在全校范围内,每个单位选拔1到2名对计算机稍微有一点基础的老师,组成了一个70个人的全校规模的信息员队伍,每年组织1到2次培训。现在,各部门里面,比较简单、琐碎、重复性的工作,比如申请办公邮箱等等,都交由各单位的信息员进行操作,这样一方面减少了网络中心的工作量,另一方面也减少了广大师生因为不熟悉业务办理流程,多跑冤枉路的现象,减少了投诉。

 

第三,借助外力,寻求强援

因为咱们人力资源也不够,技术储备也比不上专业的公司,所以我们信息化部门必须从外部引入资源解决我们面临的问题。高校的信息化运维工作通常包含网络运维和数据中心运维两个主要方面,我校采用学生区第三方运维的方式,通过引入第三方公司,将学生区的运维整个交由第三方公司负责,实现了网络运维方面的大减负。而数据中心运维方面,我们通过对多种产品的选择和对比,最终选择了金智教育的“安心守护”服务作为我们重要的抓手。

 

第四,抢占“先”机,消除隐患

如果能让管理员提前预知存在哪些故障,提前解决,使用户无感知。或者是一出现问题,在很短时间内解决问题,就可以使我们的运维工作得到广大师生的好评,减少投诉。金智公司的 “安心守护”服务里边,就有完善的预警机制,能够帮运维人员提前预判软件故障,这使我校业务系统的宕机时间大大缩短。很多故障,在用户还不知道的情况下,运维人员就能提前解决了。


第五,使用成熟的服务

买产品,更要买服务。其实我校在使用“安心守护”之前,考察了很多运维软件,包括国内、省内的一些公司的产品我们都试用了。但是这些公司的产品无一例外都是重监护、重告警,并没有一个完善的解决方案。

 

运维工作中最耗费时间和精力的就是定位故障和处理问题。“安心守护”能给我校提供这些问题的解决方案。一方面他们能给我进行告警,另外一方面在得到我们的允许之后,他们会进行一些处理操作,处理完之后他们给我一个反馈,高校信息化运维管理人员只需要进行确认一下工作就可以了。这样一来,我们信息化部门的工作压力大大减轻。

 


四.第三方公司的管家式服务

 

这里我想以“安心守护”为例,谈谈他们是如何在校园网运维方面给我校提供帮助的。

 

业务预警

 

河南师范大学网络中心信息科科长陈艳浩:“智慧校园”运维服务模式的思考

(业务预警)

 

业务预警的数据来源于两部分。第一是可用性数据,可用性数据来源于“安心守护”日常收集的业务性相关的信息、操作系统版本里面的容器,以及框架结构的版本等等。这些信息都在“安心守护”的平台上有所体现和展示。第二个是安全数据。安全数据来源于安全厂家。

 

比如说,最近爆发的勒索病毒,这些数据我们运维人员往往知道得比较晚,拿到数据的时候可能已经成规模爆发了,我们运维管理人员才知道,或者说,知道之后也无法及时处理。这时候“安心守护”会结合两方数据之后,形成一个预警分析,预警分析可以告诉管理员哪些系统可能受到漏洞或病毒影响,哪些系统里面的框架版本受此病毒的影响,你心里边就比较清楚。获得漏洞数据之后,通过大屏幕或者是手机界面这种方式提醒管理员。

 

精准告警

 

金智公司的理念比较超前,一般情况下监控软件发现漏洞之后,除了给管理员通知之外,没有其他办法。但是金智公司的安心守护服务,除了通知管理员以外,还把这个系统漏洞推送给厂家,由相关厂家分析后,推出解决方案供用户进行解决。

 河南师范大学网络中心信息科科长陈艳浩:“智慧校园”运维服务模式的思考


(精准推送)


透明处理

 

透明处理就是说整个故障或者事件爆发之后,这个处理流程非常透明,管理员可以看到这个环节到达哪一步,谁处理的,处理花了多长时间。

 

比如说3月7日的struts 2漏洞,9点20爆发预警,然后9点30就出现了定位分析,分析到哪些系统存在漏洞, 9点35分就已经报告给相关的厂家,也就是说很多厂家就接到通知,上午10点钟故障受理,这些原厂家就开始着手处理漏洞。然后给一个预计时间,他说可能需要12个小时才能修复,实际上是到那个下午5点35分已经完成,这样的话,业务系统只用在几个小时就可以处理完毕,而且我们运维管理人员可以做到心中有数。

 

河南师范大学网络中心信息科科长陈艳浩:“智慧校园”运维服务模式的思考

(处理过程透明化)


应急恢复

 

除了漏洞之外呢,还有一些故障是由于某些参数设置不当造成的。比如说,我们今年6月份出现了一次故障,信息门户和一些系统突然之间不能访问,这个时候我们就紧急联系公司技术人员。他们经过分析之后,发现这个问题可能需要进一步排查,建议我们先恢复,我们同意之后,他们将服务器进行重启,重启完他们进行深入分析,然后跟我们说里面是一个最大请求参数设置过小,导致后面用户访问请求的时候需要排队造成的,修改完此参数后问题解决。

 

整个处理过程统计数据可以看出,我们业务系统中断20分钟之后,这个问题就得到解决了。而以往这些问题可能需要很长的处理时间。

 

事件确认

 

一个漏洞一个事件是否处理完毕,不能光靠厂家问题是否解决,我们运维管理人员自己要做到心中有数。但这个过程我们处理往往力不从心,尤其在服务器和业务系统比较多的情况下,光靠我们人工做是非常难的。

 

而“安心守护”就能帮助我们通过安全厂商提供的漏洞检测工具,去帮忙分析服务器上,哪些服务器漏洞确实修复完毕,哪些服务器还没有进行修复。这个时候可以通过人工确认的方式对这个漏洞进行确认,同时人工确认完毕之后,在平台上还要再做一个确认,这样的话系统以后再发现问题时就不会再漏报。

 

河南师范大学网络中心信息科科长陈艳浩:“智慧校园”运维服务模式的思考

(多重确认方式)


服务评价

 

服务评价是利用透明化的处理监控,处理过程使供应商服务质量得到一个良好的评价,以便于后续我们在选择服务的时候有一个参考。服务的指标主要有三个评价指标。分别是响应时间、处理耗时和反工次数。通过这三个指标的考核,来评价服务。

 

五.心得与期望

 

经过多年运维,安心守护会形成了一个应用排名统计,一个服务提供商排名,一个投入资源消耗排名。

 

通过图表数据可以帮助分析哪些业务系统利用率高,哪些业务系统资源消耗高。在以后新的采购计划下来的时候,就能清楚地知道内存、CPU、硬盘空间等等是否需要扩容,相关图表为我们做了一个数据支撑,能够成为我们在做决策的时候的重要依据。

 

通过各种各样数据分析之后,包括应用可用性排名、应用安全性排名、投入自然排名、厂商排名、应用使用情况,各种数据分析之后,最终给我们管理员提供一个总的一个帐表,方便我们下一步做决策、做采购计划、做评估商选择的时候,我们能做到心中有数。

 

通过对安心守护系统的使用,有效避免或解决了我校在系统软硬件方面遇到的问题,再联合外部服务提供商提供的服务,共同创建了学校运维的新生态,使得各业务系统可以长时间保持健康、安全、稳定的运行状态,从而实现智慧校园的应用与数据的可用和安全,也为信息中心部门的职能转变提供了良好的契机。

 

安心守护无疑适应了当前信息化的发展趋势,不仅提供了管家式运维服务的新模式,也为学校的整体信息化建设提供了新的安全建设思路。

 


关键词:
分享:
Hot News / 热点新闻
地址:中国·南京·江宁区将军大道100号金智科技园
电话:025-68755381   邮箱:marketing@wisedu.com
传真:+86 0755-2788 8009
邮编:330520
Copyright@ 2018-2019江苏金智教育信息股份有限公司 All rights reserved
犀牛云提供企业云服务