推动大数据分析,打造智慧型教务——华中科技大学王士贤副主任演讲
本文根据华中科技大学王士贤副主任在“互联网+”时代下的高校智慧校园创新应用研讨会上的演讲报告整理。
大家好!
我来自华中科技大学。今天跟大家汇报的主题是:推动大数据分析,打造智慧型教务。
我今天的报告分四个部分,分别是教务系统简介、教务大数据分析、打造智慧教务、“十三五”信息化发展规划。
第一部分,关于教务系统。
我校的教务系统始建于2006年,主体由学校自主开发,个别应用借助于商业软件。我们发现,不光是教务系统,在整个做教育信息化行业里面,很难找到几个比较成熟的公司能够满足学校的信息化发展需要的,所以最后我们决定自己来开发教务系统。当然我们也集成了部分商业软件,其中评教系统和课程中心使用的是@#%&(湖南一家厂商)的,但是这家公司的技术服务能力实在太差,无法跟上学校信息化发展需求,最后我们把这个废掉了。
整个教务系统由25个子系统组成,其中有1个单点登录的入口,统一使用1个数据库,分别针对教务管理人员、教师和学生建设3个个性化门户,个别公共系统对社会开放访问。
我们这个系统总称为HUB系统,其实是一个大教务系统,除了有本科教务的教务处的业务之外,还包括我们研究生院的系统,还有注册管理系统。可以说最难的两个系统,都聚合在HUB系统里面了。
我们做HUB系统的初衷就是希望它成为集线器、资源库,实现信息汇聚、资源共享的作用,想把它建设成为学校的公共信息服务平台。
主要特色有1+N模式。即一个数据库,N个应用,这样就彻底解决数据不一致的问题,否则还要进行数据交换和共享。
然后是以用户为中心。所有的系统比如这种UI都是结合互联网的潮流重新设计,磁铁式的快捷菜单。
以下是25个子系统的列表,每个系统都是一个独立应用,每个应用又通过集群的方式来保证系统的正常运行,各个系统之间读的是同一份数据。
这是一部分系统列表,大概分了五类,分别是公共服务类、注册管理类、本科教务类、研究生教务类、研究生事务类。
这是整个系统内部之间的关系,以HUB系统为中心、为平台,其他所有系统围绕HUB系统为教师门户和学生门户做服务。当然,这个系统也不是独立地存在,它和学校的基础数据库之间也是有关系的。
目前我们已经基本建成了学生的基础数据库,总的各类记录加起来大概有2亿多条,成为学生相关所有统计数据的权威源。原来统计关于学生的数据报表,教务处也报一份,学工处也报一份,每家都不太一样,一直困扰学校很长时间。自从我们这个系统建成后,这个问题基本就解决了。
系统的界面展示,也是按照比较流行的样式来设计的。
第二部分,教务大数据。
我们做了一些摸索,本身并不能称为严格意义上的大数据,可以说是伪大数据,但现在比较流行把这称为大数据。我们主要是做了下面几个工作。
一、生日大数据
我们把学校学生的生日做了一个统计分析,起了个名字叫“HUST那么大,就是那么巧,我们同年同月同日生”,全部用微信来推送的。
我校全日制本科生加研究生一共是53037名。这里有一个关于年龄的分布,最大的是56岁的研究生,最小的是14岁的本科生,20岁的是人数最多的。
还有关于出生月份的分析,比如10月份的,是最多的。还有关于星座的分析、关于出生日期的,具体日期的等等。
其实这个东西并不新鲜,最早做这些数据分析的是上海交大,并且以微信的形式发表出来了。但是我们希望在这个基础上更进一步,不光是面上的整体统计数据,还希望能统计到个人。就希望实现学生一登陆,就可以找到和你同年同月同日生的有多少人。
比如这位同学有23个同年同月同日生的,其中有22个本科生,1个留学生。还可以知道23个人分别来自哪些学院,分别来自哪些地区,有多少男生多少女生,15个男生8个女生,因为我们学校男生比较多,这也是常规的一个比例。这个页面发出去以后,学生也在网上做了很多的分享,掀起了一股找与自己同年同月同日生的人的小热潮。
二、四六级大数据
从2006年以来,学生的四六级考试的成绩数据全部在数据库里,所以可以做一些分析。
这个分析带一点比较性质,所以我们设计了江湖的风格页面展示。
首先以2014年秋季四六级考试成绩数据做分析。我们就发现在这次的考试中,四级考试无论是平均成绩还是考试成绩占前30%的优秀学生的成绩都是女生明显高于男生。然后对学院做了分析,比如说生科院、软件学院、外国语学院是前三名。还有就是对地域和来源做了分析,我们发现无论是四级还是六级,成绩最好的三个都是来自上海、江苏和广东三个省的学生。
教务系统本来也有大学英语的课程成绩,我们又把平时的大学英语考试成绩与四六级成绩做了相关度分析,发现他们的相关度也非常高,这说明如果想要顺利地通过四六级考试,平时学好大学英语基本就可以了。
三、毕业生大数据
去年我们针对2015届毕业生做了《光阴的故事》数据分析策划,其实是对学生自入学以来所有的数据做展现。
比如这位同学是2011年9月从孝感到武汉,与华中科技大学第一次相遇,31个小伙伴与你同行,光电信息工程201106班是你的新的归宿,这是表现出刚入学的基本信息,班里多少人,在哪个班。
然后是注册的数据。我校比较重视注册,注册率能达到100%。学生到校后,第一件事就是注册,注册比较早的学生,前10%我们就授予他注册神人的称号,前20%是注册牛人,30%是注册达人,比较有意思。
接着对课程做了梳理。比如这位同学一共学了76门课,必修68门,公选8门,共有68位老师教授过他。
最终的成绩,大学四年,加权平均成绩,专业排名是多少,对这些数据都做了一个展现。包括他的英语成绩、四六级考试,什么时候考过的,得到多少分,打败了多少同学,等等。
还有他使用我们系统的情况,比如一共使用我们系统982次,接收了多少邮件和短信等等。
最后就是比较伤感的离别,我们承诺HUB系统永远对其保持开放,这样他毕业以后也仍然可以查到他的个人信息。
这样一个数据分析策划,让我们的学生也非常感动,疯狂地在朋友圈分享,也给与了很高的评价。其实我校的学生还是非常挑剔的,创意非常强,对信息化的要求也非常高。大家知道,微信的创始人张小龙、PPTV的创始人姚欣就是我校毕业的,还有好多互联网界的大咖也都是我校学生。
以上这三块可能还不是真正意义上的大数据,现在我们也正在做一些大数据方面的探索。
一个是学霸模型。学生为什么学习成绩好,与哪些数据有关,我们梳理一下,比如图书馆借哪些书,经常访问哪些网站,是否按时上课,是否按时回到宿舍等等,把这些数据的相关性进行分析,得出如何成长为一个学霸的路径。
第二是学生预警模型。学习预警比较简单,大概就是你这个学期应该修多少学分,目前为止还差多少学分,相对来说比较单一。现在开始在做学生失联预警模型。学生失踪了,不知道为什么失踪,有没有办法提前知道这个学生有失踪的可能,或者是哪一天失踪的,这个是大数据可以做的事。比如我们有成绩数据、家庭数据,心理测试数据、校园卡刷卡数据、门禁数据、网络数据、WIFI日志数据等等,通过这些数据做预警分析判断,预防学生失踪失联。
第三部分,智慧教务。
第一个是针对老师的上课提醒。现在老师都比较忙,搞科研搞课题,有时候上课第三周或者第七周就容易忘记。那我们这个短信提醒,对老师也非常有帮助。当然,如果老师觉得不需要,也可以退订,或者一周收一次也OK。遇上五一、十一这种大规模的调课时间,也会做短信的提醒。
第二个叫挂科也温情。每学期给学生发放成绩单的时候,成绩好的学生当然很开心,成绩差的同学,我们也需要给予一些鼓励。所以针对挂科的同学,我们发送成绩单的同时,也发送了一封名为《永不放弃》的邮件,以激励他们努力学习,挑战自我。一些媒体也对这件事做了报道。
第三个是学霸上封面。教务系统一般给人的印象是比较呆板,登录界面永远是一成不变的,体验感很不好。那我们就想是否能用这个做些宣传,把一些成绩比较好、形象比较好的同学的照片放在封面上,定期更新。
第一期就放了一位形象比较好的女同学到封面上,在当时还引起了轰动,应该也是全国第一个敢把美女图片放在教务系统首页的学校吧,所以当地的媒体和一些网媒也进行了报道。
当然我们也不是以美女为唯一条件,这位男同学也是很厉害的,是全国大学生电子大赛的特等奖获得者,也是骨髓捐献者,道德模范。还有些有些团体和优美风景的图片,让教务系统首页成了一个展示平台,这样就使整个系统活起来了,变得更生动有趣。
第四个是掌上教务。自从微信服务号出来后,我们就抓紧做了教务的微信服务号,把选课、查成绩、查课表、大数据发布等放到微信上来,还包括四六级报名、四六级报名微信支付等等,也很方便。
第四部分,信息化十三五发展规划。
去年底和今年上半年,大家都在搞信息化十三五发展规划。搞信息化十三五发展规划的套路是比较一致的,一般都是首先进行SWOT分析,列举取得的成绩、存在的问题、面临的挑战、面临的机遇等,然后提一个目标,接着是从当前时间点到目标时间点大概需要落实建多少个项目。写了一万多字,却让大家看完后不知道你到底要做什么。
后来我们想了想,究竟怎么样让大家记住我们的规划。
首先讲讲我们信息化规划的原则。
标红字的就是今年十八届五中全会做国家十三五规划的时候提出的五大发展理念,其实用在信息化建设上也是非常非常吻合的。
然后,为了让大家记住我们的十三五规划,我们提出了“十个一”工程,让大家知道信息化部门五年内就要做这些事情,凡是和“十个一”有关的就优先支持。
第一是全校一张网。很多学校都采取运营商投资,学校使用的方式,但我们是反过来的。我们发现很多运营商在学校建了管道建了光缆,乱穿乱建,实际上是很影响学校管理的。为了便于管理,我们所有的管网和光缆都由学校出钱统一建设,建完后包括运营商、保卫处的视频监控等,所有用光缆的校内外单位全部租用学校的光缆。这样的话,所有的管网和光缆的维护和管理都由学校统一负责,防止扯皮现象。
第二是基础一平台。学校有很多很多应用系统,不可能每个系统都建自己的基础平台。基础平台就包括存储、服务器、中间件、DBM数据库等等这些,那么我们学校自己建设了电子校务基础平台,上面运行了学校全部、重要的29个应用业务。
第三是网站一个群。这个比较简单,实际上是把全校的网站纳入一个网站群建设。
第四是数据一个库。先期是要建基础数据库,把一些基础的需要共享的数据汇总到一个数据库里边。未来要做成全库,业务数据也要建在这个数据库里面,在这个库里做大数据分析平台。
第五是集成一总线。我们发现很多应用系统在集成的时候,需要开放很多接口。我们初步统计了下,全校这么多系统有上百个接口了,非常难以管理。那么我们决定要建一个总线,把所有的接口管理起来,因为未来这些接口可能有上千个,甚至更多,如果现在不管的话,都是无序的。但是ESB其实在高校使用是很少的,大家都觉得太重,实际上我认为还是很有必要的。
第六是上网一个号。这个是统一身份认证系统,大部分学校基本都有。前段时间有老师写了一篇文章叫《数字校园“三大平台”的困境与出路》,实际上就提到统一身份认证系统大家都有了,无非是集成的单点登录的系统多与少的问题,但是有个最大的问题没解决,就是角色与岗位的管理。【这是相对做得较好的平台,实现单点登录没有问题。但大部分统一认证平台统一管理的其实是“账号”而不是“人”,人的多重属性、身份、包括延伸到的岗位角色等核心问题,几乎没有得到公认的解决方案。而这些管理特性的缺失使得身份认证系统其实只是做了用户登录,难以真正成为学校数据资产/信息资产的一个有价值的维度。而作为对比,这十多年来,在互联网中,社交平台的崛起,互联网的身份/开放授权管理已经得到了极大的发展和标准化,相比之下校园的身份认证体系,似乎还封闭在十多年前的老做法之中。】角色与岗位,没有一个地方是统一的权威的源。目前我们正在想办法做事情,有了这样一个权威的源之后,我的OA,我的信访,我的各种流程的流转,全部就可以使用这个数据。
第七是信息一个站。这个指的是信息门户,分两部分,一个是手机版,一个是web版。手机版我们使用的是微信的企业号,没有再开发APP,因为觉得成本太高。实际上在微信企业号里,使用的是分布式开发,各个系统开发好后进行集成,统一管理,统一入口。
第八是消息一通道。老师也好,学生也好,大家在接收信息的时候,有太多个渠道,有QQ,有微信,有邮件,有短信。但是,当你想去查一个信息的时候,又不好查,可能会遗漏了。那我们就想要做一个集中的消息发送平台,同时也是个历史查阅平台。也就是说,学校所有的系统都要通过这个通道来发信息,同时学校给你发的所有信息都能在这个平台上查到,这样就方便了老师和学生。
第九是校园一张卡。原来叫校园一卡通,后来叫手机一卡通,那么未来的发展趋势可能就是无卡,虚拟卡。
第十是办事一张表。这也是很多学校已经在做的,比如网上办事大厅和“一张表”工程。这张图是我们网上办事大厅的界面,里面有推荐服务、热门服务等。我们的目标是把全校所有的部处的线上的或者O2O的流程全部放到网上办事大厅里来,大家在办理的时候都可以在上面实时查询到某个业务已经办理到哪个地步。同时在手机端也做了网上办事大厅,有一些简单的业务可以在手机上实现办理。
我的汇报就到这里,谢谢大家!