精彩报告 ▏北航张建华:大数据透视高校校园有机体(下篇)
在上篇里张主任讲到了大数据透视高校校园有机体到底要透视什么、数据来源是什么,以及如何通过大数据来看见服务作风。今天分享的下篇里,张主任将继续介绍如何通过大数据来看见情绪、看见用户行为、看见部门运行状态、看见社会影响力。再次感谢张主任!
阅读上篇请点击这里:
这是“为我点赞”系统后台看到的点评数据。
从今年9月开学到10月27日,我们预约量已经达到23295条,日均办理665条业务,相当大的一个量。
而且我们还可以看到评价,从一星到五星,可以看出一个问题,其实我们的同学宽容度比较高,一般都是给一个还不错的评价,没有说太差,给了五星说明确实是感动了。
总体来说,数据也是非常好看的。
原来我们前台工作的老师是有抵触的,他不愿意做这个,为什么呢?因为“我们平时都挺累的,你还给弄一个枷锁,没事还要给我点评下,很麻烦嘛”。
对于这个问题我是这么跟他们解释的。
我说,其实你们有没有发现一个问题,你要是打车,是不是司机先给乘客评价之后,乘客再来付钱的,乘客再给司机评价。以后我给你们也做一个评价功能,你先给同学评价一下,然后同学再评价你,互相评价。这样的话,同学在学校里办的业务多了,他在学校也有了一个诚信指数,我们也能了解这个同学是不是比较喜欢提建议,或者说是一个各方面都不错的同学。
所以这也是我们的一个结论,不同部门的点赞分布比例基本一致,同学们宽容度较高。
大数据透视之——看见情绪
关于情绪的数据就比较多了。
这是来自外部数据,我们分析的是从2016年1月1日到10月17日一共10个月的百度贴吧里的26599条数据。
大家可以看到,图中绿色代表高兴,橘红色代表愤怒,蓝色代表悲伤,那我们看一个长时间的比例,拉大尺度的话你就会发现一个问题,高兴的永远在下面,悲伤和愤怒永远在上面,这说明一个什么问题?前面我也介绍过就是,网络是一个负面情绪的宣泄平台,好事不出门坏事传千里。
再对比一下校内的数据,我们分析的是iHome数据,同样也是抽取的2016年1月1日到10月17日期间的数据,共4684条。
大家可以看到,情绪的整个趋势是一样的,一般都是高兴的在下面,悲伤和愤怒在上面。
也有个别时候绿色在上面的,我们分析过,比如快要放假了,十一放假,或者说马上双11网购,马上情绪就高起来了,很有意思,在分析背后这些东西特别好玩。
那我们的结论就是,网络负面情绪远高于正面情绪。
同时我们还把外部数据和内部数据的情绪比例做成饼图来进行一个对比。
外部数据和内部数据的高兴比例,分别是15%和18%,趋势基本一致。而红色的愤怒部分,外部的愤怒比例占了30%左右,而校内恰恰是占了最多的,50%。
我们内部分析这是什么原因呢,越是自己人,越放得开,越敢说话,在外面还相对柔和点儿,把情绪相对压制一下,再者也是爱护学校的一个表现,在外面说话相对都注意一些,在校内还是实名制,反而情绪表达更直接,更奔放一些,我觉得应该是这么来理解。
大数据透视之——看见用户行为
用户行为也特别有意思。
我们根据学校的学生上网数据分析,他们都在上什么网。
top10第一名是百度贴吧,前面我们也是采用了百度贴吧的数据来对学生进行情绪的分析。
第十名,ihome,中间这些全部是爱奇艺等外部看电影打游戏的网站。
那我们也可以看出学生上这些网站到底要干什么,也就是倾诉、表现、个性化、表达自己的不同。
这是我们对于每一个学院的同学上网的轨迹前三的上网的流量进行分析。
计算机学院的、自动化学院的,每个学院的同学上网都不一样。这也提醒我们,现在搞通识教育,应该让学院与学院之间更多地交流。
我们在这里也看到仪器光电和自动化学院的同学上网前三名是一致的。
所以结论是,流量类型的“空间局限性“反映了校内的社群特征。
学生在使用校内的相关业务系统的量,峰值是开学时选课的时候。使用量前三名是教务系统、财务系统和网络中心的系统,最多时达到100多万。
说明这几个系统是学校必须保证运维好的。在我们学校,财务专门有一个团队,有3个老师专门维护这个系统。
大数据透视之——看见部门运行状态
我们学校现在无线网全部覆盖,这是昨天晚上10点半左右我们抓取的一个数据,同学从图书馆和教室上完自习,回到大运村他的宿舍,他在学校经过的路途中我们布了很多的无线AP,他过的时候都会连上,那我们就可以把他的轨迹图画出来,不同的颜色代表人群的大小,比如红色代表10人以上,绿色代表10人以下,有时候是一会儿,一块上自习,包括他在大运村的楼与楼之间走动都可以看得到,那我们就能分析到同学的轨迹是怎样的。
这幅图也有点意思,因为我们学校比较特殊,属于军工院校,网络攻击比较多,最近我们也提网络安全、信息安全。我们一个小时的攻击量是2066万次,从外部对于学校的攻击每天达到1000多次。
同学上网的时间,最高峰是晚上11-12点,基本趋势是一致的。所以得出的结论是,上网时间规律反映作息时间规律。
大数据透视之——看见社会影响力
我们从外部拿到数据,包括了微博、新闻、微信、论坛、博客,视频等等。我们搜两个词,一个是北航的全称,一个是简写,然后把搜索出的相关数据全部导出来,从2015年10月到现在大概有52万的数据量,我们从这个数据量里进行了很多挖掘。
第一个是热度走势图,从去年10月到现在的跟北航相关的新闻整体分布,最高量接近5000。
第二个是各个省份的网络提及量,浙江是一个亮点,仅次于北京,是因为我们在浙江办了一个新的研究院。
第三是微信热度走势图,微信上的数据分析相对较少。
第四是微博热度走势图。
第五是词频图,我们把跟北航相关的正面的一些信息拿出来,可以看出“不忘初心”、“创新”、“医工结合”、“推动产业发展”等等词语是比较频繁出现的。
我们想通过“透视”的这种视角,让数据把原本看不见的东西变成看得见摸得着,达到一个透明的效果,通过这种透明让学校原来不公开的东西公开出来,公开的目的是什么,是为我们的师生更好地服务,达到我们以师生为本,达到习总书记说的“以人为本”的目标。
大数据之——五行
大数据是“金”,是金矿,可以不断挖掘;
对于每一个人来说,数据是客观的,但是每个人的理解又是不同的。
对于数据来说,我们今天也做一个探讨,我们的大数据,我认为还不是大数据,我们还只是做了一些数据的分析和数据的挖掘,但是在这样一个背景中,随着时间的积累,我们肯定慢慢就得到大数据了。
大数据是“水”,润物无声,可以默默地、渐渐地引导人;
大数据是“木”,渐渐地支撑人才培养,十年树木百年树人;
大数据是“火”,是火把,可以给我们一个方向,原来不知道怎么做,通过数据我们可以观测到下一步我们怎么前进,可以预测到未来;
大数据是“土”,是土壤,我们认为土壤是一层一层叠加的,每一天的数据都是历史的,随着数据的不断增多,像做CT或者磁共振一样,我们更容易看清事物的本质。
群雁精神
最后用这样一张图作为结尾,这叫群雁精神。
我们认为信息化不是靠一个单位、一个部门或者一个人就能够干成的,一定是需要群雁精神,大家一起来干。
前面讲到的很多数据,也有校友的企业和外面的公司为我们提供了很大的支持和赞助,在这里一并感谢,同时我们也想和各位老师探讨下面怎么去开发,也欢迎大家有机会到北航来,谢谢大家!
(全文完)
也许您还感兴趣: