查看原文
其他

沈浩丨想成为数据新闻人才,你必须知道的技术要点

2015-10-12 梅子匠


前不久,在“京华论道——2015可视化与数据新闻分享会”上,中国传媒大学教授、大数据挖掘与社会计算实验室主任沈浩分享了他对当下技术与数据新闻关系的看法。同时他也表示:在原有新闻理念的基础上,可视化技术拓展了新闻呈现方式,也成为传统新闻人才和数据新闻人才的巨大差异。


以下是梅子匠对沈浩演讲内容的干货整理:


这是令人兴奋的时代,也是大数据的时代,数据科学让我们越来越多的从数据中观察到人类社会的复杂行为模式。这是令人兴奋的时代,也是大数据的时代,数据科学让我们越来越多的从数据中观察到人类社会的复杂行为模式。

《2010年Facebook世界使用者连接图》是一张非常著名的图,是在Facebook实习的学生,当时用R语言可视化语言描述了facebook、扎克伯格如何掌控地球,让我们从可视化的感知上看到整个社交活动,社会网络。在沟通的过程中如何去洞察数据。



▲2010年Facebook世界使用者连接图


Twitter也曾通过数据可视化的方式描述了每时每刻全球发布twitter的数量,你会发现这是一个数据实时在线的呈现。




我们知道人是一种视觉动物,利用视觉去感知世界。在这张图中看到那一片黑,就说明中国人不太用twitter,我们立刻感知到了这样的情况。

有一种说法,除了上帝,所有人都应该用数据说话。怎么说话呢?显然可视化很重要,因为只有看得见我们才做得好,看得见才能做得到。


「可视化形式大于内容」


今天,人们都是打开自己的手机,我可以自己去调整频道,我想看看新闻联播或者去找找天气预报怎么样,从网上把数据调出来。这时候可以看到除了这个以外,我们可以感知到所看到的可视化的感觉。我经常有一句话说:在有内容的前提下,形式会大于内容

以下图为例,无论内容做的再好,这个可视化犯了一个非常大的错误。因为这张图把台湾丢了,南海找不到了,这张图犯了政治错误。




「可视化核心是对数据的理解」


一张图,尽管描述的是相同的信息,但依然有主次的分别。比如:军费开支,如果绝对量肯定美国第一,但占GDP的比例美国就不一定第一。如何使用可视化,核心是我们对数据的理解,以及跟数据相关的分析结论。我们要从可视化的视角,用数据模式改变你的心理模式。

可视化有很多方法,之前有很多的可视化都是我用excel做出来的。这样的工具有一个问题——没法上网,没法在手机上演示。所以过去可视化非常直观。

从这个角度来讲,可视这些都是在ppt上,在excel表格上就可以实现的。现在是大数据时代,数据和新闻的融合是趋势,这个核心就是可视化。

我们做一个个性化的词云,做一个文本的主题分析,你会发现excel没有这些功能,或者当时没有这个功能。语义到底怎么解决?微博上人们的传播路径是什么?谁是意见领袖?谁是谣言的传播中心点呢?当数据量大的时候怎么感知这个点?




比如当时很重要的杜蕾斯的传播路径图可以解释很多。从这张图上,看到传播的分布,看到中心结点的价值。数据量大了,可视化就以交互的方式、在线的方式呈现。

今天的可视化跟过去不一样,过去先由data去看这个数据解释了什么,现在直接可视化,然后感知这个数据是什么样的东西。我们先可视化再去寻找数据内在的逻辑,从中我们可以看到很多可感知的东西需要我们去探查。


「可视化需要对关系的洞察」


关系的呈现在可视化过程中非常重要。在《2012年北京除夕夜短信视图》中,可以看到像这样基于地理信息,报表的方式去呈现我们想表达的数据。包括以动态的方式去筛选。



▲2012年北京除夕夜短信视图


从这个角度我们可以去做很多类似的这样一些东西,包括地理空间的问题,包括统计报表。特别是台风,各种台风的走势,这条线是怎么走势的,不同地区暴风雪的走势情况,后面都有地图去跟着,包括统计量表。像这些东西都会产生,包括我们所看到的地球,会发现这个地球里面我们会知道什么呢?所以我们对地理信息进行可视化。

我们知道地理信息天生具有可视化的特点。我们会发现在一个地图上,我们可以感知到这个地图长什么样。我们要观察地球,这种观察需要我们去思考如何从数据中洞察出来

我拿到北京市每一个交通线路,甚至每一个公交站,我们都能够通过可视化感知到这个公交站,以及方圆1公里,方圆100里是什么样的范围。百度、腾讯都有一些相关的街景地图,帮助我们更好的感知我们带来的这种数据所影响的东西。比方说智慧城市,比方说发生的热点事件,如果我们能够把一些人所谓的社会关系,跟他的地理信息以及本身的属性能够融合在一起,以可视化的方式我们就可以感知这个社会。

当我们谈到数据可视化的时候,数据可视化本身就是数据分析,本身它就是叙事手段,也是一种批判性思维。


「做数据新闻要掌握一定的工具」


对于数据新闻来讲,传媒大学是最早在全国高校建立数据新闻专业方向,我们很早在数据可视化领域一直在探索,我不是要培养数据科学家,我希望培养懂新闻的数据艺术工匠

传统的新闻人才跟今天的数据新闻人才最根本的区别是什么?最根本的区别应该掌握工具

这种工具是什么?我们希望去寻找一个工具箱,比如对于可视化工具包来讲,我们制作了这样一个工具包,在工具包里有各种各样的可视化工具软件,这些工具可能专门去解决地理信息的,包括图表的。我们也希望能够去解决更多的一些。这些工具包后面会放开,有时候希望我们的同学可以看到,今天去做这些可视化的工具并不太难。一个人的生平事件,或者一个事件的时间线,包括以地图的方式去讲故事。甚至声音,甚至图片的导航,这些东西都会产生。

作为数据新闻工作者,在呈现某一内容时,完全可以以更好的方式让受众感受到这种东西。一个是依靠对数据的洞察,一个是弄清楚让我们去感知这个我们想表达的东西。

数据新闻人才跟我们的传统的新闻人才很重要的差别就是要掌握工具。这些工具随着我们使用的熟练,从可视化的视角来讲,一直是科学和艺术的和谐统一。


这四种创意让新闻更有价值了!
>>


-完-


▌小匠 杨斯钧




点击人名,获取更多传媒人精彩文章
业界学界
于威叶伟民陈刚陈少志
闻进唐兴通杨溟魏武挥
黄磊刘炳路喻国明韦路
徐峰李小鸣范以锦彭兰【上】
周星张博张洪忠彭兰【下】
周智琛陈彤胡泳
弗格斯·皮特马昌博



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存