查看原文
其他

【干货】如何开启数据新闻(Data Journalism)之旅(上)

2014-09-23 全球深度报道网

我们进入了一个言必称“大数据”的时代,以致这个出现不过两年的概念似有被滥用之嫌。但无可否认的事实是,全球各地政府、企业,乃至个人每天都在制造着海量数据。这些数据中又往往隐藏着“独家猛料”,吸引着越来越多的记者投身其中,进而在新闻行业中催生了数据新闻(Data Journalism)这一时髦的分枝。


大数据时代的记者有必要懂得如何获取“结构化的信息”,通过整理并准确地分析数据来挖掘出有价值的新闻。全球深度报道网为此专门整理出一份数据新闻实用清单,帮助大家推开大数据之门。


新手入门


数据新闻在上世纪80-90年代以计算机辅助新闻报道(Computer-Assisted Reporting)的名义首次出现在新闻行业。


1989年在美国成立的计算机辅助新闻报道协会(The National Institute for Computer-Assisted Reporting)是一个致力于在全世界培养深度报道记者的组织。除了开展新手训练营等培训项目,协会还设有电子图书馆和练习用数据库,并每年举办一次计算机辅助新闻报道研讨会。


协会将有关资料集结出版,现已成为一部畅销书籍:《计算机辅助新闻报道实用手册》(Computer-Assisted Reporting: A Practical Guide)。手册的网络版可供读者免费阅读:store.ire.org


对于刚接触数据新闻的朋友,美国的Poytner网站(www.poynter.org)以“五个秘诀”和“十个工具”教你如何效地分析数据。


在英国,深度报道新闻学中心(The Center for Investigative Journalism)也出版了一本有关数据新闻学的手册(www.tcij.org/resources/handbooks/data-journalism)。CIJ还在其网站上分享了大量关于数据新闻的书籍、指南和视频资源。


著名的数据驱动新闻学(Data Driven Journalism)网站准备了非常全面的学习资料,值得参考: datadrivenjournalism.net。



你也可以在国际记者网(ijnet.org)上找到有关数据新闻的课程、辅助工具和其它资料。


Hacks/Hackers (hackshackers.com)是一个聚集了大批程序员和深度报道记者的全球性组织,目标是推动用数据发掘有影响力的报道。该组织通过各地分的支机构向记者提供培训课程。


The Investigative Dashboard网站(www.investigativedashboard.org)上囊括了数据挖掘、数据可视化以及人际关系网络分析等方面的应用工具。


不得不提的还有数据新闻学手册(Data Journalism Handbook)。这是一本由世界各国的数十位数据新闻专家合著的教材。你可以在网上免费下载包括中文(datajournalismhandbook.org/chinese)在内的各语言版本。


数据挖掘


数据新闻记者并不一定要成为程序猿,但懂得通过计算机语言运行一些简单的数据处理程序,甚至亲自动手编写一小段算法可帮助你更好地理解数据背后的逻辑,也更有利于在开展数据新闻项目的时候加强和技术部门同事之间的沟通。


对计算机一窍不通?上网总会吧?那就够了。


接下来介绍的就是面向零编程基础人士的网上教程。你会发现通过程序语言来处理数据往往比使用现成的软件更加方便,而且有趣!


codecademy.com是一个提供互动式编程培训的免费网站,手把手地教你使用常见的程序语言,包括HTML, CSS, JavaScript, Python, Ruby, 和PHP。


麻省理工大学官方网站(www.mit.edu)提供了若干免费在线课程,讲解如何使用Python,Java和C++编写程序。


计算机教育专家Michael Mart在网上发布了一本开源的培训教材(https://www.railstutorial.org/book),供人们自学Ruby on Rails。


想知道如何从网页和各种电子文档(尤其是PDF)抓取文本数据?新闻网站ProPublica开列出一份清单(www.propublica.org/nerds/item/doc-dollars-guides-collecting-the-data),囊括了相关的若干实用工具和自学教程。


此外,scraperwiki是一个抓取数据的在线工具,onlinejournalismblog.com上发布了一篇入门指南:www.propublica.org/nerds/item/doc-dollars-guides-collecting-the-data。


数据分析



Investigative Reporters and Editors(www.ire.org)上有将PDF文件转换成普通文本格式文件的简单教程。


如果想将PDF文件中的电子表格导出为Excel表格,则可以参考加拿大麦吉尔大学的网上教程:www.library.mcgill.ca/edrs/services/publications/howto/PDFtoXLS/PDFtoExcel.html。


School of Data提供了从如何找到合适的数据库,到基础的Excel使用技巧,再到如何利用挖掘到的数据完成新闻报道的一整套解决方案:schoolofdata.org/courses/


程序开发员Dan Nguyen整合了使用Google Refine清洗结构化数据的方法,以及一些视频教学链接:dannguyen.github.io/NICAR-Google-Refine/


Github则有“SQL入门介绍” :https://github.com/tthibo/SQL-Tutorial#readme。


数据可视化


美国统计学家Edward Tufte在可视化信息测绘方面有一些著述和课程,现已成为行业标准。


美国统计学家邱南森创立了Flowing Data网站,同时还出版了《鲜活的数据:数据可视化指南》( Data Points: Visualization that Means Something)和《 数据之美:一本书学会可视化设计》(This: The FlowingData Guide to Design, Visualization, and Statistics)这两本书。


Visualisationofdata.com 提供了信息图制作指南,以及其他相关信息。


esri.com为ArcGIS(一种地理信息编辑软件)爱好者准备了一套关于如何使用ArcGIS进行信息测绘的免费课程。


媒体专家Gustavo Faleiros创建了JEO(https://github.com/oeco/jeo)。JEO是一个WordPress主题模板,供新闻机构、博客博主和非政府组织在电子地图上发布带有地图定位信息的新闻报道。


自由撰稿人Peter Aldhous 整合了一套入门教程,是关于如何使用Excel的免费社交网络插件NodeXL的:www.peteraldhous.com/CAR/NodeXL_CAR2012.pdf


我们会持续更新这份清单,提供业内最前沿的资讯。如果你有任何尚未被我们收录的资料,都欢迎你通过电子邮件发送给我们:hello@gijn.org。衷心感谢你的支持。


(未完待续,欲了解更多实用资讯,敬请订阅“全球深度报道网”微信公共帐号:gijn_cn)


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存