查看原文
其他

跟美国顶级工作室学数据可视化(下)

想喝咖啡的课代表 澎湃美数课 2021-07-30

上周一的美数课堂,课代表为大家带来了美国顶级数据可视化团队 The Pudding 的数据可视化故事教程上篇🔗,包括如何分析数据和如何数据可视化,不记得同学快去看看上一期。

而接下来就是这个系列教程的下篇——如何写故事。这一部分也是作者 Ilia Blinderman 展开得最详细的地方,因为如果你不会某一门具体的编程语言、或是某款设计工具,那没关系,总有可替代的工具,但不会讲故事,那是真的无解

课代表对照自己的创作经历,由衷感慨 Blinderman 的这篇讲故事教程,专业、有用且毫无保留。虽然全篇有六千多字,但干货满满。

为了方便阅读,文中提到的超链接课代表做了汇总,可后台回复“23”一键获取


✧✧✧✧✧

前言


在前面的教程,我列出了 The Pudding 分析数据和做可视化的工具,还介绍了这些工具的入门使用方法。哪怕此前大家对创作可视化故事一点经验也没有,也能了解个大概。这样做的目的很简单:减少大家因缺乏编程技能和教程资源不足而产生的焦虑感,好更容易地入门编程和数据可视化设计。
但如何讲故事,这个问题就要抽象得多了。它不仅仅是技术上的你能做出一张地图,或者设计出对的图表,它要考虑的问题更多,且直接影响着你在制作和呈现一个项目时做的每一个决定。
讲故事要聚焦的事情,不在“如何”通过技术实现,而在“为何”这么叙述。技术总是在解决某个具体的问题——如“怎么才能在地图上高亮人们集中的区域?”或“怎么让这个元素能沿着特定路径移动?”之类的——而讲故事要处理的问题就很宽泛了
因此,接下来会集中介绍 The Pudding 在创作可视化故事时的种种考量。

✧✧✧✧

谁是你的受众?


1.你自己:做这个项目就是出于兴趣
在项目开始前,思考一下谁是你的目标受众。如果就是为自己做的,那此类兴趣项目是你尽情发挥创造力和进行实验的好机会。
我最初入行时做的几个数据驱动的项目,有一个是探索 Craiglist (美国版 58同城 )上寻找自己错过的人这一板块。大家很渴望抓住公开场所的偶遇来创造联系,这件事引起了我的好奇心。这篇故事有很多叙事方法(实际上我在做完这篇后,还重新构思过好几次),我按照自己的方式写了一篇更加个性化的故事(这真的很爽)。毕竟,如果有编辑介入,他不可能会和你的视角一模一样。
⌂ All The Lonely People, Ilia Blinderman(链接1)
同时,私人项目也意味着我有更多的机会去没负担地去学习使用更多工具:前端开发(javascript 、HTML 、CSS、还有亚马逊云计算 AWS ),数据分析工具 R ,地理分析工具 QGIS ,字体排版等等。
而且,个人项目常常也会做起来更有动力,因为作者是最愿意为自己的作品付出的。例如我个人最喜欢的个人项目:Rily Hoonan 所作的《巴黎-鲁贝市单车赛》(链接3);还有 Jackie Gu 的《请与我对话》(她在这里思考了网恋的本质是什么)(链接5)。我是好几年前看到的这些项目,但时至今日,它们依旧是我个人项目中的心头好。

⌂ please will anyone speak to me, Jackie Gu(链接2)


2.别人:项目,工作
如果你在约束下才能更好地工作,那么为其他人创作可视化项目可能会更让你受益。可能这有些反直觉,但一些规章束缚的确可能会帮你做出更好的作品,它们会强迫你去掉一些和项目无关的审美或技术要求。
从创作故事结构时看:在为其他人创作数据故事,可以防止你在写作时拐弯抹角,帮你搞清楚内容的轻重缓急。这样一来,你就必须在规定时间内交付高质量的结果,毕竟DDL是第一生产力。如果你是个数据编辑,你可能想创造一些代表作:一堆数据源,一些视频采访,再加上四处走访,一篇有关美国毒品的社会问题的文章就有了。但你要在截止日期前交付,而且你的上司要你在美国各州地图上排一些数字,你就不得不重新排列一下项目任务的优先级了。
这里就要借用产品经理的一个经典原则:“最小可行产品优先,其他以后再说”(minimum viable product first, everything else later)。这对数据故事的构想很有用。磨练你核心的创作技巧,会让你更快地做成最小可行产品。要是故事的第一版没成功,你还有时间尝试更多思路;如果成功了,你还能用更深入的数据去分析、用更新颖的可视化去丰满你的故事。

⌂ MVP 最小可行产品


为第三方创作可视化的最后一个优点就是:在创作的时候,把客户需求纳入考虑范围内,最终成品会更加清晰易懂
我们现在暂时跳出编辑思维,假设在商业公司中,和市场经理、产品经理还有数据科学家们一起工作:为股东们创作的作品就常常就欠他们一个清晰且充分的解释。或许你很难把分析过程的细节一一呈现,但你要让你的观众读完后觉得,你确实交代了足以理解每次分析和结论的大致背景,任何含糊的“暗箱分析”并不会让读者拥有好的阅读体验。“因为所以科学道理”这样的顺口溜是行不通的。你可能会经常在文章里看到“美国总统特朗普……”之类的介绍,虽然读者都知道特朗普是美国总统,但特地指出他的头衔,可以帮助未来的读者理解文章。适量的赘述可以完善故事的背景。

✧✧✧

你的落脚点泛而大还是细而小?


1.泛而大
这个问题很适合你在分析数据的时候思考。或许答案一目了然,毕竟谁会连中心思想都不思考就直接写完一篇数据故事呢,是吧?可是这不是不常见。你想想这个情景:一人看到了一组数据,各种分析,然后摆出一堆图表,接着各个分析片段,末了跟着一点点勉强算是结论的结论,打包发表。
这种数据探索确实是充分理解数据的必经之路。但这样的操作仅仅是对一个复杂话题的开始。你可以从中学到一些变量的趋势和关联,但这可不是在讲一个故事啊,这些只是用在故事里的一些材料。
我承认自己偶尔会遇到一些本身特别有趣的数据,像 The Pudding 在 2018 年做的 30 years' worth of data from Dear Abby advice columns(链接7),和在 2019 年做的 100 years' worth of American news(链接8)。比起一些具体的问题,我更对这些语料库本身感兴趣。光是看着无数美国人对 Abby 一个人倾诉这件事本身就足够有趣了。

⌂ 30 Years of American Anxieties, The Pudding(链接7)


同样的,我认为凸显各大报社在一个世纪中所关注的种种话题就相当有意思,尤其是我们将其与当时的历史记录相对照的时候。但这种数据本身有料且有趣的情况很少见。项目不全是探索数据,探索的用处也就到帮你理解数据有哪些地方值得关注而已。我的下一步经常是做更多的研究,再开始思考故事。
不得不提醒一句,凭着宽泛话题而写的故事经常会有一个风险:可能在你发掘了数据的每一个角落后(经常是好几天无休的探索),发现没啥有趣的,就真的没有可以引起你好奇心的点。那你基本上可以洗洗睡了,如果数据所提供的见解无法吸引你,那也同样无法吸引你的读者
2.细而小
The Pudding 真正偏爱的方式就是以一个具体问题来开启项目,再利用各种合适的数据来回答它。你要提出可以让你为之兴奋的问题,那种可以在你同事圈里引出一系列讨论的问题,这些问题通常是值得你去深究的。(这可比浪费你的时间在一组不知道有没有货的数据上要安全多了)

⌂ WRITING A DATA-DRIVEN STORY, The Pudding(链接9)


以 Amber 最近的作品来举例,她调查了西雅图是不是真的是个“雨城”。关于西雅图下雨这个话题,你可能不知道从哪组数据开始,但先提出一个可以被某组数据回答的问题,可比直接从美国城市气候数据里面探索出哪些个问题可以被回答,要容易上手得多。
还有,当你把你的文章写成回答某个问题的“数据回复”,然后对起初的发问一一回答时,就很容易抓住读者的口味。我对自动化的政治影响写过一篇文章:我先列出一堆很可能被自动化影响的职业,接着解释了一些就失业来说有什么地理分布特点,最后总结了由此带来的经济冲击可能会让一些摇摆州成为共和党选区。你要是盯着一个数据,然后非要为其创造一个连贯的故事框架,再写成数据故事,可就困难多了。

⌂ Where Will You Need Your Umbrella?, The Pudding(链接10)


✧✦✧✧

你选择的想法有多复杂?

1.简单
一旦你对数据有了初步的有趣结论,那可以开始思考一下文章关键信息(中心论点)的复杂程度了。这是帮助你构思文章的好方法。
我们假设一个场景:你费了好几周终于完成了一篇数据故事。好不容易有空参加朋友久违的小聚,这时候你朋友问你最近忙啥呢。一般这个时候两种回复。一,你直言所作所为。二,你清清嗓子道,这个嘛,有点不太说,但我这么跟你讲吧……
在回复一里,你写出来的见解肯定是比较容易懂的。就像 Matt 对美国说唱歌手的词汇量调查一样,你看,我单单描述下文章内容就足以挑起读者好奇心。Mat t也是这么做的(链接11),开头一张表简洁明了地让读者不仅能看出谁是词汇量最丰富的歌手,还知道其他歌手的水准。Russell 的“赢得互联网”的简报也是如此,汇集了最受欢迎的新闻信。(链接12)

 ⌂ The Largest Vocabulary in Hip Hop, The Pudding(链接11)


如果你所研究话题的主要思想相对浅显易懂,那你的文章可以开门见山地呈上你最为在意,最为有趣的观点。
开场简明扼要地告诉读者你最重要的观点,可以让读者更加在意下文中与中心观点相关的发现。Matt 在几年前提问:哪位艺术家真正定义了朋克音乐?后来发现是 blink-182。他把这一发现放在了文章开头,然后探究了一下朋克的一些分支,以及听众的年龄与其认可的朋克乐队的关系。如果读者不先知道 blink-182 乐队从各个方面定义了朋克音乐的话,那朋克分支以及朋克听众年龄很难会吸引读者读完文章,甚至是吸引读者关注这个与朋克话题相关的作品了。还是开头的引子让这篇以朋克为题的文章更加容易被接受。

 ⌂ Crowdsourcing The Definition of Punk, The Pudding(链接13)


2.复杂
如果你从数据分析中得出的结论不是三言两语可以说清的,那也有另外一种可以让读者快速熟悉文章必需背景知识的方法。
我是《纽约客》长达15年的忠实读者。其凭借着稳健的叙事风格来吸引读者,当时很少有刊物能撼其缨锋。我敢打赌很多人根本不会为了了解瘙痒、交流模式或者美国社会精神健康而去读个几万字的材料,但是《纽约客》的这些连载可不是入门读物,而是吸引万众的名刊。

 ⌂ 《纽约客》最新一期封面漫画 “In with the New” (链接14)


在读这些文章的时候,你可以发现它们都以一个人物角色开始。最最方便的抓住读者眼球的方法就是制造一个具有人性的经历,让读者去共鸣,哪怕这些经历包含了统计数据和分析。统计数据没有上下文支持就相当没有说服力。那一个人物的经历就相当于一个引擎,为读者持续阅读提供动力。尤其是在长篇写作中,解构一个复杂且广泛的话题,这样的人物经历是极其重要的。
在可视化文章中,我们也想要吸引读者注意,但常常会忽略个人经历。那我们就需要一个能够提供足够背景知识的方法。最简单的就是从一个数据点开始,把由角色驱动的文字转换成适合可视化文章的书写。我们之前研究过重新培训工人适应自动化带来的影响。Jordan Dworkin 和我开篇讨论的是卡车司机最适合从事的其他行业。(链接15)注意,我们没有去直接提重新培训这个概念,让读者从一个数据点出发,领着他们看向我要述说的更为宏大的观点。
这个方法没有规定你要全程都对那一个数据重点着墨,这就是个帮助你在开篇吸引读者的方便之法。Russell 也对维基百科上面的各个文化名人身后流行程度这一话题做了相应处理:他开篇讲的是碧昂斯的流行度,然后以其为起点,开始讨论了名人在过世后如何变得更加出名这一现象。

⌂ Life After Death on Wikipedia, The Pudding(链接16)



✧✧✦✧

论点循序渐进


一旦你确定了可视化文章要沟通的观点,你就要想想怎么处理图与文的分布了。我们有个首要原则是:少写字,多用图表达观点。The Pudding 没有成文的文章模板的,我们有的是方法。
1.堆叠式
故事会用好几种类型的图表来表达不同的观点,常见的格式是一张图表一段文字。Russell 和 Amber 的“约会 APP 用户们的喜恶”就是这样。(链接17)文章的每一块,分别讲述了用户喜欢和讨厌的事,随年龄增长而逐渐痛恨的约会,以美国各个城市为代表的约会好恶等。每一块都有自己的图表,读者阅读时就是图文交互,一打接着一打。

⌂ 10 Things Everyone Hates About You, The Pudding(链接17)


好处:这种图表通常易于制作(PPT 、Excel 、 Keynote 、 Flourish 、 Plotly 、 ggplot2 、 D3 等都可以制作),然后这样排列静态图会在其与故事之间制造些许的交互感。这种结构相对自然,你的关键论点立刻会有一张图支撑,对文字下点功夫就能帮助读者快速理解要点。
2.滑动式
The Pudding 的很多作品都依赖这种下滑式叙事的方式:随着读者往下翻动网页,新的视觉元素会持续出现。Russell 本人就写了好几个这样的下滑交互的 javascript 包(链接19),包括教程(链接20)。当读者可以按照自己的进度滑动单一图表,进而触发动画等改变,增加文章交互和趣味性。滑动式叙事效果出奇得好。

⌂ Film or Digital, The Pudding(链接18)


好处:读者体验极为流畅丰富;如此每次滑动都能不断发现新动效,会不断激励读者继续往下看你的内容,因为这样的过渡效果,你不需要太过纠结他们每时每刻所阅读的内容,只要保证他们可以放心下滑查看就行。
尽管有这些益处,但我还是要提醒一句滑动式叙事的一些弊端:你需要兼顾移动端和电脑端;明确每一步所展现的可视化内容(用户常常会快速滑过好几步,你要确保过渡都在每一步开始的时候顺利触发);浏览器会因为过多的过渡动画而迟滞,毕竟每次修改这类作品,都要去对应的那一块修改代码。
3.步骤式
滑动式叙事确实要花不少时间,所以我们在碰到稍微短小故事时,也会使用步骤式的方法。

⌂ Are Men Singing Higher in Pop Music, The Pudding(链接21)


你完全不用在网页上创作。我们在 Instagram 上面发了不少这个类型的故事:静态图加上翻页式的内置功能。

⌂ Why It's Worth Crying Over Spilled Milk, The Pudding(链接22)


好处:相对简易的创作方式,可以通过代码或者直接在社交媒体上面实现;可以让读者阅读更具结构的论点;保证了内容的言简意赅,并且有助于你整理思路。虽然读者在电脑端的阅读体验差强人意,但这仍不失为鼓励读者读完一个清晰有条理的故事的良方(尤其是你还不用花太多时间)。

✧✧✦

如何抵达结论?


对读者来说,你大概介绍一下带领他们抵达结论的方法是很重要的,要是能再多写一点数据分析和逻辑推理的过程就再妙不过。毕竟读者都是很聪明的,他们可以批判性阅读你的文章,有些还可能对你的观点持保留意见。因此,列出你的数据源和分析方式等可以让读者更加为你的文章折服。The Pudding 的很多项目结尾都有一个方法栏,其中就有数据源链接和我们的计算方式。
我印象最深的是 Google The Giant project 的 Markup 解释。他们对自己的创作过程、调查方式、研究手段都很透明。

⌂ How We Analyzed Google's Search Results, The Markup(链接23)


✦✦

结语


在本系列的最后一篇,我已经尽我的全力去介绍 The Pudding 的故事生产流程。思考观众的问题、目的;结论的复杂性;构思可视化文章的最佳方法;明晰你的分析方式等等等等,这些技巧会帮助你以最直白的方式呈现你的作品。如果还有疑难,欢迎联系。
无论你是数据分析师、数据编辑或者是其他任何工作岗位,我希望从本文学到的东西可以帮你把想法落地。

编译略有删改,原文链接:

https://pudding.cool/process/how-to-make-dope-shit-part-3/

另外,文中超链接做了汇总,可后台回复“23”,一键获取


翻译  涂钰坤




◒◡◒

┊推 - 荐 - 阅 - 读┊




    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存