查看原文
其他

收好这份资讯运营避坑指南:外媒日常新闻实验得出哪些规律?

腾讯传媒 全媒派 2019-04-07

没做过A/B测试的决策,总还是难免让人不安。


新闻实验室已成为顶级媒体标配,要找到读者身上的多巴胺按钮,不再是那个经验为先的时代了。本期全媒派(ID:quanmeipai)分享海外媒体日常新闻实验的经典案例,聊一聊那些国外编辑部在摸爬滚打中总结的经验,一起进入资讯运营2.0时代。


机器学习 未来可期


机器学习可以核查事实,分担记者归档的繁琐任务,还可以让如Alexa、Google智能助理之类的语音助手在周一早晨根据语调高低判断你的心情,自动播放歌曲振奋你的精神。简而言之,机器学习很有可能成为未来几年重要的新闻工具。而且,《哈佛商业评论》资深副编辑Walter Frick认为,机器学习的门槛并不是很高,不是博士也能掌握。

 

#视频:什么是机器学习https://v.qq.com/txp/iframe/player.html?vid=z1337730prd&width=500&height=375&auto=0


2018年,在全球数据大会(NICAR)一场名为“机器学习报道入门”的会议上,BuzzFeed的Peter Aldhous、《纽约时报》的Rachel Shorey、Minneapolis Star Tribune的Chase Davis和《洛杉矶时报》的Anthony Pesce深入探讨机器学习和记者,“什么类型的故事可以使用机器学习?”还探讨了一些技术层面的话题,“如何构建数据以优化算法?”。下面列举三家媒体进一步说明媒体与机器学习的结合。


《洛杉矶时报》:机器学习发现“作假”的犯罪数据


以数据为基础的警察派遣战略已经成为洛杉矶和美国其他城市治安管理的主流,但不可靠的数据会破坏犯罪图谱的制定,增大警察派遣地的决定难度。在由机器学习算法提供支持的调查中,《洛杉矶时报》发现洛杉矶警察局将2005年至2012年期间约14,000起严重袭击事件定性为轻微罪行,人为地降低了该市的犯罪水平。

 


例如,2009年在一场家庭纠纷中,一名男子用6英寸菜刀刺伤女友。警方逮捕了袭击者,判处致命武器攻击罪。但在洛杉矶警察局的犯罪数据库中,此次袭击被列为轻微攻击。由于这种错误分类,这一严重案件被排除在该部门城市暴力的记录之外。


《洛杉矶时报》使用了一种算法来解析前一次调查中的犯罪数据,以便学习识别定性严重攻击或轻微攻击的关键字。随后,完成学习的算法随机抽取了2005年至2012年间发生的近2,400起轻微犯罪案件,找出其中错误分类的案例。


随后经过人工复查,确定正确标记成错误分类的犯罪案件数量。该算法并不完美,经过检查发现,在所有标记成错误分类的犯罪案件中,24%属于标记错误。最后,根据这一错误率再次调整错误分类的估计数字。分析认为,与洛杉矶警察局的数据相比,现实中暴力犯罪的比率高出7%,严重袭击则高出16%。


针对这一调查结果,一系列旨在改善内部问责制,提高工作人员犯罪分类意识的调整措施火速开展。


《纽约时报》:看图识国会议员


NICAR的另一个专题讨论主题是APP“Who the hill”,别称为“看图识别国会议员的Shazam(听音识曲软件)”。该应用程序基于MMS面部识别服务识别国会议员。

 

NICAR的幻灯片


该面部识别APP由《纽约时报》交互实习生Gautam Hathi和Sherman Hewitt制作。Shorey在电子邮件通讯中写道,“如果记者错过了开头的介绍,他们就可以利用这个APP来识别是谁在说话或展示。或者如果他们遇到了没能在国会大厅里立即认出的人,这个软件也可以发挥作用。”


该软件还在别的场合下大展身手。Shorey和她的团队在报道由America First Super PAC主办的圣诞派对(地点是特朗普国际酒店)时,利用为该聚会提供装饰的公司发布的Instagram图片来确认是否有国会女议员出席。Shorey在电子邮件中写道,“我们乐于为读者提供一些诸如谁参加了这种活动之类的消息,特朗普酒店一方的兴趣尤为强烈,因为他们与总统有着经济联系。”


NICAR PPT


BuzzFeed:寻找'在天空的间谍'


BuzzFeed建立了一套计算机系统来识别FBI和国土安全部(DHS)的侦察飞机,从而研究机密飞行活动。首先,BuzzFeed团队在四个月内从航班实时查询网站Flightradar24获得2万架飞机的飞行跟踪数据,并将其用于一系列计算来描述飞机特性和飞行模式,例如转弯速度,飞行速度和飞行高度。


之后BuzzFeed开始训练机器学习算法,目标是识别近100架先前确定的FBI和DHS飞机以及500架随机选择的飞机的样本特征。Aldhous指出,这一算法会自行决定哪些数据是最重要的。鉴于侦察飞机一般以紧密的圆圈式飞行,该算法最重视的是飞机的转弯速度。


经过充分学习后,将2万架飞机数据输入该算法,计算出每架飞机与FBI和DHS飞机相匹配的概率。


惊人的是,通常在非洲国家追踪恐怖分子的军事公司也在美国城市上空驾驶侦察飞机。机器学习算法还发现,2015年旧金山湾区上空定期有侦察飞机飞行。军事公司声称这是因为一项世界上最稀有的哺乳动物的研究项目。不过,BuzzFeed注意到,这些飞机大多只在陆地上空盘旋,后经证实这些飞机实际上是在支持海军作战训练。

 

2015年1月至2017年7月,美国空军特种作战司令部在佛罗里达州的狭长地带上空的飞行。军事基地以粉红色显示。


然而,Buzzfeed的算法并不完美。它多标记了在小范围内盘旋,与侦察飞机飞行特征类似的跳伞运动。


在BuzzFeed的文章中,Aldhous提出:“只有真正了解何时和如何使用这些空中技术,我们才能够就有效执法,国家安全和个人隐私之间的平衡展开辩论”。Aldhous和他的团队凭借这一项目,在2016年数据新闻奖大赛中赢得了“年度数据可视化”奖项。


当你使用机器学习的时候


当你开始一个机器学习项目时可能会有点力不从心,尤其是如果你以前从未做过这些的话。在NICAR大会期间,Aldhous将机器学习拉下神坛,列举了机器学习项目的步骤清单:


·找一个有你喜欢的编程语言的好图书馆;

·阅读文档;

·确认这对你来说是很好的方法,并且你理解所有的输入和输出(即使你不了解背后的数学原因);

·花几天到几周来清理你的数据;

·写大约十行代码。



为了回答“你怎么知道你的数据是否适合机器学习?”这一问题,Chase Davis提出了以下的衡量标准:它重复/无聊吗?实习生能做到吗?如果你将这些事布置给实习生做,你会觉得羞耻吗?


Aldhous提醒记者必须始终记住要验证机器学习的结论,“否则你就是让算法代替你工作!”

 


Shorey指出,“其他方法有时可以让你在10%的时间内完成90%的工作”。 她给出了比机器学习更简单的其他方法:整理数据,使它们易于搜索;询问该专业领域的专家他们在关注什么,并简单地过滤或设立关键字快讯;使用标准的统计抽样技术。


当地新闻的创新曙光


在波因特研究院的2017-18地方新闻创新计划中,三家成员媒体都取得了喜人的成绩。《丹佛邮报》计划并推出了收费表,四个月内数字订阅量增长5100份,忠实读者人数上涨20%。The State Journal Register的Facebook粉丝数增加10%,Instagram粉丝数翻了一番,播客下载量增至2万。The Beaver County Times 新近的合作提高了40%的利润。


该计划于本月结束,各家媒体的领导来到佛罗里达州的圣彼得堡,介绍他们这一年来关注可持续数字出版的成果。 美国各地20家大小规模的媒体报道了数字订阅量的增加,社区参与度的提高,以及对创收项目的关注。虽然纸媒的境地仍然不容乐观,新闻纸大幅提价,裁剪人员规模,但这一进展就像是一道曙光。


 

实现数字可持续发展是循序渐进的过程,也是许多当地新闻媒体努力的方向。今年,这些媒体共同的目标是承受住打击并奋力壮大。波因特研究院的本地新闻创新计划是Knight- Lenfest 新闻室计划的一个项目,将七种基本方法与“绩效驱动型变革”的原则结合起来,以帮助媒体在数字化转型时代取得更好的成果。


以下这些例子展示了波因特研究院首个本地新闻创新计划参与媒体如何在实际操作中应用这些方法,计划名为“赌注”。


再见,页面浏览量


制定更合适的衡量标准,做出数据驱动的决策。那些不再过分关注页面浏览量,而转而分析每段时域内的网页浏览量变化,以及用户浏览网站的时间长短,聚焦记者本身的媒体往往能够洞察读者行为, 

 

但是一个成功的媒体不仅仅是简单地制定参与度标准。他们致力于提高结果的透明度,定期举行分析会议,赋予记者了解个人成就的权利。“在此之前,我们的策略是多加尝试,” Lawrence Journal-World编辑斯科特•斯坦福德表示, “现在,我们改用数据驱动和聚焦受众的方法。”


关注观众喜好 打造全新板块


掌握观众参与数据资料,本地新闻创新计划的参与媒体对内容安排,资源和工作流程做了很大的改动。该计划中的大多数媒体针对自己的受众群,创建新的或重新启动一些内容流。举例来说,在丹佛,住房成本上涨和人口爆炸性增长促使《丹佛邮报》新开垂直板块——附近新鲜事。其他媒体发现,读者对当地的美食和体育运动相关新闻有更多的共鸣。


  

增加吸引当地观众的内容意味着削减其他内容的数量。《路易威尔信使报》砍了近40%的将新闻量,但每则新闻的页面浏览量上升42%,部分原因是全新垂直板块如市中心发展进程的成功。


《路易威尔信使报》 执行编辑乔尔•克里斯托弗说;“虽然我们报道的故事变少了,但是我们的影响力扩大了。因为我们专注于影响力强的新闻,向观众展现更出色的作品。” 


少即是多


除了削减部分内容之外,对一些计划参与媒体而言,“少即是多”的思维模式也适用于办公空间和发布频率。一些媒体出售部分办公空间来节省成本,同时,这一举措有助于开放工作空间,跨部门协作更为方便。


还有一些媒体更有计划地发表文章,不再受印刷安排的限制,更多考虑读者行为。 为了完成这一转变,《安克雷奇每日新闻》更新了流程,变换印刷截止时间,记者日程安排和工作流程,以便能够尽早发布。Beaver County Times在上午7点,正午,下午5点和晚上8点发布内容以赶上在线读者阅读的高峰期。

 

线下参与:活动和合作关系


Durango Herald受众挖掘经理克劳迪娅•劳斯说,“不要只发布新闻,邀请读者参与进来。”他们新设Durango Diaries,每个月推出一篇演讲,主题涵盖美洲原住民历史、青少年和大麻合法化等。这些活动扩大了报纸的受众群,纸质订阅量上升30%。


  

活动、赞助和合作关系可以增加参与度和收入。《底特律自由报》的运营公司 Michigan.com新增一项业务,活动收入提高近50%,并在2017年销售超过4.7万张门票。

 

拓宽思路:销售服务和产品


《底特律自由报》出售活动门票,Tyler Morning Telegraph贩卖自己的数字服务。其他媒体也可以效仿这一做法,甚至是运动装备,就像Lawrence Journal World提议的那样。关键是,媒体能做的生意远比新闻报道多。

 

Tyler Morning Telegraph创立了独立于广告部门的数字服务代理机构,并采用咨询的方式销售特定产品,例如赞助商视频。新部门将在一年内步入正轨,增收35万美元。

 

Lawrence Journal World下设两个网站,LJWorld 和KUsports。堪萨斯州的体育报道竞争非常激烈,数字订阅模式帮助并不大。Lawrence Journal World希望能与市中心的供应商就堪萨斯大学的设备签订收入分享协议,通过在网站上添加直接的电子商务销售通道,增加收入总量和渠道。


KU Sports 网站截图


不要害怕收费

 

《弗吉尼亚人导报》总裁兼出版商帕特•理查德森说:“我们最担心的是失去广告收入。但是我们不仅没有,而且通过一张收费表,我们的订阅量增加了23%。”


该计划中的大多数媒体都设立了收费表,或是开始试验每个用户每月只能阅读一定数量的免费文章,一般来说,五篇是最为适用的。每家媒体都可以开始尝试,找出最适合自己受众的收费方式,这绝对是值得钻研的。

 

透明和清晰的愿景增长士气


南卡罗来纳州的《信使邮报》执行编辑米奇•普格感叹:“从这个计划开始执行到现在,一切都变了。” 即使是积极的改变,过程也可能会很艰难。所有报纸都报道了自己新闻报道流程方面翻天覆地的变化,有一些还发现员工队伍也变得活力满满、积极向上。这又是怎么回事?

 


这是一条基本的管理原则。当任务和目标清晰明了的时候,士气高昂,每个人都了解衡量他们的标准。管理层以每个人都可以获取的数据为支持,制定相关计划,员工也可以松一口气,专注于工作,而不是担心报纸是否处于衰退的阶段。


调查分析是衡量实验成功与否的最佳方法


许多媒体创新项目,比如《卫报》移动创新实验室,是为了实验新的范式和功能,以更与时俱进的、更好的方式发布新闻。为了衡量这些项目的成功与否,了解人们有没有按照预想的那样参与进来,掌握他们对新体验的看法是至关重要的。用户反馈是获取这些信息的最佳途径,这也是移动创新实验室在做的,在每次实验结束后向用户发送调查问卷。


 

实验室与分析机构MaassMedia强强联手,确保问卷调查能够抓取分析所需的数据,在下面的段落中,全媒派(ID:quanmeipai)精选MaassMedia资深数字分析师Lynette Chen分享的最佳实践,抓取关键数据,洞察读者想法,根据读者反馈提出可行建议。


需要注意的是,媒体创新项目需要专有的反馈调查结构,主要考虑在用户体验中引入的新技术,新闻的时间安排,报道覆盖的用户群体。在超过15个实验的基础上,MaassMedia与实验室合作不断改进、修正反馈调查范式。


每项反馈调查都包括一系列问题,其中一些问题是共性的,另一些则是个性的,共性的问题适用于对比不同实验的结果,个性的问题则更深一步,反映了在每个实验中,用户对新增功能的满意度和理解力。


涵盖与目标直接相关的共性问题


在每个调查中添加一些与团队目标直接相关的问题是很重要的。“是或否”或者“数值”的答案选项都是绝佳的选择。因为这样的话,问卷结果就是可量化的KPI,在不同时间段、不同实验间都可以比较。


对于实验室来说,一个关键目标是了解受众是否有兴趣阅读结合移动设备优势的新范式新闻。此外,实验室也渴望知道这些实验能否为用户提供价值,对他们而言,是否是有趣的。为了达到这一目标,在每次调查中,实验室都会提出几个共性问题,称之为“成功指示问题”。


《卫报》移动创新实验室的问题示例


如果大多数受访者的回答是“是”,那么该实验很有可能是成功的,因为受众有兴趣在未来收到推送通知。询问推送是否有用和有趣也很重要,因为这些是实验价值主张的关键要素。


《卫报》移动创新实验室的问题示例


设计每个实验的特有问题


有关新闻实验的内容或功能的详细问题将为更一般的问题提供“答案”。比如,如果有用户回答说该实验对他们没有用处,那么就需要设计一些问题来探究背后的原因。通过这些细节问题,媒体可以更好地查明实验成败的根本原因。


此外,这些问题的答案将为数据分析平台中收集的行为数据点提供“答案”。举一个例子,Google Analytics数据显示了用户与实验的互动情况,但没有提供该互动背后的原因。假设Google Analytics数据的分析表明,很少有用户点击实验性网络通知中的“打开实时博客”按钮。但是,在没有获取调查反馈的情况下,很难确定用户是因为不明白其用途,还是因为他们觉得通知中提供的信息量已经足够了而未点击该按钮。


询问详细问题可以验证或反驳团队对用户行为的任何假设。比如为了明确用户为什么要使用“撤销”功能,调查可以新增下图中的问题。


为了明确用户使用“撤销”功能的原因而增加的问题。


包含人口统计问题


细分用户群体对数据分析而言非常有意义,常见的人口统计问题包括关于年龄,性别,地理区域和品牌忠诚度。


用于分析调查数据的细分方法同样也可应用于解读行为数据,全面理解该细分群体的用户体验。例如,按年龄细分调查数据和Google Analytics数据,以揭示不同年龄段的群体在实验互动上存在的差异。


实验室常常提及的人口统计问题是忠诚度,因为他们认为在衡量成功与否时,必须要考虑用户对《卫报》内容的熟悉程度。从细分受众群体的忠诚度出发分析成功与否,让团队进一步了解可能吸引其订阅者的功能。通过下图的问题,在同一调查的后续问题中收集的数据可以按照不同等级的《卫报》忠诚度进行细分。



 排除部分问题 控制调查篇幅


尽管出于好奇心,实验室倾向于向用户提出一大堆问题,但是也要考虑问卷的回复率。长时间的调查可能对受访者来说并不怎么友好,特别是移动端调查,这也是为什么要关注额外问题的边际效益的原因。移动端调查是新近出现的现象,因此相关调查较少,人们无从得知最佳调查时间。不过,由于手机屏幕较小,而且用户可能在行进途中完成调查问卷,因此人们预计移动设备的受访者对长时间调查的容忍度较低。


针对移动端调查的理想时长也有一些研究。根据900多万次调查的结果,市场研究公司On Device Research建议移动端的最佳调查长度为15个问题,在这基础上,每增加1个问题,答复率降低5-10%。如果真的需要提出更多与目标相关的问题,最好是从第一次调查中筛选出更具针对性的受访者,然后进行后续调查。


分析10个实验室调查之后,初步结果验证了On Device Research的建议。从下面的图表中可以看出,超过15个问题的调查完成率低于少于15个问题的调查。


 

不过要留意一点,实验室的调查与其他调查如客户满意度等不同,后者可以在长时间内连续分发,直到达到理想的样本量,前者仅在促成实验的新闻事件结束后不久一次性发放给参与者。尽管如此,即使是少量调查反馈也能帮助团队了解用户的体验,但是不要从没有统计代表性样本量的调查结果中得出任何广泛或永久的结论。


巧用屏幕截图来解释问题


用户可能对新功能、新范式的命名不熟悉, 因此,当询问有关某个实验的特定方面的详细问题时,一张屏幕截图有助于更好地传达问题意思,最大限度地减少得到不准确答案的可能性。

 

添加屏幕截图来阐释问题


所有问题都设置为必须回答


并非所有受访者都可以回答调查中的每个问题。例如,未使用某一功能或未注册的用户回答不出“为什么开始使用这一功能”的问题。但与其将所有的特定都设置为自选题目,不如将所有问题都设置为必须回答,增加一个选项,如“N / A”或“我不明白题目的意思”。如果你不以这种方式组织你的问题和选项,你可能会对某人选择不回答该问题的原因做出错误判断。


答案选项包括“我不知道如何查看其他镜头”。 


避免使用引导性语言


注意问题的措辞,尽量不要出现引导性语言。举例来说,与其问“您是否希望呈现更多信息?”,更好的中立的替代问题是“您对呈现的信息量有何看法?”。同样,代替 “您是否觉得更新很烦?”问题可以改为“您对更新有什么看法?”。在后续的分析中,准确、中立的数据至关重要。



以上就是本期全媒派和您分享的全部内容,波因特研究院的地方新闻创新计划、《卫报》移动创新实验室和NICAR的机器学习分享,这三者都是媒体行业的求变者,更是未来媒体发展方向的“指路人”,不断总结经验,让后来者走得更快,走得更稳,散发着属于这个时代的生命力。





文章已于修改

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存