每周一本书 | 《揭开数据真相》:质疑“看得见”的数据,挖出“看不见”的真相
来源:数据猿 作者:jean
小编寄语:“你看到的,只是我想让你看到的”,让数据说话,说客观其实也不客观,所以别太迷信数据啦~
统计数据之所以强大有力,是因为它一点都不care我们的情怀、梦想和信仰——数据让我们客观地看待事物。但是,当数据耿直的显示了人们讨厌的结果时,命运只能被操纵,最终变成“漂亮”的数据(企业财报、销售额、阅读量等等)……因此懂得解释统计数据,了解各种歪曲、滥用数据的技术对于理解数据真相是非常必要的。
本周给大家推荐的书是《揭开数据真相:从小白到数据分析达人》,这本书的技术门槛不高,主要目的是让读者学会如何质疑“看得见”的数据,并挖出“看不见”的数据真相,还原基本的事实。
有人会担心,我没有经过系统科学训练,是不是要再去读一个数学课程呢?其实完全没必要,那些复杂的数学公式主要用来让你崩溃的(回想自己的高数课程),最重要的还是见识一些常见套路,遇到类似的能举一反三,升华出来一些方法论就更棒了。
这本书就从很多实例中总结了数据分析的技巧和“骗人”招数。比如通过内在不完备的样本,精心挑选的平均数,统计图表范围的切割,相关系数因果关系的误解,混淆逻辑,操控是非,达到一些不可告人的目的。这并不是一本教科书,让你去学习深奥枯燥的统计数学,而是用风趣幽默的例子从别的视角来观察世界,启迪智慧。
比如本书的第十章在讲确认性偏差时,作者就“分母”的重要性举了一个很有趣的例子:
假设有一群人看见你盯着一根树枝就把树枝折断了
只要你不告诉这些人一个事实——你盯着这些树枝看了很久而树枝迟迟不断,那么,这些人肯定会对你表面上的断树功力大感敬畏。
在奇妙的统计学讨论中,只提分子、不提分母可以让不真实的事情看上去很真实。这让我们明白了一点:如果只提罕见的结果,不提得出这个结果的时间和尝试次数,是不可能做出判断的。
再比如:
要是我扔出7个骰子,每个都是6点,你会惊讶吗?
要是我告诉你,我扔了36782次,你还会惊讶吗?
人们常常进行预测,错了就不予理睬,碰巧对了就大加赞赏。这种贬低错误预测、偏重正确预测的倾向是一种非常重要的生存能力。大数据时代,企业在利用数据进行各种所谓的预测时,要提防这种确认性偏差心理!
类似上面有趣的例子在本书随处可见,不信你先看目录过把瘾~
推荐阅读:
每周一本书 |《R语言预测实战》:预测很有趣,算法却未必枯燥
每周一本书 |《能源大数据》:如何在能源管理中应用好大数据技术?
每周一本书 |《智慧城市》:大数据、物联网和云计算在智慧城市中扮演的角色
每周一本书 |《赤裸裸的未来》:大数据时代:如何预见未来的生活和自己
本书由 数据猿联合电子工业出版社 共同推荐
购买地址:
http://wqitem.jd.com/item/view?sku=12052254
【本栏目合作伙伴】:清华大学出版社、电子工业出版社、北京师范大学出版社。
欢迎更多合作伙伴加入!也欢迎勾搭小编,微信:15737954328,备注“书”
来源:数据猿