查看原文
其他

|大数据分析学起来|今天走了几步啦??!看人家用计算步数发表的Nature

2017-08-10 冯生 ActionFree

前言

在智能手机普及的今天,你有没有通过使用微信记步,给每天步数上万的好友点赞呢?是不是非常羡慕那些盘踞榜首的运动达人,看着自己只有几千的步数心有不甘呢?小编今天告诉你,这些步数除了用来点赞和炫耀,居然已经被人拿去发Nature了! 

这是一篇来自斯坦福大学研究团队的文章,于上个月发表在Nature。

他们利用智能手机手机人群的步数,发掘一定区域内人群活动不平衡度与人群肥胖率、性别和城市规划的关系;他们希望通过相关的研究,推动全球公共健康监督的发展,增进人们对城市规划的重视程度。

人群活动不平衡度

运用到了经济中常用的基尼系数(图1)来定义活动的不平衡性。

基尼系数是1943年美国经济学家阿尔伯特·赫希曼根据洛伦兹曲线所定义的判断收入分配平衡程度的指标。而洛伦兹曲线是用以比较不同国家在同一时代的财富不平等,该曲线能总结收入和财富分配信息。研究者把人群的活动量类比为财富,设实际活动分配曲线和活动分配绝对平衡线之间的面积为A,实际活动分配曲线右下方的面积为B,以A面积除以AB面积之和的商表示不平等程度,即基尼系数。如果A为零,基尼系数为零,表示活动分配完全平等;如果B为零,系数为1,则表示活动分配绝对不平等。


研究方法


通过如上方法,研究者收集的71万用户的数据得以应用,111个国家在一定时间内的人群活动量与人群数量就可以拟合在图中。洛伦兹曲线的弧度越小,则说明这个国家的活动量分布较为平衡,就像是每个人的收入分配很公平,每个人手里都有钱。如果洛伦兹曲线的弧度越大,就表示一个国家的活动不平衡度越高,就说明这个国家的“活动”不是人人平均,如同口袋里面的钱有多有少,人们之间存在贫富差距一样,这个国家也存在“活动”的贫富差距。


主要结果


❂ 活动不平衡度与肥胖的关系

以往我们可能觉得走路走得多就不会那么胖——事实确实如此,但每日平均步数并不是预测肥胖率的最佳角色。研究者们发现活动不平衡度能更好地预测某个地区的肥胖程度,比如美国和墨西哥有相似的平均每日步数(4774比4692),但是美国的活动不平衡度(0.303比0.279)和肥胖水平更高(27.7%比18.1%),这就说明了活动不平衡度更能体现肥胖水平的高低。

研究者是通过Steiger’s Z-test来确定活动不平衡度与肥胖水平的关联比每日平均步数更强烈(r=0.79:-0.62;N=46;t=2.86;P<0.01)。

研究者们利用统计原理来比较两种关联拟合程度的思路是很值得借鉴的,这也给我们的研究提供了新的思路。



❂ 爱美的女性多走路

研究者们将每个国家中的男性和女性的数据分开来计算,他们发现在那些活动不平衡度高的国家里面,女性的活动量的降低与男性的不成比例。因此我们观察到的地区之间的不平衡度差异,很大一部分原因是由于女性活动量的减少。

同时,研究者还观察了男性和女性之间肥胖度和活动量的关系,下图展示了所有国家中所有个体的肥胖水平和每日平均步数之间的关系。对于男性和女性来说,每天走更多步数和更低的肥胖水平确实是相关的,但是对于女性来说,肥胖水平降低得更加显著。所以,爱美的小姐姐们,赶紧换上舒适的运动鞋,一起出去走走吧!

❂ 城市,让生活更美好

你是否会因为家附近没有公园适合饭后的散步而苦恼呢?你是否会因为道路的拥挤而心惊胆战呢?事实上,城市的建设与人群的活动同样有很大的关联,规划合理的城市才可以让居民的生活更加美好。

研究人员对美国69个城市的交通建设和规划进行评估,得到城市的“可走性(walkability)”,即是否在这些地方走得舒服。可走性好,该地区的环境和经济可以因此受益。影响可走性的因素有人行道的建设、交通道路状况、土地利用模式、建筑的合理性及各种安全因素等。

我们可以发现可走性越高的城市,活动不平衡度越低——这些高评分的城市中,早晚上下班高峰的活动量非常大,这也说明城市的环境与人群的活动有很大的关联性。如果城市的道路条件比较好,你可能会更愿意多走两步去赶公交车和地铁,穿梭于熙熙攘攘的人群中,体会世间百态,而不是开着自己的私家车,被堵在二环的高架上看着天空发呆。


作者:冯生

排版:夏梦馨

封面:来自网络

欢迎留言讨论哦~~

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存