查看原文
其他

【特别推荐】2015年,科学界的大数据!

2015-02-25 战略前沿技术

2015年有多少新博士毕业?全世界花在科研上的时间有多久?焦头烂额的科学家们要消耗多少杯咖啡?南极科考站的科学家们要吃掉多少块小饼干?为了对2015年科研领域中各类相关数据进行预测,《自然》杂志竭尽所能地搜集整理了海量的数据,力求获得最为准确的预测结果,得到了上面这张图。



2015年全球科研投入总金额:19 000亿美元(约合11.8万亿人民币)



此图的结论建立在美国国家科学基金会(US National Science Foundation, NSF)2014年2月的一份报告之上,该报告表明,全球范围对科技研究的总投入在1996年至2011年间呈现出了稳定的上升趋势。此外,为了进一步证实近年该上升势头未减,我们还参考了一所非盈利机构——巴特尔(Battelle)研究所2013年12月的一份报告。但与公开出版的报告一样,以上两份报告中的现值金额数据并未将通货膨胀率考虑在内。我们根据美国国家科学基金会报告中的数据,通过简单的线性拟合方法,预测出了2015年全球科研投入的总值。


2015年全球科研人员咖啡消费总量:10亿杯



此预测值由全球咖啡消耗总量与科学家占全球总人口的比例相乘而得。


根据美国农业部(US Department of Agriculture)预测,2014年6月至2015年6月之间,全球将消费14771万袋60克装的袋装咖啡粉。当然,咖啡杯的大小决定着总杯数,在此预测中,我们假设每杯咖啡含有7克咖啡粉。来自世界银行(World Bank)的数据表明,2010年科研人员所占全球总人口的比例为0.128%,根据2000年后科研人员逐渐增多的趋势,我们通过外推法得出2015年全球人口中从事科研工作的人员比例将升至0.138%。


由此,我们计算得出全球科研人员将喝掉17亿杯咖啡,每杯170.5毫升,总共约合2.9亿升,这正好相当于兴登堡号飞艇(Hindenburg airship)一半的体积。


但是,此项结论有两处值得推敲之处。第一,科研人员们通常比普通人消费的咖啡更多,至少在美国的情况是这样。根据咖啡连锁店Dunkin’ Donuts进行的一项调研表明,从事科学研究和实验研究的技术人员是最嗜爱咖啡的群体。


第二,各个国家饮用咖啡的科研人员比例也各不相同。根据世界银行的调查,2012年中国有140万名科研人员,而美国有125万名科研人员。尽管中国科研人员人数众多,但根据欧睿国际公司(Euromonitor)的报告,中国每年的人均咖啡饮用量仅为1杯(南加州大学洛杉矶分校中国学院的数据则指出,中国人均茶饮用量高达400杯/年)。然而,中国的科研人员往往集中在城市中——在那里,咖啡是一种较为常见的饮料。


将以上各个因素考虑在内,再加以适当的修正,我们最终为明年的咖啡消费量得出了一个较为保守的预测值——10亿杯。


2015年全球科研总时长:260亿小时,即290万年



根据2003年美国国家科学基金会一项针对博士学位获得者的调研表明,他们每周的平均工作时长为48.79小时。对此,很多科研人员或许会认为该数据偏低,可能确实如此。然而,该项调研的对象并非仅仅包括工作时长较长的教师和专业学者,同时还包括了在公司企业和政府部门工作的博士人员,他们拉低了整个群体的平均工作时长。


有一些原因可以解释为何该数据比人们的预期偏低。美国国家科学基金会的调研针对的是所有的博士学位持有者,不论他们是否正投身于科研事业。此外,该调研在计算工作时长时,仅仅考虑了博士人员们的主要工作,而他们从事兼职时的工作时长并未纳入计算。


而这仅仅只是开始,科研工作者每周的工作时长历来是令统计者头疼不已的数据。1942年,W. W. Charters的研究指出,教授、副教授和助理教授每周的平均工作时长分别为58小时、52小时和60小时以上。最近,美国博伊西州立大学(Boise State University)的一项调研表明,通过教授们自我监测所得出的每周平均工作时长为61小时。此外,2012年一项研究发现,多数研究人员从Springer出版社网站下载论文的时间往往在正常的工作时间之外。


通过将世界银行所预测的2015年全球科研人数比例与全球人口总数相乘后,我们推算出了2015年全球科研人员的总人数——1千万。


进而得出260亿小时,即290万年。这段时长相当于我们从非洲大陆上的南方古猿祖先(australopithecine ancestors)演化至今的总时长。


此外,该数据也意味着我们花在科研工作上的总时间,还远不及我们花在浏览Youtube视频网站上的时间(800万年)。


2015年博士学位授予人数:26万人



该数据由美国国家科学基金会过去五个版本(每两年更新)的科学和工程学指数报告(Science and Engineering Indicators)计算而得。然而,该报告数据较为滞后——2014年的报告所包含的数据仅更新至2010年。所以,我们只能通过最基本的线性拟合方法外推得出2015年的预测数据。


然而,这里也有一处很值得注意:因为国际数据来源无法将医学博士学位与生命健康博士学位区分开来,而医学博士学位更加偏向于一种专业或从业类学位,而并非科研类学位。所以,科学和工程学指数报告中并未将医药专业的博士学位获得者计算在内。


2015年论文发表总数:92万篇



此图源于美国国家科学基金会2014年科学和工程学指数报告的数据,通过线性拟合外推而得。


科学和工程学指数报告是以上几个来源中数据最为准确而一致的一项。尽管世界银行也有类似的数据,但是可能由于2009至2010年间该机构统计方法的改进,导致这两年内的论文发表数据大幅下降。(虽然该现象也有可能是缘于全球经济衰退,但科学和工程学指数报告中并未出现此下降。并且若真将其归因于经济衰退,在经济复苏后将会仅有2010年和2011年两个数据点,此时线性外推预测法的准确度将大打折扣)


论文撤回:470篇


首先,值得注意的是:目前并没有关于论文撤回的综合数据库。我们通过在科学引文索引数据库(Web of Science)中搜索“论文撤回”关键字,并统计出每一年的撤回论文数量,从而得出了该数据。《自然》(Nature)杂志记者理查德·范·诺登(Richard Van Noorden)在2011年的工作中也使用了类似的方法。


我们在对2015年进行预测时运用了线性拟合外推法,我们的数据从2003年开始,科学引文索引数据库也正是从2003年开始对撤稿进行索引。此外,由于数据不完整,我们将2014年的数据进行了整体排除。Lu等人的补充材料为我们统计繁杂的论文撤回数据提供了重要的参考作用(S. F. Lu, G. Zhe, B. Uzzi and B. Jones Sci. Rep. 3, 3146; 2013)。


2015年专利申请数:260万;专利授权数:120万。



此预测数据来源于世界知识产权组织(World Intellectual Property Organization, WPO)。


我们将自1985年以来的专利申请与授权数量进行了统计,利用二次方程拟合外推法得到了2015的预测值。


然而,自从该数据在2009年出现了略微下降(可能缘于经济衰退)之后,后几年的数据增长速度加快了。也有观点认为,专利法和商业条例的改变将对专利的申请数量起到了重要作用,因此应该只对2009年之后的数据进行拟合,从而获得一个更高的预测值。


2015年核苷酸碱基信息储存累积总量:150亿。



根据2014年12月15日基因银行(GenBank)的发布通知,我们将常规全基因组鸟枪数据库(whole-genome shotgun databases)和RNA转录酶鸟枪组装数据库(transcriptome shotgun assembly RNA database)中的信息数据累加起来,得到:


2011年12月: 374,986,040,984


2012年12月: 504,393,786,742


2013年12月: 712,994,853,060


2014年12月: 1,079,972,406,539


来自GenBank团队的马克·卡瓦诺(Mark Cavanaugh)推测,带动全年碱基信息储存量猛增的两大项目分别为:中国北京基因组研究所(Beijing Genome Institute)对近40种禽类进行的基因组测序项目,以及由美国麻省理工学院布罗德研究所(Broad Institute of MIT)、哈佛大学、马里兰大学巴尔的摩分校(University of Maryland in Baltimore)和克雷格·文特尔研究所传染病基因组中心(J. Craig Venter Institute Genomic Center for Infectious Diseases in Rockville, Maryland)共同合作进行的传染性疾病病原体基因测序项目。


2015年造访矮行星:2颗,谷神星(Ceres)和冥王星(Pluto)



两颗地外天体都将在2015年内迎接人类航天器的到访。美国国家航空航天局(NASA)的“黎明号”(Dawn)太空飞船将于三月份左右造访谷神星。而另一艘名为“新视野号”(New Horizons)的探测器将于7月14日与冥王星擦肩而过,如果燃料充足,它随后将朝着柯伊伯带天体(Kuiper Belt Object)继续进发。


2015年科研人员在南极科考站McMurdo吃掉的饼干



此数据来源于Twitter网站。


原文链接:http://www.nature.com/news/how-we-made-our-predictions-7.22674?article=1.16628



(来源:环球科学,作者:Mark Zastrow,制图:Chris Ryan,翻译: 林然 弥生,审校:丁家琦)


【战略前沿技术】2014全年文章目录已上线,回复“目录”即可查看,敬请关注!

2015年1月十篇精华文章(按阅读量排名)

请关注后【战略前沿技术】后,点击历史信息查看。

日期

标题

20150102

2015 年度国家自然科学基金申请政策有重大调整

20150110

2014年度国家科学技术奖获奖名单

20150109

中国科研经费分配新办法出炉 "863""973"退出历史舞台

20150114

“透明计算”,凭啥摘得自然科学一等奖?

20150115

科技改变未来:预言300年后的人类

20150131

科研:新常态下的新规则

20150131

国外高效毁伤技术发展及趋势

20150116

全球百强创新机构排行榜出炉 大陆仅华为上榜

20150104

高校病了:教学之殇

20150104

科学研究方面的一些问题


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存