在自然科学领域已经广泛应用大数据、分布式计算等方式提高研究质量的今天,社会科学领域涉及到的核心数据仍然被少数机构所拥有并创造着巨大的价值。而与此同时,数据隐私、制度规范等问题也纷至沓来。社会计算(social computing)概念于1994年被首次提出,社会科学与计算机科学的交融既是长期的学术热点,也深刻地影响着社会发展。2009年2月6日,15名来自社会科学、计算机科学和物理学的重要学者联名在Science发表文章,计算社会科学(computational social science)被推上前台。
一场信息革命,一次技术飞跃,一门新兴学科诞生,2009年2月6日,是计算社会科学界值得纪念的日子。15名来自社会科学、计算机科学和物理学的重要科学家联名在Science上发表该篇文章《Computer Social Science》,宣告计算社会科学的诞生。 21世纪,我们生活在网络之中,脸书、微信、电话和邮件一秒钟沟通起了你我他,一封封往来的信件在互联网中留下印记;信用卡、公交卡记录了你我的地域轨迹和消费支出;在车头我们安装摄像机记录行车状况,而政府在公共场所各处装上监控记录犯罪证据。我们虽生活在真实的生活当中,但却在虚拟的世界留下种种数字印记,这些印记改变了我们的生活,改变了我们对社会的理解,改变了科学研究的进程。搜集和分析大数据的能力已经彻底改变了自然科学,比如生物学和物理学。然而,数据驱动的计算社会科学发展却极为缓慢,在经济学、社会学以及政治学的重要期刊上都很少有计算社会科学的相关文章。但不容忽视的是,在一些知名的互联网公司Google、Yahoo和政府部门比如美国安全局中,正在开展计算社会科学的研究。 计算社会科学也许会仅仅集中在私人公司和政府部门内部。又或者,某些拥有特权的学术研究者将使用这些独一无二的“秘密”数据,从而发表无法被别人评价和复制的论文。从长远来看,以上这两种情况都不利于知识的积累、验证与传播。让我们试想,如果在一个开放的学术环境下,计算社会科学将会如何增强我们对个人和集体行为的理解?
[1] D. Roy et al., “The Human Speech Project,” Proceedings of the 28th Annual Conference of Cognitive Science Society, Vancouver, BC, Canada, 26 to 29 July 2009. [2] J. P. Eckmann et al. Proc. Natl. Acad. Sci. U.S.A. 101, 14333 (2004).[3] S. Aral, M. Van Alstyne, “Network Structure & Information Advantage,” Proceedings of the Academy of Management Conference, Philadelphia, PA, 3 to 8 August 2007.[4] J.-P. Onnela et al., Proc. Natl. Acad. Sci. U.S.A. 104,7332 (2007).[5] T. Jebara, Y. Song, K. Thadani, “Spectral Clustering and Embedding with Hidden Markov Models,” Poceedings of the European Conference on Machine Learning, Philadelphia, PA, 3 to 6 December 2007.[6] M. C. González et al., Nature 453, 779 (2008).[7] D. Watts, Nature 445, 489 (2007).[8] L. Adamic, N. Glance, in Proceedings of the 3rd International Workshop on Link Discovery (LINKDD 2005), pp.36–43;http://doi.acm.org/10.1145/1134271.1134277.[9] J. Teevan, ACM Trans. Inform. Syst. 26, 1 (2008).[10] W. S. Bainbridge, Science 317, 472 (2007).[11] K. Lewis et al., Social Networks 30, 330 (2008).[12] C. Cardie, J. Wilkerson, J. Inf. Technol. Polit. 5, 1 (2008).[13] M. Barbarao, T. Zeller Jr., “A face is exposed for AOL searcher No. 4417749,” New York Times, 9 August 2006, p. A1.[14] National Research Council, Putting People on the Map: Protecting Confidentiality with Linked Social-Spatial Data, M. P. Gutmann, P. Stern, Eds. (National Academy Press, Washington, DC, 2007).[15] J. Felch. “DNA databases blocked from the public,” Los Angeles Times, 29 August 2008, p. A31.[16] N. Homer, S. Szelinger, M. Redman, D. Duggan, W. Tembe, PLoS Genet. 4, e1000167 (2008).[17] M.V.A. has applied for a patent on an algorithm for protecting privacy of communication content.