【文献与探索】社会化媒体和网络:研究人员如何利用大数据分析
类别:社交网络
有关社会网络的研究成果,敬请关注!社会化媒体发帖充满了潜在数据挖掘和数据分析的可能。因为认识到这种潜在的可能性,网络平台的提供者逐渐增加对免费数据使用的限制。这些改变对为了更好地理解人际交流和提高人类境况的社会科学家和其他非营利研究者分析公共发帖提出了新的挑战。
对此,加拿大 University of Calgary学者 的 Mylynn Felt试着概述社会媒体数据分析的一些近来变化,尤其是聚焦Twitter的变化。该项研究已于2016年发表在 Big Data & Society 期刊上。(Social media and the social sciences: How researchers employ Big Data analytics, Big Data & Society,online first April: 1-15, 2016,DOI: 10.1177/2053951716645828)
一、 有关社交媒体的研究
通过利用The Sisters in Spirit Candlelight Vigil 的24小时时间段的数据(加拿大本土妇女联合会赞助),本文来比较抓取Twitter内容并能进行数据分析的三种免费的Twitter应用程序编程接口。尽管最近的Twitter数据管制限制了Twitter内容的免费获取,社会科学家仍然有许多动态选择去获取和分析Twitter以及其它社交媒体平台的数据。本文探求混合传统、定性的方法去抓取正在发展的数据淘金热的关键的社会化媒体数据分析法。
文章首先介绍了写作背景,随着社会化媒体在可搜索的个体组成的复杂网络中呈现多种观点和交互行为,许多社会科学家和政府以及公司都对其很有兴趣,许多学者甚至把这种情形称之为数据淘金热,由于在过去几年这种情况甚少出现,所以也有人说如今是大数据时代。虽然很多社会科学家对大数据很感兴趣,但他们并不具备获得这些数据的能力,面对这样的挑战,社会科学家仍然有许多工具去抓取和分析社会化媒体。所以本文主要讨论大数据分析工具可以提供很多东西给社会科学家。
通过对先前Twitter相关研究的综述,本部分首先是讲述了在2011年Twitter改变API结构给学术研究带来的一些变化,特别是数据获取前后难易变化带来的研究变化。然后又阐述了社会科学家特别偏好Twitter的原因。
二、关于API(应用程序编程接口)现状最近一些变化的确认
随着Twitter为了保护本公司的数据流而采取更严格的API,Twitter数据的获取变得困难,而购买数据又非常昂贵,个人研究者和小研究团体开始转向利用TwitterAPI的新工具来获取数据。
图1
三、Meta分析(即元分析)
通过对基于数据交流的社会化媒体的研究发现很少有学者使用大数据抓取和分析工具。图1表明关于Meta分析的文章很少使用例如API平台的工具去收集和分析社会媒体数据,使用传统分析方法和数据抓取、分析工具的混合方法的学者更是很少。图2表明了每篇文章研究用到的平台分布。本段主要得出了以下结论:大多数社会媒体研究都不使用数据分析。当研究者们使用数据分析时,Twitter是最常用的分析平台,免费API工具被使用最多。
图2
四、案例研究:三种Twitter API工具的比较
通过案例研究对三种免费工具(torify、Netlytic、DMI TCAT)的社会化媒体数据的抓取和分析结果进行比;之前的研究主要依赖研究工具特别是Twitter,但随着网络平台API政策实施,数据获取有了约束。对比了三种工具搜索同一案例的结果。
Storify:Storify能够获取超过一周时间的数据并且在10月5号到10月13号时间内收集到54条Tweets。Storify允许非营利组织免费使用数据。可到达的平台有
Facebook,,Google+,YouTube,Flickr,,Instagram,,Tumblr,Google和10
个其它平台。
Netlytic:适用于没有经验的数据分析师,支持Twitter, Facebook, Instagram, YouTube和使用者输入的数据集的分析。在10月5号的数据抓取中从1529个发帖中获得了2188条信息。图5展示了前10名此事件中Twitter使用者,图6展示了案例中频繁出现的前10个关键词。图3和图4是通过Netlytic收集的同样的Twitter数据当被Netlytic和Gephi分别表示时呈现出来的。
DMI TCAT:功能最丰富的免费Twitter分析工具。可获取的平台有Amazon, Pinterest,Google, Instagram, Facebook, Tumblr, Wikipedia, YouTube以及其它。
图5
图6
图3
图4
通过Meta分析(元分析)发现,在主要的社会媒体平台的研究中,许多社会科学家都没有使用数据抓取工具。所以本文不是为了呼吁数据分析代替传统的定性分析方法,而是认为数据分析应该成为传统方法的一种补充。
五、结论
总之,这些工具能使大数据方法从重要的宏观层面靠近研究者,比如对话群簇、有影响力的网络成员等。Meta分析重要是显露了在交流研究学者中低的数据分析使用。选择哪种工具进行社会化媒体分析取决于研究设计。同时,考虑到社交网络的复杂性,需要强调关键数据分析的必要性。
附参考文献:
Terry DM (2014) Critical Theory and the Digital. New York, NY: Bloomsbury Academic.
Bruns A and Highfield T (2013) Political networks onTwitter. Information, Communication & Society 16(5):667–691.
Driscoll K and Walker S (2014) Working within a black box:Transparency in the collection and production of big Twitter data. International Journal of Communication 8:1745–1764.
近期推送的相关文献:
社交媒体:“网域”和社会资本积累
社会网络分析混合方法:结合归纳概念开发、文本分析和二手数据的定量分析
粉丝文化的胁迫性赋权:中国网络文学的受委托性创作
在线社交网络使用及其对隐私设置使用、个人信息披露的影响
使用网络提升能力和网上娱乐对公民民主需求的特定影响
全文可直接下载:
原文链接(阅读原文 点击左下角):
欢迎您提出与本文内容、主题或翻译有关的各种问题与建议!
欢迎关注、订阅微信公众号【上理公共管理】。本公众号是由公共管理学科的老师和学生志愿者开发的学术和交流平台,重点是公共管理领域的热点问题,我们每日整理、翻译并推荐一篇最新权威英文文献。核心内容分为三大板块:1、公共政策文献与案例,2、公共管理教学与交流,3、公共治理反思与探索。
欢迎推荐或自荐研究成果,来稿请致邮箱:usstgggl@163.com
PS:如何加入微信公众号:
您可以扫描下面的二维码,或者搜索公众号:“上理公共管理”,或者加原始ID:
gh_dd2c06e61722 然后点击加入即可。
PS:如何查看以前推送的精彩文章:
您只要点标题下方的“上理公共管理”,并选择“查看历史消息”即可,精彩就会尽现。谢谢!