查看原文
其他

【论文梳理】大数据专题

点击标题下「MJC备考指南」关注我们


MJC备考咨询请微信添加好友:Miss_MJCMiss-MJC



童鞋们,你们千呼万唤的大数据专题来啦。今年这个专题依然是重中之重呢!快来取其精华吧。




大数据其实不是什么新词,之所以再拿出来是因为今年G20峰会提出“数字经济”,目前业内专家还是认为数字经济的关键在于数据挖掘加工,同时实现数字的融通开放。所以又把大数据拿出来,以防万一大家看一下。这个不用太详细,尤其是看过大数据时代那本书的同学,就可以不看啦!

 

顺便附上G20公报中关于数字经济的内容:

为释放数字经济潜力,我们在安塔利亚峰会工作的基础上,制定了《二十国集团数字经济发展与合作倡议》。我们将着眼于为发展数字经济和应对数字鸿沟创造更有利条件,包括更多更好和负担得起的网络准入、促进经济增长及信任和安全的信息流动,同时确保尊重隐私和个人数据保护、促进信息通信技术领域投资、支持创业和数字化转型、加强电子商务合作、提高数字包容性和支持中小微企业发展。为此,我们重申安塔利亚峰会公报第26段,承诺将为构建开放、安全的数字经济发展环境提供政策支持,并认识到充分、有效的知识产权保护和执法在发展数字经济方面的作用。我们欢迎经合组织、国际货币基金组织及其他国家和国际组织在数字经济测度方面所作的努力,认为需要进一步开展相关研究和交流。



1数据挖掘是什么



沈浩


数据挖掘就像挖恐怖分子,只要拉登敢打电话,美国一定会从海量的通话记录中把这个电话抽出来,卫星立刻跟踪,导弹直接就下来了,这就叫精确打击!数据挖掘就是精确打击。这个模式运用到商业领域,就是商业营销领域的精确制导,精确打击。企业完全可以依照抓拉登的方式精确打击每一个消费者,每个个体在大数据时代都能被捕捉到。


数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。进一步狭义的定义就是利用自动或半自动手段,采用统计技术和机器学习方法,从大型数据库中揭示海量数据中有意义的潜在规律和提取人们感兴趣的知识的处理过程。数据挖掘技术经历20多年的发展已经基本成熟,有着一套完整的方法论和挖掘软件工具,但是其狭义的定义和解决问题的工具方法并不容易被业界掌握和诠释。


在一定程度上说,大数据概念只是点燃了数据挖掘的社会意义和应用价值,今天的大数据是泛化了的数据挖掘。所以我们更愿意说这是一个大数据时代,但大数据所具有的特征和对社会的影响却是巨大而深远的,特别是在社会科学领域,大数据带来的变革和挑战是颠覆性的,显著特征就是人类社会的数据化生存。社会化媒体使得人们的社会生活,行为态度、交往过程、互动关系都被数据记录并保存下来,这对社会科学研究和预知社会产生革命性影响。




2谈谈大数据——Big Date时代的一点看法



沈浩


1.数据有多大——就是用现有的软件和在可容忍的时间内处理不了的数据就是大数据,一般说来就是:G级或T级数据;但我处理过2.6亿的数据,可以用时间换空间;大数据不仅仅是大,而是边分析边生产边应用;就像微博抓取“春晚”或您的微博,但分析过程中可能又有大量数据产生。


2.大数据与传统统计分析完全不同了,不强调抽样,强调关系不关心因果,解决是什么,不问为什么!特别是:公开易获得、非结构化、可分析个人,强调关系,解决的是人的数据和关系,特别是社会科学领域的数据(传统数据都是结构化的商业数据),所以大数据更关心对社会情绪、舆情、预测电影票房等,简单说:有了FB、TW或微博才有了大数据的兴奋点


3.大数据的兴奋落地就是数据挖掘、文本挖掘和网络挖掘,挖掘是发现知识,不是传统统计的实证研究,可能没有假设!不仅有统计分析还要机器学习算法等,当然也涉及数据存储的方式,由此提到Hadoop、MapReduce、NoSQL等IT技术的变革


4)有了微博,我们说社会科学的研究春天到了,移动应用、LBS、GIS、二维码等都包含信息数据,如果能够集中起来发现关系规则就形成了大数据时代;而且大数据更多分析个人(挖恐怖分析),欺诈、流失、VIP、异常等,与传统统计的平均不同,产生精准、个性化推荐、协同推荐等技术


5)我一般会说是大数据时代,或者就是社会网络微博时代,或者就是数据挖掘技术!只是人文社会人士的能力点燃了这个趋势,强调了商业趋势和社会趋势。


6)精准营销,个性化推荐,社会情感,社会预期,挖掘恐怖分子;当然可以用同样的技术解决传统数据问题,比如更强调可视化(信息可视化、数据可视化和互动可视化)等。





3“大数据”时代,新闻业面临震荡


彭兰


大数据技术在一定程度上将对现有的新闻生产的模式与机制产生影响,主要体现在以下四个方面:


一、大数据技术渗透到新闻生产的核心环节。在大数据及相关技术的影响下,过去只有受过专业训练的人才能承担的新闻报道工作,开始部分地转移到了计算机身上。大数据技术将全面渗透到新闻线索与选题的发现、新闻信息的采集和新闻要素的发现,新闻写作与新闻编辑等整个流程。大数据技术与社会化媒体的结合,是未来新闻生产的一种重要方式,它们将成为专业媒体的人工式新闻生产的一种重要补充。


二、大数据技术重树新闻质量标杆。对趋势的预测是大数据技术的价值所在。在大数据技术面前,无论是在反映全局性事实还是趋势性规律方面,媒体现有报道方式与报道成果的缺陷都日渐暴露。大数据技术既是参照物,又可以成为专业媒体未来的方法与工具,利用大数据技术,专业媒体的报道水准将得到有效的提升。如果媒体能广泛借助大数据技术来进行重大趋势的预测与分析,那么,它的预测的准确程度可能得到有效提升,对社会的影响力就能得到提升。


三、大数据技术进一步提升受众反馈的价值。对于媒体内容的受众反馈,在很多时候,也是以大规模数据的形式体现的。对于这些数据的挖掘,可以使受众的意见、态度得到更充分的呈现,也可以使得这些反馈的价值得到更好的发挥与利用。这将使媒体在反映与传达民意方面的功能进一步增强。


四、大数据技术拓展用户分析广度与深度。大数据技术基础上的用户分析,将不仅关注媒介行为习惯本身,还会关注用户的整体行为,并从中寻找影响他们内容消费行为的相关因素。同样,这样的研究不是强迫用户对他们的行为习惯以问卷的方式做出回答,而是对他们日常的自发行为本身进行分析,因此,能更真实地反映用户的需求、偏好以及行为模式。





但行好事

也问前程

   


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存