查看原文
其他

《大数据的2016,我的2016》之误区篇

2017-02-28 jean 数据猿

数据猿导读
 

本篇《大数据系列》文章是数据猿推出的主题为《大数据的2016,我的2016》2016—2017年度大型策划活动的征文部分。为了方便大家更系统的阅读,小编对这36篇文章进行了分类,本文是《大数据的2016,我的2016》之误区篇。


本文长度为1700字,建议阅读3分钟


本篇《大数据系列》文章是数据猿推出的主题为《大数据的2016,我的2016》2016—2017年度大型策划活动的征文部分。在2016年底征稿期,活动就受到了100+大数据领域内知名企业的高度关注,收到了36位业内领袖的投稿,并入驻成为数据猿专栏专家。


为了方便大家更系统的阅读,小编对这36篇文章进行了分类,本文是《大数据的2016,我的2016》之误区篇!


在2月16日的落地活动部分,数据猿联合中欧国际工商学院以及腾讯直播举办了“中欧微论坛|数据猿·超声波——以数据思维 拥抱智能时代”活动,点击底部“阅读原文”看直播。



一、博雅大数据学院院长欧高炎:大数据≠Hadoop,大数据人才的培养要避免出现偏差

                                             


2016年,教育部新增本科专业数据科学与大数据技术、大数据技术与应用两个专业。这两个专业将重点培养具有多学科交叉能力的大数据人才和具有大数据实践能力的人才。


虽然教育部已经新增了两个大数据相关的专业,各大高校纷纷成立大数据研究中心或大数据学院,但大数据学科的发展依然是比较落后的,不仅是观念上的落后,还包括培养体系上的落后。


另外,将大数据等同于Hadoop的这种错误观念也导致大数据人才培养上也出现了一些偏差。不少培训机构甚至高校都将Hadoop及其相关的数据管理和存储层次的工具作为其大数据培训课程的核心。


其实,我们更重要也更薄弱的是数据分析能力,数据清洗、数据分析和应用等方面应该成为大数据人才培养的核心,应该受到高校和培训机构的更多重视和布局。


原文链接:博雅大数据学院院长欧高炎:人才是大数据产业生存和发展的命脉


二、博晓通创始人&CEO张宇:对于大数据的理解,目前仍存在4个误区



大数据作为技术热点和转型升级的支撑工具,不管是个人、企业和政府都很期待。但2016年在解决用户实际问题的过程中,对大数据的理解上存在一些误区:


1、大数据分析是自动化的一键式服务


大数据不仅数量大,种类也复杂,需要进行交叉分析。另外,从数据准备、数据收集、数据清洗、数据加工以及数据专题分析和结果可视化,数据解读到决策调整会分出很多层次。在这个过程中,需要人工的参与才能更好的实现价值。


2、某种大数据是企业问题的万能灵药


没有万能的数据,适合指定应用场景的数据就是好数据。另外,由于隐私保护和政府不公开的限制,企业使用的数据会受到限制,因此,我们必须为不同应用场景选择合适的数据源和分析模型。


3、大数据分析时代,分析师最重要


未来大数据分析的能力要开放给基层员工,不能只局限在分析师和领导层使用,实际业务中的人才是决策的主体。


4、大数据分析,模型越复杂越好


实现复杂模型(比如LVM潜变量模型)、模型学习算法会非常酷,但我们的工作关注点要放在提高工作效率、增加收益或者减少支出等实际问题的提出和拆解上,尽可能从简单模型先开始实践,并尽可能用自动化的工具来加快探索的速度。


原文链接:博晓通创始人&CEO 张宇:对于大数据的理解,目前仍存在4个误区


三、DataMesh CEO李劼:川普美国大选获胜,是大数据输了吗?



2016年底,闹得沸沸扬扬的美国大选最终以希拉里的完败收局。很多人,在这之前都认为希拉里已经赢定了,在各种预言帝使用各种模型所做的大数据分析预测中,川普都没有任何胜算,结果剧情反转太快,希拉里输的一塌糊涂。


希拉里数据团队的副CTO曾用50个后端服务,20个前端应用,237个Git Repo,15TB的数据以及大量数据科学家、分析师,大量AB测试提升捐款额,大量数据驱动的体验改进推进用户投票,提高希拉里的投票率。而川普团队只用了五百万公开雇佣一家英国数据分析公司,对选民进行精准投放,动员更多的川普支持者去投票。


我们不禁思考,是大数据预测的不准吗?其实不然,从结果看问题的话,发现各位预言帝的数据集已经失真了,他们所使用的是各类民意抽样调查结果,总结起来三种人会导致数据失真,而数据失真可能会让你预测分析的结果变得毫无意义:


1、民调不会去调查的人


2、有意识或无意识说谎,或是到最后阶段变卦的人


3、号称支持某人却没有投票的人


所以,用好大数据,最重要的是理解你要解决什么问题,在正确的时间用正确的手段解决正确的问题,而不是看你现有的数据能画出什么曲线,更不是把简单问题复杂化。把现有数据所表达的(伪)现象和要解决的问题强行捆绑,最后的结果就是自欺欺人。


原文链接:DataMesh CEO李劼:美国总统大选,大数据究竟是赢了还是输了?


 活 动 预 告 

(点击图片查看详情)



本文编辑jean,微信15737954328


推荐阅读:


360大数据中心傅志华 | DataMesh李劼

网智天元莫倩 | 易日升金融史建伟 | 六禾创投杜挺 

中关村大数据交易产业联盟张涵诚 | 博晓通张宇

中堃数据魏清 | 星环科技孙元浩 | AdMaster洪倍

友盟+李丹枫 | 华院分析唐岳岚 | 天云大数据雷涛

慧辰资讯马亮 | 中科院方向东博士 | 勤智数码廖昕

微瑞思创周像金 | 艾媒咨询张毅 | 神策数据桑文锋

薪人薪事联合吕恒 | GrowingIO张溪梦 | 易观郭炜

普丘信息系统陈涛 | TalkingData鲍忠铁



戳原文,看直播!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存