开办数据科学专业前,不妨先看下这些干货 | 数据科学人才培养专题(下篇)
在《数据之上的全球数据科学专业现状 | 数据科学人才培养专题(上篇)》中,一读君(edu_yidu)给大家分享了全球高校数据科学项目的开设情况,本期将分享数据科学领域人才的从业情况,希望能为高校管理者提供有价值的参考依据,便于他们设定该领域人才培养目标、设计人才培养方案和建设相关课程体系。
这是一读EDU推送的第153篇文章
全文3275字,预计阅读6分钟
社会如何评价?
社会需求评价是反映人才培养质量的重要维度,其中,薪酬水平是人才价值的重要体现,笔者主要以O’Reilly发布的数据科学领域人才薪资报告“2016 Data Science Salary Survey:Tools, Trends, What Pays (and What Doesn’t) for Data Professionals”为依据,展开论述。
报告显示,自2013年起,O’Reilly连续4年对数据科学领域的人才薪资水平开展调研。
从地域分布来看,接受调研人员分布在45个国家,其中美国的被调研者占到3/5,分别来自全美45个州;
从工作岗位来看,接受调研人员包括数据科学家、工程师和其他大数据领域从业者。
5成数据科学领域人才年薪高于$87K
据O’Reilly调研数据,全球数据科学领域人才的年薪中位数(median salary)为$87K,其中全美为$106K,欧洲(除英国和爱尔兰)为$50K,亚洲和非洲较低,分别约为$20K和$25K。
研究人员认为,中位数不足以表示薪资差异的程度大小,因此用四分位间距表示处于中间50%样本的薪水情况。从四分位间距上看,美国和英国/爱尔兰在该行业从业人才的年薪差异较大,据分析,这与这些国家数据科学应用相对成熟、职位细分程度较高有一定关系。
1成人才年薪至少翻一番
薪资涨幅是评价人才中长期发展后劲的重要指标,从调研结果来看,超过70%被调研者的年薪在近3年有所增加,其中半数以上被调研者有超过20%的年薪增长,12%被调研者的年薪至少翻了一番。
图1 世界各地数据科学领域人才的薪资涨幅情况
超一半人才就职于1000人以上规模企业
从数据科学领域从业人员所在用人单位的规模来看,多数人从业于规模较大的企业,其中有28%的人才从业于万人以上规模的大型企业。这也从侧面说明了大型企业对数据科学领域人才的需求较高。
从薪资水平上看,就业于万人以上的大型企业的人才整体收入较好,年薪中位数约为$100K。
这也要求高校在做学生职业规划工作时,需做好就业竞争情况的分析,帮助学生了解行业的人才供需情况,为学生职业选择做有针对性的指导。
咨询行业吸纳数据科学领域人数最多
数据科学的发展支撑了众多行业的发展。数据科学领域人才在各行业的分布情况也从侧面反映了各行业对该领域人才的需求情况。
据调研数据,数据科学领域人才分布在17个主要行业,其中在咨询行业的从业人数最多,占被调研者的15%,其次为软件服务行业,为14%。
数据科学在教育领域的应用还处在发展初期,因此,在教育领域从业的数据科学人才只有6%。
高校在统筹数据科学项目开设工作时,可结合行业需求特点和自身师资特点,优化项目的学科资源配置,发挥学校优势学科的作用,培养既能突出学科特色又满足社会需求的人才。
图2 数据科学领域人才的行业分布
数据科学领域从业者主要工作是什么?
对数据科学实际应用场景的分析可以让高校更好了解社会对数据科学领域人才的具体需求,帮助学校明确数据科学相关项目的人才职业发展路径。
综合看来,数据科学领域从业者的主要工作包括:完成基本的探索式数据分析、支持研究中的数据分析、与业务决策者讨论分析结果、数据清理和数据可视化分析等。
图3数据科学领域人才的工作任务分布
数据科学领域从业者对不同工具的使用情况可以间接表明企业对掌握相应工具的人才需求情况,进而可以为高校数据科学项目的课程设置提供参考。
具体而言,高校需明确人才培养中学生需掌握的普适性工具,和某些细分领域所需要的特殊工具,再根据自身的培养特色开设满足社会需求的课程。
最受欢迎编程语言是SQL
在17种数据科学领域常用编程语言中, SQL的使用人群占比最高,为70%,其次是R和Python,比例分别为57%和54%。而GO、Octave和Ruby的使用人群比例较低,分别为1%、2%和3%。
因此,SQL、R和Python可被认为是企业所需的普适性工具。高校在设计课程时,可将它们作为必修内容的备选。
从使用不同语言的从业人员薪资水平来看,使用Scale和Perl语言的年薪中位数最高,约为$110K,但人数比例并不高(Scale:8%;Perl:5%)。
因此,可推断这两种语言属于某些细分领域所需要的特殊工具,在实际工作场景中还处在供不应求的状态。为某些细分领域输送人才的数据科学项目,可考虑训练学生使用这两种语言。
最常用关系数据库管理系统是MySQL
在被调研的14个关系数据库管理系统中,MySQL的应用比例最高,为37%,其次是Microsoft SQL Sever,为33%,而Oracle Exascale、Redshift 和Sap Hana的应用比例最低,均仅为1%。
从使用各类数据库管理系统人才的薪资水平来看,使用Oracle Exascale的从业人员是年薪最高的,有半数年薪在$150K以上,其次是使用 Redshift的,半数年薪约为$114K。
因此,高校可将Mysql和Microsoft SQL Sever作为用于数据架构师和数据库管理员类人才培养的基础内容,将Oracle Exascale和Redshift作为针对高阶人才的培养内容。
最常用的大数据平台是Spark
数据科学领域从业人员对大数据平台的使用较为分散。据调研,共有18个常用的大数据平台涉足其中,其中使用Spark(21%)和Hive(20%)的人群比例较高。
同行如何评价?
同行评价也是社会认可人才培养质量的重要途径。通常情况下,认证被认为是行之有效的同行评价手段,也是高校制定人才培养标准的重要参考。
通过设立行业的人才标准,对通过不同途径获得同等能力的人才进行统一的评估和认证,在诸多行业内都广泛存在,数据科学领域也概莫能外,计算机专业认证协会 (the Institute for Certification of Computing Professionals,ICCP)在其中更有举足轻重的地位。
数据科学专业人士认证主要分为数据相关专业人士认证、商业智能专业人士认证、大数据专业人士认证、数据科学家认证和数据治理专业认证等5大类。
各类认证的过程基本相似,但在认证标准上存在差异,主要体现在考试科目的不同。
总体而言,多数认证将信息系统核心考试作为必考科目。对高校而言,这个核心考试的具体内容也可称为数据科学项目课程设置的重要参考。
信息系统核心考试由6大模块组成:
❶ 信息系统。主要考查信息系统在企业中的角色、商业驱动因素、信息系统架构、信息技术资源获取以及信息系统技术组件和系统类型的相关知识。
❷ 数据和信息管理。主要考查使用概念数据建模技术中关于数据和信息管理的核心概念,以及基本数据库管理、数据质量和数据安全相关的核心概念。
❸ 企业架构。主要考查企业IT解决方案的设计、选择、实施和管理。
❹ IT基础设施。主要考查关于IT基础设施建设的解决方案的作用。
❺ 项目管理。主要考查如何系统地启动、规划、执行、控制和关闭项目。
❻ 业务流程管理。主要考查如何系统地对企业进行分析诊断,并如何根据需求提供解决方案。
图表数据来源:https://www.iccp.org/data-professionals.html
综合看来,数据科学专业人士的认证分为4个等级,等级越高,认证要求也越高。
以数据治理专业认证(DGP)为例,证书分为从业人士(Practitioner)和专家人士(Mastery)两级。专业人士ICCP的三项考试需均在70分或以上。
图表数据来源:http://www.dama.org.cn/drupal620/zh-hans/node/55
结语
马云在第五届阿里巴巴技术论坛上提出,全球正在加速从IT(Information Technology)时代迈向DT(Data Technology)时代。数据正从沉睡中苏醒,并开始流淌起来,成为新的基础能源。而数据科学的学科建设、人才培养刚刚起步,尚未形成完整教育体系,难以满足社会对数据科学领域人才的迫切需求,无法持续培养和输送不同层次人才。
面对这种现状,笔者认为,有必要加快对数据科学学科特征的研究,加快学科建设,制定并完善人才培养体系,提升高校人才输出的能力。
具体而言:
■ 高校需对数据科学领域从业人员的就业现状和同行水平进行深入研究,对标自身的人才培养定位,有针对性地为社会输出高质量人才。
■ 高校也需对数据科学的应用场景进行深入研究,了解数据科学在应用中的行业特色、行业需求等,结合自身的学科优势,优化数据科学项目的学科资源配置。
■ 在课程层面,高校还需以社会需求为依据,建设课程体系,满足企业对掌握不同工具人才的需求。
Reference:
世界主要国家的大数据战略和行动。中国信息安全,2016.
Big data: the next frontier for innovation,competition and productivity. The McKinsey Global Institute, 2011.
计算机专业认证协会官网,https://www.iccp.org/business-professionals.html。
DAMA中国官网,http://www.dama.org.cn/drupal620/zh-hans/node
2016 Data Science Salary Survey:Tools, Trends, What Pays (and What Doesn’t) for Data Professionals,O’Reilly,2016.
朱扬勇,熊贇。大数据时代的数据科学家培养[J].大数据,2016(35)
本期作者
北京研究分站 王成敏
一读EDU编辑部
* 除特别注明外,本文图表数据来源均为2016 Data Science Salary Survey:Tools, Trends, What Pays (and What Doesn’t) for Data Professionals,O’Reilly。
点击以下关键词,阅读精选文章:
扫描下方二维码,第一时间接收最新专题!