查看原文
其他

月薪最低5000元、最高40000元,谁才是2018年医疗大数据最佳雇主?

2018-04-08 郝雪阳 动脉网

金三银四,3月是每年的跳槽旺季。这一现象,在医疗行业也不例外。

 

智联招聘发布的春季白领跳槽指数调研报告显示,进入3月跳槽季,春季迎来跳槽高峰季,近八成白领在积极行动,其中90后跳槽比例最高。


为了弄清楚2018年医疗行业大数据人才的动向,动脉网搜集了1月到3月BOSS直聘和丁香人才上的招聘数据(文末附详细表格)。

 

从这些数据中,我们得出了下面几个比较有意思的结论:

 

一、医疗行业大数据人才招聘指南

 

1、研发架构和数据分析类人才最抢手



在调查中,医疗企业对于研发架构类(如:大数据开发工程师、系统架构师等)人才和数据分析类人才(如:数据分析师、数据挖掘工程师)的需求较强烈,其次是产品运营类人才。由此可见,医疗大数据高技术型人才缺口较为明显。


2、研发架构类人才最值钱


 

从平均薪资上看,研发架构类人才的薪资最高,约为2万元/月。数据分析类人才较为接近,约为1.9万元/月。产品运营类人才待遇要明显低于这两类,只有1.6万元/月。


3、迈向小康,全国中高收入人群



对薪资进行分层后,我们发现1万元/月到2万元/月是目前医疗大数据人才的主要薪资区间。其次是2万元/月到4万元/月。


从智联招聘2017年冬季的平均薪酬表中可以看出,全国主要城市的平均薪酬约为8000元/月。2万元/月,基本可以算中高收入人群。


 

4、Hadoop技术,依然是医疗大数据职业的敲门砖



在公布信息的企业中,有80%的医疗大数据职位对于技术的需求在5个及以上。有多达15家企业的大数据岗位都对Hadoop这一分布式系统基础架构做了要求。


显然,经过多年的发展,Hadoop这项技术仍然可以称得上是目前医疗大数据公司 36 41471 36 14939 0 0 3484 0 0:00:11 0:00:04 0:00:07 3484的敲门砖。

 

Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。最初由雅虎的Doug Cutting创建。


Hadoop的灵感来自于 MapReduce ,MapReduce是谷歌在2000年代初期开发的用于网页索引的用户定义函数。它被设计用来处理分布在多个并行节点的PB级和EB级数据。

 

现阶段,不少公司都推出了各自版本的Hadoop,有一些公司则围绕Hadoop开发产品。在Hadoop生态系统中,规模最大、知名度最高的公司便是Cloudera。

 

Hadoop在医疗行业的适用性很广。例如Cloudera与西奈山医学院合作开发的生物数据分析方法和系统。Cloudera与FDA合作,利用Hadoop侦测多种药物组合的副作用,包括与埃默里大学合作,帮助病历学家更准确地分析医疗影像。


此外,英特尔和NextBio还合作使用Hadoop处理基因数据。

 

在生物医学与健康研究中,Hadoop是可靠、高效、可伸缩的分布式处理软件框架。Map Reduce则是一种可以用来并行处理大数据的编程模型,同一程序在Hadoop的框架下可以用各种不同语言(Java,Ruby,Python等)按Map Reduce的编程模型进行编写和运行。

 

如今,Hadoop仍然是目前医疗行业采用最多、最火爆的大数据技术。

 

5、北京,一个大数据人才“非来不可”的城市


 

北京作为国内创业公司和资本聚集的核心城市,毫无悬念地成为了大数据人才中心,有多达17个职位都在北京。这里拥有嘉和美康、零氪科技、医渡云、华数康、康夫子等国内顶尖的医疗大数据公司。无论你是否愿意,医疗大数据的择业首选依然是北京。


6、学历是其次,专业决定你的位置



总体而言,医疗大数据的学历需求并不算高,本科基本上就是行业门槛。而相比之下,专业的需求对于人才而言权重更高。计算机专业的人才一般是大数据研发类工作的主要招聘对象,而统计学、数学相关专业的人才,则更多是数据分析或处理相关职位的招聘首选。

 

在需求上,计算机专业需求量最高,统计学和数学专业需求量同样较高。如此看来,逻辑思维能力和数据敏感性,直接决定着医疗大数据人才的职业天花板。

 

7、门槛最高的雇主


在这32家招聘单位中,华西生物医学大数据中心、华数康、途欢科技、微医集团、零氪科技对于技能的要求最高,都在7项及以上。其中途欢科技的大数据研发工程师的招聘信息中提到的专业技术更是多达23种,可谓“专家终结者”。


以下为途欢科技大数据研发工程师职位要求:


1、3年以上大数据平台/产品实际开发代码经验;

2、扎实的Java开发经验,熟悉Python或Scala, 熟悉Hadoop构架体系中各组件(ZooKeeper, HDFS, Hbase, Hive, Pig等)以及Map Reduce过程进行数据统计挖掘;

3、熟练在NoSQL DB以及相关框架工具进行开发, 测试, 产品功能部署, 包括:Hbase, Hive, Pig, Kafka等;

4、熟悉NoSQL技术原理, 结合关系型数据库程序设计体系来开展大数据产品实践. (Redis/Memcached/MongoDB/Hadoop(HDFS/Hbase)等;

5、掌握数据平台RESTFUL API接口交互设计;

6、熟悉linux环境,熟悉linux shell命令, 熟练使用Linux进行程序开发,调试;

7、熟悉MySQL、PostgreSQL数据库表设计;

8、熟悉分布式计算框架 - Yarn, Cassandra, Strom, Spark等;了解分布式服务、集群式服务开发相关技术;

9、具备良好的分析解决能力,能独立承担系统的开发工作;


8、最“良心”的雇主


如果设定薪资下限为2万元/月,那么康夫子、康瑞德、同仁堂健康、微医集团、医渡云和芯联达就成为了本次调查的优秀雇主。


其中,薪资上限最高的企业为同仁堂健康和芯联达,它们都为招聘职位开出了(3万元/月到5万元/月)区间的高薪,可谓本季度医疗大数据最“良心”雇主。

 

二、四问企业HR,为啥大数据人才抢手?


2016年,《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》中提到:要加强健康医疗信息化复合型人才队伍建设。随着国家政策的支持,越来越多的医疗机构和企业开始投身医疗大数据的建设队伍中。但人才的供应不足,一直是行业痛点。


大数据是一个系统性的工程,需要一系列专业技能来保证数据分析的成效,包括:处理、整合、分析复杂的数据,并能帮助客户充分了解数据分析的结果。


要做到这些,需要人才具有多方面的专业技能及特质,包括:计算机科学/数据开发的专业技能、分析和建模能力、 创新思考能力、交流能力等。


作为企业而言,很难找到一个人才具有以上所有技能因此更多采用,所以团队协作是目前最常见的形式。


那么,企业对于人才的筛选,究竟是秉承了怎样的一套原则,人才供需失衡背后的原因是什么?带着这一系列问题,动脉网采访了几家知名企业的人力资源相关负责人:

 

问题一:现阶段,医疗大数据相关的工程师(分析师)是否好招?


数联易康相关负责人


不好招!一是市场供需失衡。大数据、人工智能产业的爆发式增长,导致高校的人才培育和输出跟不上暴涨的市场人才需求。


参考领英《2017全球AI领域人才报告》,过去三年在全球范围内通过领英平台发布的人工智能职位数量从2014年接近5万个到2016年超过44万个。


截止2017年第一季度,全球范围内人工智能专业人才有195万,其中美国相关人才总数超过85万,高居榜首,中国人工智能领域专业技术人才总数超过5万人,居全球第七。

 

二是缺少综合性跨界人才。随着大数据、人工智能与传统行业的融合,增加了对综合性跨界人才的需求。但是医疗行业的专业性导致人才培育成本较高,现阶段医疗大数据领域的人才招聘面临“懂算法不懂医疗”、“懂医疗不懂算法的情况”,对医疗和大数据领域均有了解的综合性跨界人才较少。

 

三是人才争夺激烈。国内的大数据、人工智能技术人才主要来源于海外精英人才回归和高校及研究所的人才输出,最终集中流向以华为、百度、腾讯、阿里巴巴为代表的本土科技巨头手中。


普通的初创企业在这场人才抢夺大战中并不占据优势;另外,行业间的人才竞争也很激烈,比如医疗大数据企业在与金融大数据企业的人才争夺中不占优势;地域间的人才竞争,大数据、人工智能技术人才主要集中在北上深广。

 

华数康相关负责人


不好招。首先,“好“的数据分析师各个公司的定义和业务需求有本质上的区别。有的公司经过长期的发展沉淀,产品清洗,需求明确。


对数据分析师的只要求具体扎实的理论基础和技术体系即可,这部分人才主要集中在外资的数据、咨询公司和一些MNC,如IMS、麦肯锡、尼尔森及MNC的SFE,Marketing research等部门。

 

但这部分人才经过长期的驯化和洗礼,绝大多数已经习惯了外企”固定思维模式“的工作状态。而对于初创公司来说,很多业务方向不是特别明确,会要求数据分析师具有非常强的业务敏感度,而不仅仅是会多少”模型“。


综合以上因素,技术好的,很多习惯了稳定的工作,离职率低;懂业务的,技术方面又往往不过关,非常尴尬。


医渡云相关负责人


现阶段医疗大数据还属于比较新的领域,大数据和医疗又是两个不同的领域,所以专业的复合型人才相对比较少,这是整个行业的挑战。


医疗数据科学是一个交叉学科,主要包含计算机科学、数学统计学和医学,当然医学本身又是一个复杂的大学科,从目前的高校专业设置,几乎不存在同时具备这些专业的复合人才,所以依赖直接招聘的成熟背景的人才不现实。


对于企业来说,更有效的方式是设计有效的组织架构、专业人才的协同合作模式和开放学习的平台模式。同时对学习能力强的人才在工作中培养其交叉迁移的能力,这些复合人才会成为企业最核心的竞争力。


同时,人才是具有虹吸效应的,当形成一定的人才规模和品牌时,招聘的难度就会降低很多。


问题二:好的工程师(分析师)和普通的主要区别在哪儿?


数联易康相关负责人


优秀的工程师(分析师)应该是综合性复合型人才,纵向熟知大数据、人工智能的理论、方法、技术、产品与应用等,横向了解大数据、人工智能与经济、社会、管理、标准、法律等领域的跨界融合。


华数康相关负责人


数据分析师的入门的门槛相对较高,且个人综合素质要求非常非常高,不仅要求非常高的职业素养,还要求有非常严谨的态度、清晰的逻辑思维,有好奇心和创新意识,整体来看是一个“平衡的矛盾体“。


医渡云相关负责人


好的工程师或分析师和普通人之间既有差异又有共性,共性多于差异,在专业能力和相关工作所需要的潜力方面,专业人才可能更加专注和聚焦一些。


当然,部分专业人才也可能会在其他特征比如团队合作或文化融入等方面稍有欠缺,这就需要人力资源部们对专业人才有更多的支持和培训。当然,公司文化在这方面也需要有所考虑。


问题三:什么原因造成了大数据人才的供需失衡?


医渡云相关负责人


人才供需失衡的主要原因自然是市场竞争比较激烈。这是一个新的交叉学科,成熟人才的整体规模还比较小,需要时间去逐渐在发展中平衡,跟着行业的发展去历练和培养。


即使在计算机、统计学、医学单专业领域内的优秀人才,也是很多不同行业的企业在竞争,人才远远供小于求。


长期来看,既需要行业的自己培养,同时也需要在教育学科上鼓励更多的交叉学科建设,最近,教育部在医学数据智能方面已有一定的学科规划。


华数康相关负责人


目前企业已经逐渐由以往的为了迎合大数据发展趋势,为了招聘而招聘,招过来其实干嘛也不知道的状态逐渐转变为根据实际业务驱动需求。


以往的一些半吊子数据分析师已经无法适应,整个数据分析师的行业也由“分析师“转到”科学家“,门槛越来越高。门槛高,薪资待遇要求必然上涨。


数联易康相关负责人


行业生态不成熟,产学研脱节,高校的培养与市场需求存在断层。当前国内大部分高校还没有建立大数据、人工智能人才培育体系,相关专业学科有待完善,急需加强人才储备和梯队建设。


问题四:企业能否留住这类人才的关键是什么?


华数康相关负责人


抛开薪资不谈,目前企业(特指初期发展企业)想要留住真正的数据分析人才,需要提升一部分业务部门的数据意识,了解一些基本的统计分析基础理论,不要求专业,最起码能做到与数据分析师在业务层面能进行顺畅的沟通。


这样才能有效引导数据分析师了解正确的业务方向,激发分析师的业务兴趣,对整条业务产品线的开发和延伸。切记不要让一个数据分析师感觉不到方向,没有产出物,产生挫败感。


医渡云相关负责人


对于专业人才,我们不仅要考虑薪酬因素,还要提供优良的工作环境和各种福利,以及给专业人才提供一个有竞争力的职业发展平台,和最优秀的人才一起做最有意义最有挑战的事情。


当然,还有很重要的一点就是要有能够吸引人才的公司文化,和专业成熟的培训机制,以及能够调动专业人才积极性的团队氛围。 


数联易康相关负责人


关键是企业的发展前景和人性化管理。


三、医疗大数据分析,究竟要分析哪些数据?


医疗大数据,数据才是核心。大数据人才究竟分析的是哪些数据?关于这一问题,我们从招聘信息中提取了一些信息:

 

1、负责医疗卫生数据的分析挖掘,支撑临床、医院管理、卫生经济与政策方面研究;负责完成数据集市构建与特征提取,通过统计分析、机器学习算法等完成模型构建。(华西生物医学大数据中心:数据科学家/生物统计学家)

 

2、承担生物信息大数据的分析工作;负责对全基因组、全外显子组、转录组、表观遗传组数据进行生物统计分析,挖掘数据背后的意义。(中山大学附属第五医院:数据分析统计人员)

 

3、根据项目需求,撰写统计分析计划书,独立完成各类型的临床研究的统计分析工作。(森亿智能:临床数据分析师)

 

4、负责社保行业数据应用及服务需求调研、分析挖掘及模型建构,输出分析报告;研究各地人社部门数据应用需求,规划、推进公司社保大数据应用与服务平台的建设及后期运营。(华数康:数据分析师)

 

5、挖掘临床手术、电子病历、急诊等各种医疗大数据的价值,以图表、演示文档、书面报告等形式持续输出最新的关键趋势;参与医生、护士、患者行为研究,手术过程环节时间预测等专项分析项目,撰写统计分析报告。(康瑞德:大数据分析师)

 

由以上信息可见,现阶段医疗大数据行业分析数据主要为4类:公共卫生数据、基因组数据、临床诊疗数据、社保数据。

 

四、大数据分析背后的原因


既然公共卫生数据、基因组数据、临床诊疗数据、社保数据这4类数据占主流,那么它背后的原因是什么?


1、公共卫生数据分析


《柳叶刀》有文章指出,目前在中国推动循证公共卫生政策遇到的最大障碍是研究者和政策制定者之间认识上的差异。

 

将个人数据集加入大数据能为循证医学提供最坚实的证据,能发现小样本无法发现的细微差别,为公共卫生决策者提供最新证据,指导卫生政策的制定或临床实践。

 

例如,某研究者将饮用咖啡的生活习惯对前列腺癌的影响进行了剂量反应关系的Meta分析,结果表明:每天多饮2杯咖啡者患前列腺癌的风险降低了2.5%。

 

除此之外,对公共卫生数据挖掘的结果进行解读所形成的结果,能够促进流行病学研究的效率,帮助公共卫生管理人员深入了解疾病的病因和结局,从而提高他们对疾病早期预警信号的发现能力和对传染病疫情的追踪、响应能力。

 

2、基因组数据分析


基因技术发展至今,单单依靠生物技术已经不能完全地解决问题。BT(生物技术)和IT(信息技术),两者应该相互融合。

 

人体基因组共有23对染色体,包含超过30亿个碱基,而目前仅有3%能从临床给予解释。由测序服务公司提供的原始序列文件在经过系统地分析处理前,无法提供任何有效的信息。

 

数据有效分析的三要素包括高性能计算平台、专业的分析软件和高质量的大样本数据库。


计算平台用于对测序仪器得出的原始序列文件进行质量剔除、序列匹配等一系列分析的基础工作,分析软件和大样本数据库用于遗传解读和咨询。


据Ebiotrade调查,69%的被调查人员认为数据的分析解读是影响测序产业链发展最大的瓶颈。

 

目前,全球有超过100家生物信息公司提供基因数据分析服务。成熟的高通量测序技术产生了海量数据,生物信息学分析市场涵盖数据压缩存储、工作平台、数据分析软件等。

 

3、临床数据分析


临床医生有超过80%的研究都为回顾性研究,为了获取患者病历信息,一般有以下途径:

  • 医院 HIS、LIS 系统中的数据

  • 病案室里的病案数据

  • 自己保存的纸质病历、excel 文件等

  • 其他科室成员的数据

 

过去,病案室普遍为纸质病历,后来纸质病历换成了文本扫描件,但在电脑上查询起来依然费时费力。医生不仅需要一份份阅读,还要统计每份病历中所需的具体信息。


有时候,医生从信息科调取的数据会遇到信息不规整的情况,这时就需要去重新核实,造成二次查询。繁琐的流程,让医生在整理病历的过程中,耗费大量时间。

 

大数据分析技术可以让企业通过对大量脱敏后的病历数据进行结构化处理,使电子病历信息转化为科研级数据。不仅可以辅助医生科研,还能帮助医生构建精准的诊疗模型,给出诊疗建议。


4、社保数据


2015年4月,人力资源和社会保障部办公厅发布了《关于全面推进基本医疗保险医疗服务智能监控的通知》。

 

《通知》中写到:要规范监控系统建设。部里组织制定监控基础指标、监控规则和国家(行业)标准,研发并升级智能监控系统,作为各地开展医疗服务监控工作的基础条件。尚未建设智能监控系统的地区,原则上应在部里组织研发的统一软件基础上开展建设;已基于部智能监控系统或原自行开展建设的地区,应结合部里监控基础指标、监控规则以及部智能监控系统升级版进一步完善。

 

该项政策的出台,标志着我国医保控费时代正式来临。

 

医保控费,是控制我国医保费用增长的重要一环。国内像数联易康这样的医保控费公司,不仅可以利用大数据反欺诈模型对经办数据、HIS抓取数据、报销数据等进行深度挖掘,识别隐藏的欺诈骗保、医疗浪费以及过度医疗等违规行为,还能实现DRG分组,进行绩效和成本分析。


  • 附录


*头图基于CC0协议引用。


文|郝雪阳

微信|hxy942416176

添加时请注明:姓名-公司-职位

后台发送关键词即可获得相关好文

网站、公众号等转载请联系授权


长按上方二维码,即可报名参与




近期推荐

 弥合数字与物理世界鸿沟:人机协作,触发AI影像诊断真正落地场景?

  直销?代理制?原来消费基因公司是这样卖产品的

  几年内迅速融资超亿美元,这些公司具备这5个共同特征 |附公司名单

声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。文中出现的采访数据均由受访者提供并确认。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存