Python赶超R语言,成为数据科学、机器学习平台中最热门的语言?
近日,kdnuggets 做了一个关于数据科学、机器学习语言使用情况的问卷调查,他们分析了 954 个回答,得出结论——Python 已经打败 R 语言,成为分析、数据科学和机器学习平台中使用频率最高的语言。有关此次问卷更具体的情况如何?AI研习社将 kdnuggets 上发表的总结文编译整理如下:
之前我们在 kdnuggets 上做了这样一个问卷调查,2016、2017 两年,在分析、数据科学和机器学习的工作中,你用 R 语言,还是 Python,或两者都用,或选择其他的语言?
通过分析 954 个回答,我们得出了这样的结论:虽然 Python 并没有完全取代 R 语言,但在 2017 年,Python 已经成功打败 R 语言,成为分析、数据科学和机器学习平台中使用频率最高的语言。
在 2016 年 Python 还是第二位(主要用 Python 的人占 34%,主要用 R 语言的人占 42%),在 2017 年 Python 就以 5% 的优势领先于 R 语言(主要用 Python 的人占 41%,主要用 R 语言的人占 36%)。同时用 Python 和 R 两种语言的人也从 2016 年的 8.5% 增长到 12% 了,而用其他语言的人则从 16% 降到 11%。
图 1:2016-2017 年,在分析、数据科学和机器学习中使用 Python、R 语言、Python 和 R 语言、其他语言的占比
之后,我们分析了大家在不同语言之间的转换情况。
图 2:2016-2017 年,分析、数据科学以及机器学习平台中各种语言的转换情况
这张图看起来很复杂,不过从中可以很容易地看出 Python 在忠诚度和转换率两个关键层面都领先于其他语言。
忠诚度:使用 Python 的用户对它的忠诚度要高于使用其他语言的用户。2016 年使用 Python 的用户中,有 91% 的人 2017 年还在继续使用它,而 R 语言的用户留存率为 74%,其他语言的用户留存率则为 60%。
转换率:从 2016 年到 2017 年,只有 5% 的 Python 用户转向 R 语言,而 R 语言用户转向 Python 的则是 10%,这是前者的两倍。另外,2016 年同时使用两种语言的人中,只有 49% 的人还在继续使用这两种语言,38% 的人转向 Python,11% 的人转向 R 语言。
接下来我们看一下 2014-2017 年这几种语言的使用趋势。
因为我们 2015 年【R vs Python】的问卷调查中没有提供【同时使用两种语言】这个选项,因此下面 2014-2016 这四年的对比趋势图中,2016、2017 年的 Python、R 语言使用趋势我们是这样计算的:
Python*= (Python 的比例) + 50% * (同时使用 Python 和 R 语言的比例)
R* = (R 的比例) + 50% * (同时使用 Python 和 R 语言的比例)
可以看到,R 语言的使用率在逐年缓慢下降(从 2015 年的 50% 降到 2017 年的 36%),而 Python 的使用率则从 2014 年的 23% 增长到 2017 年的 47%。另外,其他语言的使用率也在逐年下降。
图 3:2014-2017 年,Python、R 语言及其他语言在分析、数据科学和机器学习的使用情况对比
最后,我们也按地区分析了几种语言的使用趋势,地区分布情况如下:
美国 / 加拿大,40%
欧洲,35%
亚洲,12.5%
拉美,6.2%
非洲 / 中东,3.6%
澳洲 / 新西兰,3.1%
为了简化对比图,我们将同时使用 R 语言和 Python 的比例也按照上面的计算方法折算到单独使用 R 语言和 Python 的比例中,并把亚洲、澳洲 / 新西兰、拉美、非洲 / 中东这四个占比较少的地区合并为一个区域。
图 4:2016-2017 年,不同地区使用 Python、R 语言和其他语言的情况
我们注意到不同区域的语言变化情况:
Python 的使用率增长了 8-10%
R 语言的使用率降低了大约 2-4%
其他语言的使用率降低了 5-7%
上面的数据表明了 Python 的使用前景很好,我们也预测 R 语言和其他语言的使用率还是会有相当的占比,因为它们已经有很深的用户基础。
AI 研习社长期接受优秀文章投稿
同时免费为优质企业推广招聘信息
有意者请联系 jiazhilong@leiphone.com
后台回复 “我要进群” 加入 AI 技术讨论群
新人福利
关注 AI 研习社(okweiwu),回复 1 领取
【超过 1000G 神经网络 / AI / 大数据,教程,论文】
「用 AI 识别 xxx」,真的靠谱么?
▼▼▼