查看原文
其他

小白学数据之新年计划 | 开始学Python吧!

2017-01-26 张远园 大数据文摘

大数据文摘作品,转载要求见文末

作者|张远园

审校|Aileen

Selene对本文亦有贡献


在数据科学家炙手可今天,Python无疑是当今数据科学家最重要的工具之一。新年伊始,如果想进入数据科学家这个领域,那么开始学习Python应当成为你的新年计划之一。本文介绍3步零基础快速入门Python的途步骤,包裹常用的Python安装办法。


新春快乐!作为数据领域的小白,新的一年有什么计划?

小白:新年新气象,我对数据行业一直很有兴趣,我很想今年里更好的准备自己进入这个行业,却不知如何下手。

小白你知道大数据领域什么职位最赚钱?当然是数据科学家数据科学家数据科学家!重要的事情一定要说三遍。

小白:你说赚钱就赚钱?我不信!

答:OK。请参考大数据文摘2015-12-21文章《数据科学行业的8个关键角色:职责与技能》。我们用数据说话!

 小白:哇!太壕!我要做数据科学家!快告诉我怎样才能成为数据科学家?!

答:同样请参考大数据文摘2015-12-21文章《数据科学行业的8个关键角色:职责与技能》。作为数据科学行业收入最高的人之一,数据科学家需要会利用最新的科技手段处理原始数据,进行必要的分析,并以一种信息化的方式将获得的知识展示给他的同事。数据科学家可能来自各种各样的背景,但是因为需要分析大量的数据,所以编程技能是必须的。

 小白:额,做个数据科学家,要学这么多语言,我看我还是放弃吧…

答:别啊,其实不需要学这么多…

小白:所以?

答:虽然掌握多种语言会非常有用,但只是在需要的时候这样。我们选择使用同一种语言应用在大部分的项目中,这样数据科学家们就可以在项目中进行合作;而被选择的这个语言,一定是非常易学的!

 小白:所以这个语言究竟是什么嘛!急死我了!

答:Python。借助开源社区的支持,Python已经成为了数据科学方面的有力工具。Python具有简单易学的语法,强大的数据处理能力以及可怕的开源数据库,如Numpy、Pandas、 Scikit-learn和Statsmodels;所有的这些可以让Python既能做探索性分析,又可以构建可扩展大数据管道和机器学习算法。只有针对一些非常规的模型,我们有时会结合Python和R来进行处理,用Python来做繁重的数据处理,用R做统计建模。

小白:这么好!只要学一种语言!那应该怎么学呢?

答:我相信,最好的学习方法一定是“做中学”。市面上有太多Python学习的书,网上也有各种Python学习网站,但我强烈向初学者推荐Codecademy的Python课程(https://www.codecademy.com/learn/python)。Codecademy向访问者提供了一个可交互的网页,来访者可以直接在网页上进行Python语言练习,练习结果、进程也可以被准确追踪。所以,即使不安装软件也是可以在网页上直接联系的啦!相似可以在网页上学习Python的课程还有很多,如密歇根大学在Coursera上的Python for Everybody专题(https://www.coursera.org/specializations/python)。

小白:真的是好兴奋!所以学完Python课程以后,我也不用安装软件、可以直接在Codecademy或者Coursera上编码实现的啦!

答:并不是这样的!课程学习完之后,我们就需要在我们自己的电脑上安装Python,来编程实现自己的工程啦。Python是开源的,可以免费从官方网页上进行下载。

 下载Python:

◇登录https://www.python.org/downloads/windows/;

◇点击Latest Python 3 Release - Python 3.6.0

◇滚动到页面底部Files表格,找到Windows x86 executable installer,如果想下载其它版本也是可以的;

◇双击exe文件,根据屏幕指示进行操作。如果对设置不确定,选择默认值,因为所有的设置都可以在后期进行修改;

◇你会注意到,安装过程中会弹出一个命令提示窗口并安装Pip(Pip是一个库管理工具)。Pip可以让你通过PiPI(Python Package Index)下载任何Python库;

◇现在可以通过终端或者IDLE来进行Python编程。只需要在电脑程序里搜索Python,打开IDE或者命令行来执行一行代码。

不过呢,这个网页上的官方版本只包含了标准的Python库。标准的Python库并没有复杂到可以完成所有的数据科学分析;但幸运的是开源社区里有着强大的库,足以支撑Python做数据科学。

小白:所以我得去官方网页下载Python,还得去开源社区下载各种库啊,有没有办法一次就把想要的都下载了呢?

答:还真的就有!而且有两种方法!

方法一(推荐方法):


开始Python的最快捷方法是下载免费应用Rodeo。这个应用除了提供可供Python编码和执行的文本编辑器之外,还会提供历史操作、文件导航、画图等功能选项。

Python是Rodeo的一部分,安装Rodeo后无需额外步骤就可以直接使用Python。

如何下载Rodeo:

◇ 登录网页https://www.yhat.com/products/rodeo;

◇ 点击蓝色的DOWNLOAD按钮,或者可以在下面的两行中选择自己需要的平台版本;

◇ 一个后缀名为.exe的文件开始下载;

◇ 双击下载的.exe文件,根据屏幕指示进行操作。如果对设置不确定,选择默认值,因为所有的设置都可以在后期进行修改;

◇ 执行完以上操作后,Rodeo会自动打开。Python已经安装在里面,可以直接在左上的编辑窗口里进行编程!

方法二:


Anaconda包含了许多最通用的数据库供使用(共150个,另有250个可以使用conda install命令进行安装)。

跟Rodeo不同的是,当下载Anaconda时,并没有得到一个可供Python数据挖掘和分析的“环境”(IDE环境,是指交互开发环境)。

如何下载Anaconda(包含Python):

◇ 登录网页https://www.continuum.io/downloads;

◇ 点击绿色的“64-bit Installer”按钮;

◇ 一个后缀名为.exe的文件开始下载;

◇ 双击下载的.exe文件,根据屏幕指示进行操作。如果对设置不确定,选择默认值,因为所有的设置都可以在后期进行修改;

◇ 执行完以上操作后,一个新终端窗口会打开;如果没有新窗口,点击Start -> Run -> Command -> Prompt;

◇ 可以开始在终端窗口中写代码啦!


小白:嗯,我会安装了。那之后就要开始写代码了吗?之前都只是在Codecademy网页上操作,现在我该怎么在PC上写代码呢?

答:只需要打开记事本,写下你的Python代码(地址C:\Users\thom\new_file.py),打开cmd命令行窗口,运行自己才写好的Python文件:python C:\Users\thom\new_file.py

小白:这好像也不简单哎……

答:你真是会来事啊,不过我们真的有解决之道噢。为了能有一个更美好的Python生活,我们可以在Pycharm(https://www.jetbrains.com/pycharm/?fromMenu)中进行开发。Pycharm是一种集成开发环境,可以支持分开发者在所提供的环境中进行开发。只需要点击开发环境中的“run script”按钮就可以运行程序。同时,该集成开发环境还可以让数据科学家们更高效,因为它提供了自动填充以及运行中错误检查的功能。如果你忘了一个空格或者用了一个已经被定义的函数名称,它会自动提醒你;他还可以帮你插入Git之类的版本控制系统。(很多人都认为这是最好用的Python IDE, 如果你熟悉R语言的话,Pycharm就类似Rstudio)

 小白:哇偶,好像真的很简单哎!

答:是啊!非常迅速地,你就可以开始你的数据科学家之路啦!万事开头难 --你只要选择一个Python从零开始的课程,按部就班的学下去,跟着提供的作业做练习,不出几个月就可以学会Python最主要的技巧了。装好了Python,接下来,如果想要更深入学习网课之外的内容,可以选择《利用Python进行数据分析》这样的教材类型书籍。

其实各类教程和书籍都是大同小异的,选择哪个区划没有那么大。

小白:嗯!最重要的是选择一个然后坚持下去!从零开始变成Python小能手就是我的2017新年计划啦,我这就去开始了!

素材


 https://www.themarketingtechnologist.co/helping-our-new-data-scientists-start-in-python-a-guide-to-learning-by-doing/

 http://blog.yhat.com/posts/installing-python-on-windows.html






关于转载如需转载,请在开篇显著位置注明作者和出处(转自:大数据文摘 |bigdatadigest),并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑,可直接转载,转载后请将转载链接发送给我们;有原创标识文章,请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。未经许可的转载以及改编者,我们将依法追究其法律责任。联系邮箱:zz@bigdatadigest.cn。


志愿者介绍

回复“志愿者”了解如何加入我们

往期精彩文章

点击图片阅读文章

小白学数据:小世界网络中的大世界




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存