R、Python中那些99%的人第一次都不会安装的包
可能分享的学习笔记不是那么高大上,但是我坚持分享原创技术干货!我相信:数据的冰山一角不是不可窥探,混沌也并不是不可认知的!
自己花一点点时间,为别人节约好多时间
——我觉得,这很值得
学习R语言、Python到现在,遇到的几个非常难安装的包,很多网友经常也会询问的基本都是这些包的安装方法。其实,有些东西并不是那么难,可能方法很唯一,而你只是不知道而已,并没有触犯银河正义法,却使得你花上短则半天长则一个周的时间作为惩罚。
我这个人可能探索能力比较差,这些包好多我都是要花一个周的,有一个包的安装我记得还横跨两个月(其实已经放弃了),后来偶然机会才解决的。下面就把这些包列出来以及提供一种解决方法,可能不是对所有计算机都适用,但应该能给一部分人提供一种有效的解决方法吧!我希望能为第一次安装这些坑爹的第三方包时节约一点点时间吧,哈哈!
计算机环境
|---OS:win10/64 bit
|---R语言:R 3.3.3/64 bit
|---Python:Python 3.6.0/64 bit
R语言包
根据我自己的实践以及一些网友的虚心询问,目前为止,我觉得R语言中最最臭名昭著的一个包莫过于中文分词包——Rwordseg,当然了还有其它的包(比如结巴分词包jiebaR)。因为这个包需要使用rJava 调用 Java 分词工具 Ansj,意味着我们需要安装并且配置java环境(也就是jdk)。
下面小小的介绍一下这个包吧:Rwordseg 是一个R环境下的中文分词工具,使用 rJava 调用 Java 分词工具 Ansj。Ansj 也是一个开源的 Java 中文分词工具,基于中科院的 ictclas 中文分词算法, 采用隐马尔科夫模型(Hidden Markov Model, HMM)。这个包的作者孙健重写了一个Java版本, 并且全部开源,使得 Ansi 可用于人名识别、地名识别、组织机构名识别、多级词性标注、 关键词提取、指纹提取等领域,支持行业词典、 用户自定义词典。So,这个包很强大。
我自己总结的安装方法如下(仅供参考):
去java官网下载jdk,安装;
新建系统变量JAVA_HOME;变量值为jdk的路径比如我习惯性的路径:D:\Program Files\Java\jdk1.7.0_79;
在PATH变量后加入:%JAVA_HOME%\bin;%JAVA_HOME%\jre\bin;末尾最好有分号,防止下次加时漏掉分号,养成好习惯;
在命令行窗口输入javac,会出现相关目录表示配置成功。
R命令install.packages(rjava),应该就能安装成功了
前面几篇关于文本分词的文章就用到了这个包:rjava、Rwordseg和wordcloud(词云包),这里列出来:
文章一——《人民的名义》小说文本分析
文章三——Python简单文本分析朱自清写《匆匆》的情感状态
这还只是把rjava安装完了,主要包Rwordseg好像好多人安装不了,确实是这样,我把它放到百度云里面了,在后台回复:Rwordseg可以获得分享链接。下载后放到安装目录library文件夹下面,如果前面妥了,应该就妥了!当然,如果你的计算机可以直接安装那就再好不过!
Python包
由于Python各种包的复杂依赖性,有时候安装一个包可能需要好多其它包,因为这个包调用了其它包的模块或者函数。Python里面的难装的包我遇到的有两个,爬虫包——scrapy与科学计算包——scipy,下面分别说明:
Python包的下载地址,所有的包都在里面
http://www.lfd.uci.edu/~gohlke/pythonlibs/
scrapy
简单介绍一下:scrapy是Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。
这里介绍一下它的安装过程,在Python3系列版本上安装它确实费了很多人很大的劲,浪费了时间和精力。
亲测在我的计算机环境Python3.6.0上只需两步:
1、安装Twisted
(1)、下载到本地
下载地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
注意下载的版本,(我的是):
Twisted-17.1.0-cp36-cp36m-win_amd64
注意:这里的cp36表示python是python3.6.0版本的,win_amd64表示python为64位的,下载下来的是.whl文件。
(2)、命令行执行
假设下载到桌面:path = C:\\User\\26015\\Desktop\\...
path为下载的物理路径,命令行cmd输入:
>pip install path
一般情况下,Twisted应该就安装成功了
2、安装scrapy
>pip install scrapy
在命令行输入>scrapy一般情况这个包就成功安装了!
scipy
简单介绍一下:scipy包包含致力于科学计算中常见问题的各个工具箱。它的不同子模块相应于不同的应用。像插值,积分,优化,图像处理,,特殊函数等等。它依赖于numpy这个包,这是个科学计算关于矩阵计算包,功能强大。安装它主要分为一下两步:
安装numpy
去前面给的那个网址里面下载numpy包,这个包有一百多M,可能下载比较慢,假设下载本地路径为path。还是注意:这里的cp36表示python是python3.6系列版本的,win_amd64表示python为64位的,下载下来的时whl文件。cmd执行:
>pip install path
安装scipy
同上
到目前为止,我遇到的一共三个包第一次安装时确实不好安装,印象比较深刻,或许还有一些其它的包也比较难暂时没有想起来吧,哈哈。当然了,这里只是提供了一种安装方法,不同计算机环境不一样等各种原因可能有差别,希望对一部分人有用吧!
其实呢,我室友有一个公众号:数据之都,专注于各种高大上、稀奇古怪的好玩东西,目前只有几个人关注,如果有兴趣可以去看一下,哈哈!
欢迎留言,纯属个人观点、经验,欢迎提建议、补充;如果觉得不错或者有帮助,记得点赞、分享!让更多的人看到。最近关注统计分析与智能算法,正在学习,哈哈!