查看原文
其他

Python词云图教程——进击的巨人

2017-06-30 徐永瑞 Python爱好者社区

(点击上方Python爱好者社区,可快速关注)

作者:徐永瑞   天津大学

       今天的这篇教程是想教大家使用时下比较流行的python语言来做出高大上的词云图。

       话不多说,先按照步骤一步一步来进行我们的教程,本教程主要是针对macOS的使用者,Windows自己没有实践过,所以没办法写。

第一步,我们需要一个python的运行环境,但是单单是有python是不行的,我们需要用到很多的拓展包,在这里给大家推荐一个非常棒的套装anaconda,这款软件包种类齐全,结构合理。

  主要有两种安装方法:graphical安装和命令行(终端)安装,比较推荐前者,命令行安装效率不高。

好了,安装完我们的扩展包之后,我们需要一个系统默认的浏览器,macOS直接用Safari就ok的。

第二步:macOS下,你需要一个终端(terminal)

在终端下面,macOS用户请键入以下命令:

pip install wordcloud

macOS会提示你先安装XCode命令行工具,你按照默认设置一步步进行就可以了,千万要按照此步骤一步一步来,因为下面的环节都是环环相扣的。

第三步:词云分析的对象呢,是文本,文本可以是由多种类型的语言组成的对象,不一定是指中文,因为最近刚刷完进击的巨人第二季就心血来潮,想做一个进击的词云,于是乎就去百度百科上铐了这部剧的部分词条。

拷贝了主要人物的身材数据,打开mac的文本编辑器,先将词条command+V键贴进去,然后按快捷键shift+command+T便捷的将此文件保存为TXT格式,现在我们有了,进击的巨人的文档。将此文档放进我们的工作目录demo中,现在数据我们准备好了,接下来便开始我们的大招。

第四步:在终端下,键入jupyter notebook,系统会自动弹出网页,弹出的网页如下所示:

打开demo,进去之后我们可以看见我们的文件已经保存在了里面(请注意,我们的文件名一定要是英文格式的,否则会报错)

回到Jupyter笔记本的主页面。

      我们点击New按钮,新建一个笔记本(Notebook)。在Notebooks里面,请选择Python 2选项(因为我用的是python2.7版本的)。

第四步,在上图的框中开始我们的编程:

第一条语句:with open('juren.txt','r') as f:

                  data = f.read()#本语句是为了打开junren.txt的文件,并将文件以只读的方式导入data文件中。

第二条语句:from wordcloud import WordCloud

                  wordcloud = WordCloud().generate(data)

#本语句是为了调用词云包

第三条语句:%pylab inline

                  import matplotlib.pyplot as plt

                  plt.imshow(wordcloud, interpolation='bilinear')

                  plt.axis(“off")

这是最为核心的语句,系统开始生成词云图,可能会报错,但是问题不大

最后生成的词云如下:


     是不是感觉很黑科技,当然,这篇词云图是纯属娱乐,如果在工作中大家所需要用到词云图向需求方展示一些数据,可以参考本篇文章,你也可以做出很有用的词云图。

     展示结束,谢谢观赏~~~

关注公众号,“Python爱好者社区”,回复“爬虫”即可获取崔老师爬虫免费学习视频。


Python爱好者社区


为大家提供与Python相关的最新技术和资讯。

长按指纹 > 识别图中二维码 > 添加关注

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存