查看原文
其他

用词云图分析一带一路峰会哪3个词说的最多

LEMON Python数据之道 2022-04-24

前言

最近几日关注度最高的新闻莫过于一带一路峰会相关的消息,会议结束后,一带一路峰会联合公告已经公布出来了。 本文通过词云分析,了解本次公告以及习大大在峰会开幕式上主要都讲了哪些关键内容。

1 一带一路峰会联合公告词云图

5月17日公布的一带一路峰会联合公告的词云分析结果图,如下:

词云图上,字体越大表示该词语在文件中出现的次数越多。

从上图可以看出,出现次数最多的3个词语为“合作”、“我们”以及“加强” ,基本可以看出,本次峰会是一个新的起点,今后需要做的事情还很多,需要各方务实合作,哈。

2 一带一路峰会开幕式上习大大的讲话词云图

分析开幕式上习大大的讲话内容,得到词云图如下:

从上图可看出,出现次数最多的几个词语为“一带一路”、“合作”、“我们”以及“发展”等。

3 用python制作词云图

下面主要来介绍下用python制作这个词云图的过程,主要分为如下几个步骤:

  • 从txt文件读取需要分析的文本内容

  • 使用jieba分词工具进行中文分词

  • 选取合适的显示图形

  • 用wordcloud进行词云图显示

  • 保存图片

一带一路峰会联合公告词云图实现的代码如下:

  1. # -*- coding: utf-8 -*-

  2. """

  3. Created on Wed May 17 2017

  4. @author: lemon

  5. """

  6. import jieba

  7. from wordcloud import WordCloud, ImageColorGenerator

  8. import matplotlib.pyplot as plt

  9. import os

  10. import PIL.Image as Image

  11. import numpy as np

  12. with open('ydyl_gb.txt', 'rb') as f:

  13. # 读取一带一路峰会联合公报的内容

  14. # with open('yidaiyilu.txt', 'rb') as f:

  15.    text = f.read()

  16.    f.close()

  17. # 首先使用 jieba 中文分词工具进行分词

  18. wordlist = jieba.cut(text, cut_all=False)      

  19. # cut_all, True为全模式,False为精确模式

  20. wordlist_space_split = ' '.join(wordlist)

  21. d = os.path.dirname(__file__)

  22. alice_coloring = np.array(Image.open(os.path.join(d,'colors.png')))

  23. my_wordcloud = WordCloud(background_color='#F0F8FF', max_words=100, mask=alice_coloring,

  24.                         max_font_size=300, random_state=42).generate(wordlist_space_split)

  25. image_colors = ImageColorGenerator(alice_coloring)

  26. plt.show(my_wordcloud.recolor(color_func=image_colors))

  27. plt.imshow(my_wordcloud)            # 以图片的形式显示词云

  28. plt.axis('off')                     # 关闭坐标轴

  29. plt.show()

  30. my_wordcloud.to_file(os.path.join(d, 'ydyl_gb_colors_cloud.png'))

更多精彩内容请关注公众号:

“Python数据之道”


同时,欢迎大家加入微信群:





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存