成都的火锅应该很辣吧!
成都旅游攻略
之前写过两篇关于厦门和长沙旅游的文章,反应还不错。最近把之前的代码重新跑了一遍,很快获取到了两份关于成都美食和成都景点的数据,之后进行了数据处理和分析,五一也可以考虑去成都旅游喔。送上厦门和长沙旅游攻略:
海滨城市厦门欢迎你:厦门真的不止鼓浪屿
娱乐之都星城长沙欢迎你:长沙31块的臭豆腐香不香?
数据获取
本文中获取了两份数据,参考的是之前的文章的代码,想要源码的朋友可以关注微信公众号后发。
成都景点参考厦门的文章:厦门真的不止鼓浪屿 成都美食参考长沙的文章:长沙31块的臭豆腐香不香?
涉及到的主要爬虫知识点:
requests发送获取网页数据 基于正则表达式的数据解析 基于csv包的数据保存
成都景点
总共8个字段信息:中文名、英文名、攻略数、评论数、位置、排名、驴友占比、简介
成都美食
6个字段信息:中文名、得分、均价、地址、推荐菜、评价
成都景点
数据中主要包含的是成都市区及管辖分区域的景点。
成都景点分布
首先我们看看成都相关的景点都分布在哪些地方?
data = pd.read_csv("成都景点.csv")
location = data["location"].value_counts().reset_index().rename(columns={"index":"location","location":"number"})
location
c = (
Bar(init_opts=opts.InitOpts(theme=ThemeType.LIGHT))
.add_xaxis(location["location"].tolist())
.add_yaxis("成都市景点数量分布",location["number"].tolist())
.set_global_opts(
xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-30)), # 设置旋转角度
title_opts=opts.TitleOpts(title="成都景点分布", subtitle="市区/管辖市"), # 主标题和副标题
)
)
c.render_notebook()
果然大部分的景区还是在成都市区,另外都江堰也是成都的人们旅游景点分布点。
成都广场
成都广场很多的,数据显示竟然达到了189个!!!
可以看下具体的广场数量分布:
c = (
Pie(init_opts=opts.InitOpts(theme=ThemeType.DARK))
.add("", [list(z) for z in zip(square_location["location"],square_location["number"])])
.set_global_opts(title_opts=opts.TitleOpts(title="成都市广场数量对比"))
.set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}"))
)
c.render_notebook()
根据广场的攻略数strategy和评论数comment进行降序排列,我们发现几个广场最为突出:
天府广场:成都的中心广场、地标和象征 耍都文化广场:成都有名的集娱乐、美食、休闲于一体的地方 中山广场:是不是每个城市都有自己的中山广场?😑
啤酒广场
在成都适合吃火锅,喝啤酒吧?看下啤酒广场多达45个:
啤酒广场集合咯:金星啤酒广场、野人谷啤酒广场、加勒比啤酒广场、一路香啤酒广场…...
啤酒广场的数量分布:
成都的山
西南地区山还是挺多,看下成都的山:
c = (
Funnel(init_opts=opts.InitOpts(width="1000px",
height="600px"))
.add("成都山景分布",data_pair=[list(z) for z in zip(mountain_location["location"].tolist(),
mountain_location["number"].tolist())])
.set_global_opts(title_opts=opts.TitleOpts(title="成都山景分布",
subtitle="市区/管辖市"),
legend_opts=opts.LegendOpts(type_="scroll", # 图例较多的是实现翻滚
pos_left="92%",
orient="vertical"))
.set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}")) # 添加数据部分
)
c.render_notebook()
到底哪些景点热门?
通过景点的评论数和攻略数的散点分布,我们发掘哪些景点比较热门,我们选取评论数和攻略数都大于100的景点:
## 选择同时存在评论数和攻略数的景点
comment_strategy = data[(data["comment"] > 100) & (data["strategy"] > 100)]
fig = px.scatter(comment_strategy, x="comment",y="strategy",color="comment",text="cn_title")
fig.update_traces(textposition="top center")
fig.show()
通过景点的散点图分布,我们发现了成都的几个热门景点:
锦里古街 成都大熊猫繁育研究基地 武侯祠 都江堰景区 人民公园 文殊院
在上面图形的左下角,也有很多景点算作热门吧??比如:
四川大学 大慈寺 东郊记忆 九眼桥
成都景点之最
我们看看成都的景点之最:
chengdu_most = chengdu[(chengdu["abstract"].str.contains("最")) | (chengdu["abstract"].str.contains("唯一"))]
想看大熊猫去:成都大熊猫繁育研究基地 想看老成都的繁华街市:锦里古街 想看成都的现代化商业街区:春熙路 如果你是文艺青年:东郊记忆 如果你是个收藏家:四川博物院,拜访张大千大师的佳作 如果你喜欢道教文化:青羊宫,成都最老的道观
成都美食
高分美食店
# 没有评分(--)用0代替
meishi["得分"] = meishi["得分"].apply(lambda x: x.replace("--","0.0"))
score = meishi.sort_values("得分",ascending=False)[:10] # 选择出得分最高的10个店
fig = px.bar(score,x="中文名",y="均价",color="均价",text="均价")
fig.update_traces(textposition="outside")
fig.show()
在这些高评分的店中,有小吃店、酒吧、糕点、兔头店等
火锅之都
到了成都一定得吃火锅吧???数据显示我们获取到的有213家火锅店,相信肯定是不止这个数。
看看哪些火锅店的评分较高?
通过得分和均价来看看火锅店的分布;
px.scatter(guo,x="得分",y="均价",color="得分",hover_name="中文名",size="均价")
整体的火锅店均价都是在90-120之间,毕竟火锅店多!!!
兔头也要吃
除了吃火锅,到了成都兔头你也要尝尝,看下兔头店:
tutou = meishi[meishi["中文名"].str.contains("兔头")].reset_index(drop=True)
tutou
数据显示刚好10家,最为出名的就是这家店,请你一定要记住:
双流老妈兔头
双流老妈兔头
双流老妈兔头
美食之最
看看游客们对成都的美食都有哪些“最”评价?
comment_most = meishi[meishi["评价"].str.contains("最")].reset_index(drop=True)
comment_most.head(10)
最好吃的夫妻肺片:夫妻肺片(武侯祠大街店) 最有名的兔头:双流老妈兔头 最佳休闲场所:九眼桥慢摇酒吧 最经典的一道川菜凉菜:成都川菜博物馆(餐馆就好)
推荐菜词云图
都说食在广州,吃在成都,就看看大家推荐了哪些成都美食:
meishi = pd.read_csv("成都美食.csv")
recommend = meishi[meishi["推荐菜"] != "无"]["推荐菜"].tolist()
rec_jieba_list = []
for i in range(len(recommend)):
# jieba分词
seg_list = jieba.cut(str(recommend[i]).strip(), cut_all=False)
for each in list(seg_list):
rec_jieba_list.append(each)
rec_result = pd.value_counts(rec_jieba_list)[1::].to_frame().reset_index().rename(columns={"index":"词语",0:"次数"})
rec_words = [tuple(z) for z in zip(rec_result["词语"].tolist(), rec_result["次数"].tolist())]
c = (
WordCloud()
.add("", rec_words, word_size_range=[20, 80], shape=SymbolType.DIAMOND)
.set_global_opts(title_opts=opts.TitleOpts(title="成都美食推荐菜词云"))
)
c.render_notebook()
我们选取前50个名次,看看大家主要推荐的美食:
from pyecharts import options as opts
from pyecharts.charts import WordCloud
from pyecharts.globals import SymbolType
# 取前50个分词
c = (
WordCloud()
.add("", rec_words[:50], word_size_range=[20, 100], shape=SymbolType.DIAMOND) # 取出前50个
.set_global_opts(title_opts=opts.TitleOpts(title="WordCloud-shape-diamond"))
)
c.render_notebook()
发现果然是个美食之都:牛肉、排骨、抄手、烤肉、毛肚、豆花、黄喉、肥肠😍都是火锅好料
总结
本文中结合两份数据对成都的部分景点和美食进行了分析,发现了成都很多好玩的景点和好吃的美食,希望对想去成都旅游的朋友有所帮助。
有时间我也去成都逛逛😃
一切看似逝去的,都不曾离开,你所给与的爱与温暖,让我执着地守护着这里。
尤而小屋,一个温馨的小屋。小屋主人,一手代码谋求生存,一手掌勺享受生活,欢迎你的光临😃