毕业季,人相散,梦还在
阅读文本大概需要 6.1 分钟。
(一)
转眼间马上要大学毕业了,回想这四年的时光,有过新奇,有过欢乐,有过悲伤,有过辉煌,也有过迷茫。曾经的自己是一个非常内向的人。高中时期,很少与人交谈。甚至对于曾经喜欢过我的女生,都是爱答不理的状态。想想以前真的好木头,别人女孩都那么明显,自己还是无动于衷。
这样内向的性格,导致自己在高中的读书生涯,吃了很多的亏。高考结束的那个暑假,自己就默默的发誓,上了大学一定要改变。
(二)
2014 年大一,身为新生,跟很多人一样,对于自己即将到来的大学生活,感到新奇又兴奋。每个学院在新生入学的时候,都会举办一场迎新晚会,欢迎新来的同学。但我和普通的新生有点不同,普通的新生是下面的观看者,而我是上台的表演者,享受着聚光灯,享受着舞台,享受着几百人带来的掌声。
(三)
高中的时候虽然自己很内向,但一直很喜欢魔术。刚进大学的时候,学院举办了一场新生形象大赛。而我为了改变自己,主动的去参加。那次的比赛,我上台表演了一个纸杯魔术。现场的反应非常的好,自己也得到全场最高分。
这是我人生中第一次参加的比赛,在上台前自己非常的紧张,一直在担心魔术会不会演砸,说话会不会结巴,以及上台恐惧症等等。但既然是自己选择的道路,我一定会走下去。猛兽总是独行,牛羊才成群结队。
(四)
出乎意料的是,当到我上台表演的时候,那种紧张感完全消失,取而代之的是有点享受。享受着众人的目光,享受着自己给大家带来的表演。一切都显得那么顺理成章,我表演着魔术,台下发出热烈的掌声。那场比赛我还叫室友帮我录了像,现在回看起来,还会一直笑,以前自己上台表演的样子好傻。
随后由于自己得到那场比赛的第一名,以一个新生的身份,被邀请迎新晚会的表演。后来自己逐渐的喜欢上表演的感觉,大学里一直参加各种表演。慢慢的,开始追求更好的生活,慢慢的,想去了解更大的世界。
马上毕业,身边的朋友相继离开,或许以后很难在见一面,心中不由的升起一股悲伤。
虽然自己因为穷,最远去过的地方也不过是上海。但自己一颗出国看看的心,并没有磨灭。而对于亚洲,自己最想去的地方就是日本。今天就教大家一个爬虫程序,通过「猫途鹰」来看看日本都有哪些著名的景点。先了解下,日后等自己赚了钱,一定要去日本看看。
猫途鹰网站爬虫
此次的程序,是通过 selenium + BeautifulSoup 进行网站的爬取。相应的库安装,我就不在这里进行讲述。网上有很多这类详细的教程。学会利用互联网查找资料,是每个程序员必备的基本功。
程序爬取结果
程序抓取日本景点排行榜的名称,所在的城市,对应的排名,以及相应的图片链接,已 csv 格式保存。
程序结构
程序主要的函数有三个,分别是:get_one()、parse_one()、write_to_file()。
数据请求
这里还需要注意这一行代码
用于初始化 PhantomJS 这个无界面的浏览器。这个浏览器需要你先去下载安装。对应的教程网上有很多,谷歌搜索下就可找的到。
最开始自己是使用 requests 这个请求库来进行网页的请求,但在图片链接获取的时候,一直获取不到正确的链接信息。后来查看相关的文档,以及别人的代码,发现这部分是用 js 动态加载出来的。
在弄清楚图片加载的方式之后,我就想到了使用 selenium 这个库来进行数据的请求。通过 selenium 的 webdriver 我们就可以模拟浏览器的操作,实现 js 代码的加载,从而得的我们想要的信息。
数据解析
这里的数据解析是用 BeautifulSoup 解析库进行数据的提取,把网站对应的信息保存到 info 列表当中。
数据存放
常规操作了,昨天的程序也是利用这个函数把相应的数据保存到 csv 文件中。
完整代码我已上传到 Github 上,需要的同学点击「阅读原文」即可获取。觉得程序还不错的话,不妨点个 star。
毕业季,人相散,梦还在。
大家儿童节快乐,不忘初心。
点个广告,让小痴早日实现自己的梦想。
推荐阅读:
每天分析 python 干货