selenium驱动器配置详解
本文写作缘由
刚开始学selenium,为了省事,我直接使用的firefox36,后来分享文章时,页建议大家统一使用firefox36版本,省去配置驱动器配置问题。
网上有关驱动器配置的文章有不少,但大多没有图片讲解步骤,小白的我学着有点恐惧。后来嫌麻烦,怕实验失败又白白耗时耗力,一直用firefox36将就着。
但今天淘宝上接了一单爬动态网页的任务,网站是要点击翻页的,但是网址栏网址不变。根据经验,必然要进行抓包分析。但是分析了半天,始终找不到规律,不得已想起了selenium。直到今天我才成功配置好firefox和chrome的驱动器。汗颜啊!!在舒适区呆久了,总要找点累事去做。金钱的力量果然是最强动力,在windows上试验成功。(不要笑我,大家都可以去淘宝开个店子,当当掌柜。学到知识技能,能帮人解问题又能挣点生活费,何乐而不为?)
我先声明下,所有的路径我都没有搞系统环境路径,这东西挺麻烦的,我也懒得搞。毕竟,现在要解决0和1问题,至于1还是1+,那就留给大家自己再去探索吧,嘿嘿。闲话扯多了,现在进入正题。
上图文
selenium+ChromeDriver
现在写作的电脑是window10,chrome版本58。因此我下载了chromedriver2.29。
所有chromedriver下载地址
http://chromedriver.storage.googleapis.com/index.html
下面列表参考该博客
http://blog.csdn.net/huilan_same/article/details/51896672
Chrome版本 | chromedriver版本 |
---|---|
56-58 | 2.29 |
55-57 | 2.28 |
54-56 | 2.27 |
53-55 | 2.25、2.26 |
52-54 | 2.24 |
51-53 | 2.23 |
49-52 | 2.22 |
46-50 | 2.21 |
43-48 | 2.20 |
43-47 | 2.19 |
43-46 | 2.18 |
42-43 | 2.17 |
42-45 | 2.13 |
40-43 | 2.15 |
39-42 | 2.14 |
38-41 | 2.13 |
36-40 | 2.11、2.12 |
33-36 | 2.10 |
31-34 | 2.9 |
30-33 | 2.7 |
29-32 | 2.5、2.6 |
29-32 | 2.4 |
配置
将chromedriver.exe直接放置在chrome.exe同目录下
代码
运行效果
selenium+Geckodriver
Firefox的驱动器Geckodriver似乎无需像Chrome那样,根据浏览器版本选择匹配的驱动器版本。
geckodriver下载地址
https://github.com/mozilla/geckodriver/releases
配置
代码
运行
selenium+Phantomjs
phantomjs用于异步加载,也就是动态网页的抓取。具体我也是刚上手,先不讲动态的,只是试验了下phantomjs与selenium合在一起能否正常使用
配置
代码
运行
一开始不是上面代码,但一运行弹出如下
后来修改为phantomjs第一个代码,并运行
打印的结果中出现了腾讯的网址,证明phantomjs正常运行。
到此,selenium三大浏览器(phantomjs也算浏览器,只不过看不到)都能调用了,后面不懂的,请自行百度谷歌,也可在大邓群里互相交流学习。
更多内容
文本分析
数据分析
神奇的python
爬虫
【视频】有了selenium,小白也可以自豪的说:“去TMD的抓包、cookie”
【视频】快来get新技能--抓包+cookie,爬微博不再是梦