其他
Python大法好:贴吧爬虫大法
第一次写封装的脚本,里面不规范的地方很多,class、self还只是学到皮毛,所以写的很渣。本代码只适合初入python世界,想抓点数据的人。脚本链接:
http://pan.baidu.com/s/1i4CLClJ
这个脚本可以实现功能如下:
1、输入贴吧名,即可获得该贴吧的关注数,帖子数,群组数,吧务管理团队等
2、输入用户昵称名,即可获得该用户的吧龄、性别、关注的吧、谁关注了ta、ta关注了谁
具体有哪些功能,先进行如下操作:
将 tieba_spider.py 放到python安装目录中Lib文件夹下的site-packages中 。
新建一个py文件,在第一行输入(查看帮助文档):
调用了tieba_spider中所有的类。不过我建议大家,不要这样写,还是用什么类,写什么
比如,我要用tieba类,想获取王宝强吧的吧主就写如下(含运行结果):
如果想获取用户关系,谁关注了ta
如果想获取用户的具体信息,如性别
还要很多功能,大家自己去尝试吧。