其他
不会爬虫,怎样获取数据?
如果你不会用爬虫爬数据,但是你又经常需要把某些网站上的数据导入到Excel等软件,那么请阅读本文并观看视频。
前段时间想换个手机,突发奇想写个爬虫爬一下京东商城所售卖手机的信息,看看什么品牌的手机卖得最好。我分析了一下京东商城的手机页面,发现并没有手机的品牌信息,手机的品牌信息是嵌入到手机名称中的,所以可以通过手机名称获取品牌信息。
比如下面三部手机都是苹果手机,虽然它们的型号不同,但是它们的名称中都出现了Apple,所以我们只用提取Apple,即当某个品牌关键词出现在了手机的名称中,就能获得这个手机的品牌。
而重点就是如何获得手机品牌的list,下面二胖就讲一讲,如何最快速地获取一份手机品牌的list。
打开任意一个手机论坛:这里以手机世界为例 http://www.3533.com/phone/
打开品牌页面,可以看到这里列举了100多个手机品牌,这些信息完全可以支持我们建立手机品牌的list。
现在的问题就是,如何用最快速的方法把品牌信息的数据下载到本地?肯定不能一个一个复制。写爬虫是个好方法,可是写爬虫需要一定的技术基础和练习时间,那么用什么方法比较好呢?
下面就让二胖来告诉你这个方法。由于文字表述比较麻烦,二胖录制了一个视频,为你讲解如何用两分钟就拿到这一百多个手机品牌数据。
https://v.qq.com/txp/iframe/player.html?vid=g0545mxgubo&width=500&height=375&auto=0
想要获取高清视频,关注“二胖并不胖”微信公众号,并后台回复“0204”。
长按二维码,关注“二胖并不胖”
知乎:二胖