查看原文
其他

世界之大无奇不有,唯有美食不会辜负

Koc 痴海 2022-06-18

阅读文本大概需要 4.3 分钟。

淘宝网中国最大的电商平台,月活数为 4.48 亿。淘宝也是很多人日常必用的软件之一,尤其对于女性来说。在淘宝上可以购买很多商品,比如衣服、鞋子、书本等等。但在民间流传着这样一句话「没有什么是在淘宝上买不到的东西」,简称「万能宝」。


今天我给大家盘点下淘宝上那些有趣的商品。


1 印有数独题目的厕所纸


我猜设计者应该是这样想的:“大家平常上厕所都被手机霸占着,天天看着一些无营养的内容。而上厕所又属于高频事件,长期这样下去,非常不利于我们大脑的发育。不如我设计一个数独,让大家上厕所的同时,还能锻炼大脑!”


不知道设计者最初设计的时候,有没有考虑会有人,因没能把数独解出,而蹲了一下午。


2 女性站立应急小便器



很多女生都想过这样的问题「站着上厕所会是什么样的体验?」。女性站立应急小便器就可以帮你实现,并且在很多地方是非常便利。比如在高速公路上堵车,女厕所排队排到天荒地老的时候,心痛肾更痛,如果有这个物品会方便很多。在比如有些公共厕所里的马桶非常的肮脏、去户外玩没有厕所还要蹲在草丛里、怀孕不方便蹲下的女性等等,在这些场合中这个物品也非常实用。


就是不知道如果被你男朋友看到你站着上厕所,他会有何感想。


3 30 天教你学会灵魂出窍



这个就非常的厉害了,30 天学会灵魂出体。1块钱一本电子档秘籍,看商品留言大家都给出不错的评论。真的是万能宝这种绝世秘籍也有卖。如果你也能灵魂出体,你第一时间会去做什么?我相信应该会有人跟我想到一块。


4 胡萝卜耳机

哈哈,我第一次看到这张图片的时候,某名戳中我的笑点。脑洞大开下,是否可以在做成西瓜、苹果、榴莲、芒果、西红柿等等耳机。这些耳机如果做出来一定非常的有趣。


Selenium 爬取淘宝网美食信息



世界之大无奇不有,唯美食不会辜负。在看完这些有趣的淘宝商品,今天就教大家利用 Python 的 selenium 库,来实现一个模拟浏览器抓取淘宝美食商品信息。看看在淘宝上都有哪些好吃的美食。


前期准备


本次的爬虫代码,我使用的是 Python 3.6 版本。爬虫框架使用的是 selenium ,数据的保存使用的是 mongodb。所以需要你们先自行把这些库安装好。这些库的安装网上有很多教程,我就不在这里讲述。编程学习很重要的一点,懂得自己上网查找相应的教程。


程序结构



程序分为两个 python 代码,一是爬虫抓取的 spider.py 文件,二是 mongodb 数据库配置文件。


spider.py 


spider.py 利用 selenium 爬虫框架,来模拟浏览器操作,爬取相应的淘宝内容。在这个文件中我定义了四个函数:search(),next_page(),get_products(),save_to_monogo()。分别用于:搜索淘宝对应关键字信息、自动翻页、获取商品详情信息、以及保存数据到 monogo 数据库中。


相应代码:


每行代码我都有详细的注释,大家可以自行下载项目查看。点击「阅读原文」即可跳转项目地址。


config.py 


config.py 这个文件是用来配置 mongodb 数据库,相应的代码也都有详细的注释。


输出结果



运行 spider.py 程序就会自动抓取淘宝相应的美食商品信息。然后在已字典的形式保存到 mongodb 中。


在数据库保存的形式如下:



当然这个程序你把相应的搜索关键字改成别的,就可以抓取淘宝其他商品的信息,这就自行发挥。


完整代码我已上传到 Github 上,每行代码我都有详细的注释。点击「阅读原文」就可以跳转到项目页面。如果大家觉得今天的程序还不错的话,不妨给我的项目点个 star,公众号上的所有代码都会保存到这个项目上。


技术交流群


最后我创建了一个技术交流,群里面有很多人大神,氛围也非常的好,大家时常讨论些有趣的事情。如果你也想加入的话,请添加我的微信号「m726612」,备注「进群」。


点赞、分享、点广告是一种态度。


推荐阅读:

520 程序员专属操作,你学会了吗?

一个程序员的素养:生活中的算法思想


人必有痴,而后有成。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存