Python与数据分析

其他

爬了下Unsplash上的高清壁纸,总有一款适合你

Unsplash是个高清摄影图片的网站,里面的照片非常精美,分辨率也很高,最重要的是,所有的照片都没有版权,无须向原作者申请授权,即可任意使用。
2018年12月28日
其他

用Python分析了1w场吃鸡数据,原来吃鸡要这么玩!

绝地求生在国内火的一塌糊涂的时候,一款名叫Fortnite的游戏在国外刮起了堡垒旋风,这款同样为大逃杀玩法的沙盒类游戏,在绝地求生逐渐走低的形势下,堡垒之夜却夺得多项提名,众多明星主播转战堡垒!
2018年12月10日
其他

分析了 6000 款 App,竟有这么多佳软神器没用过

接着,我们需要创建一个爬虫项目,所以我们先从根目录切换到需要放置项目的工作路径,比如我这里设置的存放路径为:E:\my_Python\training\kuan,接着继续输入下面一行代码即可创建
2018年12月5日
其他

5G时代即将到来

看到今天的新闻说,OPPO的团队在5G手机上成功打通微信视频通话,这标志着5G商用手机离我们又近了一步,OPPO的5G手机预计将于明年三四月份上市。
2018年11月30日
其他

Windows上做Python开发太痛苦?Docker了解一下

我们的这个镜像现在只是一个最基本的ubuntu的系统,里面很多工具都没有,如ping、ifconfig、wget、vim等,也没有python。接下来我们把这些一个一个都装上。
2018年11月26日
其他

点评网的反爬再也不是烦恼

shop_node.xpath('.//div[@class="comment"]/a[@class="review-num"]/b')[0]
2018年11月24日
其他

老板有毛病吧,写完排序就叫我走人了

给数组中每个数字都开了个线程,先让线程按数字的大小睡一会儿,醒来打印结果,打印的结果就是排好序的结果。人才啊~~
2018年11月18日
其他

入门数据分析的一些建议

这本书介绍了机器学习中最常用的几种算法,对算法背后的数学原理也有介绍,对于理解机器学习的算法非常有帮助。书中的代码和例子都是用Python实现,非常适合有python基础的同学学习。
2018年11月15日
其他

数据揭秘5000个知乎万粉大V的日常

可以看到,两者的走势出现了比较大的差异。2018年9月以来大V们发布回答的赞同数量急剧下降,难道是被“限流”了吗?这个不好说,也有可能因为回答问题的时间距离统计的时间太近,赞同数还没有上去。
2018年11月14日
其他

写文章不会起标题?爬取虎嗅5万篇文章告诉你

TOP20上面,我们从收藏量指标进行了分析,下面,我们关注一下发布文章的作者(个人/媒体)。前面提到发文最多的是虎嗅官方,有一万多篇文章,这里我们筛除官媒,看看还有哪些比较高产的作者。
2018年11月13日
其他

透过评论看Runningman

一直都很好奇在观众心中哪个mc的话题度最高,所以做了一个话题度排行。从上图可以看到haha是最具话题性的mc(这个结果有点出乎意料呢)其次是李光洙和宋智孝。因为笔者统计的是2018年的running
2018年11月12日
其他

用Python分析《斗破苍穹》

910plt.figure(figsize=(15,5))11plt.plot(np.arange(1,result.shape[0]+1),result['熏儿'],color="r",label
2018年11月4日
其他

纵观30年5000多部国产电视剧,豆瓣评分最低的演员原来是……

不出意外,北京和上海两大中心城市的演员数量也是最多的,而第三名就是小编的家乡青岛了。之前每当小编提及青岛,总是会提起青岛的明星多,这次的数据更加使得小编未来有了交流(chuixu)的底气。
2018年11月2日
自由知乎 自由微博
其他

爬取一万条b站评论看《工作细胞》

https://bangumi.bilibili.com/review/web_api/short/list?media_id=102392&folded=0&page_size=20&sort=0
2018年11月1日
其他

60行代码爬取知乎神回复

大家看出什么规律了么?短小精辟有没有?赞同很多有没有?所以爬取知乎神回复我们只要爬取那些赞同多又字数少的回答就可以。简单的两个步骤就能实现,第一步爬取知乎回答,第二部筛选回答。是不是很easy?
2018年10月25日
其他

爬了下知乎神回复,笑死人了~

最后,最近建了个读者群,群里以技术讨论为主,以后会分享一些技术相关的资源,还会定期地举办送书活动,欢迎大家加入!
2018年10月7日
其他

用数据分析选购手机

思路很简单,上京东商城把所有手机的数据爬下来,然后根据配置、价格过滤出符合条件的手机,在过滤出来的手机里选择一部性价比最高的。画成流程图,大致是这样的
2018年10月3日
其他

用Python生成马赛克画

dtype=np.uint8)这里load_all_images函数的参数就是统一后的尺寸,tile_row和tile_col分别对应高和宽。
2018年9月12日
其他

用Python识别验证码

我们测试了下识别的准确率,取100张验证码图片(存在test目录下)进行识别,识别的准确率约为82%。看到有人说用神经网络识别验证码,准确率可以达到90%以上,下次有机会可以尝试一下。
2018年9月1日
其他

Python也能聊微信

可能是最有趣的用Python做数据分析的公众号。文章皆为原创,涉及web开发、图像识别、机器学习、量化交易等多个领域。
2018年2月24日