菜鸟学Python

其他

Python最难理解的概念之一,猴子补丁?是什么?

patch**就行了,它是会影响整个进程空间的,同一进程空间中一个module只会被执行一次。"""file:json_serialize.py"""import
2023年11月6日
其他

震惊!用Python探索《红楼梦》的人物关系!

点击上方“菜学学Python”,选择“星标”公众号超级无敌干货,第一时间送达!!!大家好,我是菜鸟哥。相信很多人都知道,《红楼梦》就是中国古典小说的巅峰之作,太多人沉迷其中,而红学也经久不衰。当然今天我们不是来探究小说的,而是通过
2023年2月16日
其他

超详细!Python中 pip 常用命令

相信对于大多数熟悉Python的人来说,一定都听说并且使用过pip这个工具,但是对它的了解可能还不一定是非常的透彻,今天小编就来为大家介绍10个使用pip的小技巧,相信对大家以后管理和使用Python当中的标准库会有帮助。安装当然在Python
2023年1月29日
其他

春节7天,用Python赚了2万4 !

今天是节后上班第二天,祝大吉!先说个好消息:每年春节后,会迎来Python圈内兼职接单的小高潮。近期可以很轻松地,接到爬虫类和数据分析类的私活,需求大报酬高。往年春节开工后的几天,做私活赚上万很容易。有很多人表示,过年太费钱,节后需要接单“回血”,早在年初五,后台和私信中来询问技术变现方面问题的留言就已超过99+。当下各领域对爬虫服务的需求量虽说很大,但其对技术的要求可一点都不低,通常高价值的爬虫项目都需要攻破各类反爬虫措施才能完成,破不了反爬虫就接不了单赚不到钱。所以,每天都会有很多人来咨询爬虫逆向破解方面的问题,包括数据逆向、请求参数逆向、多重加密解析、逆向登录、AES算法、RSA算法和Js混淆在内的反爬虫破解相关技术点是被问及最多的。结合多年爬虫项目接单经验,这里给想学爬虫接单涨收入的朋友一个建议:其实现在各家的反爬虫措施同质化严重,先吃透几套经典爬虫实战项目,再消化其中经验与规律,多练练手,熟悉之后能很容易攻破大厂反爬虫。极速进阶的高效变现方案考虑到真正有价值的爬虫项目,基本都在大厂内部,普通人几乎接触不到,即使真能找到好项目,在缺乏指导的情况下学习也很不容易。所以,要想快速搞定反爬虫,我建议直接来腾讯课堂参加Python爬虫技术的速成特训计划!1月30日20点准时开课技术速成直通车👇👇👇↑扫码添加小助理报名腾讯课堂官方特训费299元,本号粉丝有福利,立即报名可免费学习!这是一套专讲爬虫逆向破解的高阶技术实战课,迄今为止已帮助超三万学员快速进阶。本次课程将由国际大数据竞赛获奖大佬亲身指导,带领大家进行一线大厂高阶技术体系+多重逆向解析项目实战+技术变现路径指导的综合速成训练!此次实战训练为期3天,是专为高阶爬虫技术速成而设计的,课程内包含6项业界难觅的真实项目,对应每一项案例都有保姆级的拆分详解,深入浅出极易学懂。顶尖名师的专业指导与规划,搭配最前沿的爬虫逆向实战项目边学边练,在实战中快速累积经验,熟悉之后即可开始尝试接单。此外,本次课程并不仅限于技术干货传授,更有技术大佬十余年积累的技术变现经验分享。特训详情Day
2023年1月29日
其他

如何在Excel中调用Python脚本,实现数据自动化处理!

大家好,这次我们会介绍如何使用xlwings将Python和Excel两大数据工具进行集成,更便捷地处理日常工作。说起Excel,那绝对是数据处理领域王者般的存在,尽管已经诞生三十多年了,现在全球仍有7.5亿忠实用户,而作为网红语言的Python,也仅仅只有700万的开发人员。Excel是全世界最流行的编程语言。对,你没看错,自从微软引入了LAMBDA定义函数后,Excel已经可以实现编程语言的算法,因此它是具备图灵完备性的,和JavaScript、Java、Python一样。虽然Excel对小规模数据场景来说是刚需利器,但它面对大数据时就会有些力不从心。我们知道一张Excel表最多能显示1048576行和16384列,处理一张几十万行的表可能就会有些卡顿,当然你可以使用VBA进行数据处理,也可以使用Python来操作Excel。这就是本文要讲到的主题,Python的第三方库-xlwings,它作为Python和Excel的交互工具,让你可以轻松地通过VBA来调用Python脚本,实现复杂的数据分析。比如说自动导入数据:或者随机匹配文本:一、为什么将Python与Excel
2022年4月28日
其他

再见PDF提取收费!我用100行Python代码搞定!

点上方“菜鸟学Python”,选择“星标”第471篇原创干货,第一时间送达大家在日常的工作和学习过程中,都少不了与PDF文件打交道,很多的小伙伴都面临着将PDF文件中的文字、图片和表格数据提取出来的问题。能够对PDF文件中的文字、表格等数据进行编辑,网上现存的PDF提取的软件都需要付费操作!小编今天就利用百行的python程序,来提取PDF文件中的文字、图片和表格数据。一起来看看吧。01.程序执行效果首先,还是通过视频展示的方式,来为大家展示一下PDF的提取效果:python库版本介绍本次程序涉及到多个python第三方库与python3的内置库,而且不同的python库版本对于程序的兼容性不一致,因此我们首先来介绍一下使用到的python第三方库版本。PySimpleGUI
2021年4月27日
其他

五一就要到了,我用Python制作一款钉钉低价机票提示器!

点上方“菜鸟学Python”,选择“星标”第466篇原创干货,第一时间送达清明小长假刚刚过去,紧接着就是五一小长假,不同于以往的三天假期,今年的五一假期足足有五天的时间,可以好好的出去玩几天。面对国内如此多的旅游地点,去哪里也是一个难以抉择的问题。小编今天为大家分享一个利用低价机票的提示器。每天定时的为大家分享关于低价机票的分享,如果大家不知道去哪里玩,但是刚好看到有心动的低价机票,不如就来一场说走就走的旅行,度过美好的五一小长假吧。01.程序展示通过程序的抓取和钉钉的提醒,可以方便大家每天在指定的时间间隔下收到关于低价机票的提醒,为了更方便大家对于程序有一个更好的了解,小编通过视频展示的方式来为大家进行演示。02.程序讲解通过上面的视频展示,让大家对于整个程序的执行效果有了直观的了解和认识,接下来,我们来按照程序的思路理清程序的执行过程,程序的设计主要分为以下的三个步骤,分别是:低价机票数据的抓取钉钉机器人的设置程序定时执行03.低价机票数据的抓取对于低价机票数据的抓取,这里程序抓取的是去哪儿网的低价机票数据信息,网址为:http://flight.qunar.com/site/lplist.htm,如下图所示:在去哪儿网的首页信息中,每天都有一些关于国内低价机票的分享。通过在界面上方选择出发城市,可以筛选不同城市的低价机票信息。对于该数据的抓取,需要分析网页的数据获取方式,其实不难,具体如下:上图中,通过开发者模式下的Network中,找到以qdclowprice开头的json文件,就可以看到对应的数据信息。通过对于json文件的Headers信息进行查看,可以发现,json数据获取的数据接口如下所示:其中关键词city指的是出发城市,date表示的是票价查询的日期。明白接口接口的构造方式后,接下来就可以开始程序的编写了,如下图所示:上图的函数中,首先通过构造请求链接,获取得到json数据,然后通过正则化匹配的方式,提取得到低价票的列表信息,最后将列表信息构造为字符串,保存到messages列表中去。04.钉钉机器人的设置利用钉钉机器人,可以自动化的提醒用户低价票的信息,钉钉机器人的设置需要大家首先在PC端下载并安装钉钉软件,然后在指定群中添加智能聊天助手,选择添加机器人,并来到下图的界面,选择自定义机器人。对于机器人更加详细的添加流程,大家可以翻阅之前为大家推送的文章(用Python做一个愿望清单,2020年计划让小美女来督促吧!),或者是通过网上查阅的方式添加自定义的机器人。设置好自定义机器人之后,便可以通过程序来使用钉钉机器人向指定聊天群中发送信息,大家需要首先安装dingtalkchatbot库,安装的命令就是大家非常熟悉的pip
2021年4月19日
其他

肝了一夜,用90行代码打造最强PDF转换器,word、PPT、excel、markdown、html一键转换

8).再见Python!我要学Go了!2500字深度分析!9).发现一个舔狗福利!这个Python爬虫神器太爽了,自动下载妹子图片点阅读原文,领廖雪峰大数据视频资料!
2021年4月7日
其他

牛逼!40行Python代码一键把html网页保存为pdf,太方便了!

8).再见Python!我要学Go了!2500字深度分析!9).发现一个舔狗福利!这个Python爬虫神器太爽了,自动下载妹子图片点这里,直达菜鸟学PythonB站!!
2021年3月8日
其他

嘿嘿!60行Python代码做了一个语音壁纸切换器,每天看心仪的小姐姐!

8).再见Python!我要学Go了!2500字深度分析!9).发现一个舔狗福利!这个Python爬虫神器太爽了,自动下载妹子图片点这里,直达菜鸟学PythonB站!!
2021年3月3日
其他

从万众期待到口碑扑街!唐探3令人失望,用Python来分析一下大家的评论

8).再见Python!我要学Go了!2500字深度分析!9).发现一个舔狗福利!这个Python爬虫神器太爽了,自动下载妹子图片
2021年2月15日
其他

牛逼,两百行Python代码带你打造一款《天天酷跑》游戏!

8).再见Python!我要学Go了!2500字深度分析!9).发现一个舔狗福利!这个Python爬虫神器太爽了,自动下载妹子图片点这里,获取新手福利
2021年1月12日
其他

宅男福利!我50行Python代码让小姐姐给你读Pdf

最近小编忙着给项目做文档,需要阅读大量的文献资料,长时间的阅读让本就不喜欢看书的我是又困又乏,所以想着,要是能有小姐姐在旁边读给我听该有多好。说干就干,小编整理了一下思路,晚上熬夜花了几个小时就完成了整个小程序,一起来跟小编学习一下吧。01代码的构思要完成该任务的设计,首先我们需要明确思路,整体的设计方案如下图所示:上图中,我们首先需要实现的是将PDF文章中,我们想要提取的文字提取出来,然后再将提取的文本内容,通过小姐姐文本朗读转化为MP3文件,保存到本地当中。明确思路之后,接下来我们就来看一下程序是如何实现的吧。02文字提取对于PDF文档中文字的提取,这里我们采用的是pdfplumber库进行提取,pdfplumber可以处理PDF中,包括文本、表格、格式在内的各种信息,小巧但是功能十分的强大。但是需要注意版本的使用,这里我们使用的python3.5环境下的版本号为0.5.25的pdfplumber。对于文本的提取,其程序如下所示:上述的程序中,我们首先打开pdf文件,并返回一个pdf的类对象,然后根据指定的pages数据,来提取指定页码的文本信息。我们来运行一下程序,看一下提取的结果如何吧。上述的红框中,左侧的是程序提取的结果,而右侧是PDF的文本,通过提取的结果来看,pdfplumber能够准确的提取出PDF中的文本信息。03文本转语音提取到文本信息之后,接下来就是将文本信息,转化为语音信息,并保存到本地,这里,小编采用了两种方式进行实现,第一种方式采用的是pyttsx3库进行转换,而另一种方式采用的则是百度AI进行实现。程序如下所示:程序首先采用判断的方式,如果形参baidu
2020年12月18日
自由知乎 自由微博
其他

再见Python!我要学Go了!2500字深度分析!

C和Python等语言,都是历经大浪淘沙,顺应时代发展的强大的编程语言。而今天要和大家分享的go语言,也是顺应时代发展的强大编程语言,被称为取代Python的语言。从2011-2019
2020年11月15日
其他

我总结的80页《菜鸟学Python精选干货.pdf》,都是干货

最近后台有很多小伙伴留言,咨询一些Python的问题,有一些是转行的小伙伴,有一些是文科的同学,竟然还有一些是初中生也关注了我们,非常感谢大家的支持。为了更好的福利大家,这次我们公开了一份内部的精选资料。一共有80页,45个知识点整理。这份资料来自我们的小密圈,我们公众号有一个内部的小密圈,里面有1000多人,累计发布了很多干货在里面,运营了有2年的时间,假期整理了一份,献给大家,希望这些干货对大家有帮助。里面有对入门常见问题的整理有大龄码农的学习Python的苦恼有高手进阶的杂谈技巧总结比如对于菜鸟一个菜鸟写程序的蝶变-1.我们完成一个程序,首先是让程序跑起来1).用最直接的方法,让程序先能work.2).比如直接用函数写,直接用假的变量,先把程序运行起来3).运行正常的逻辑,让程序跑通-2.先初步重构代码1).变量名,函数名字的重构2).函数的状态要不要有返回值3).if
2020年8月22日
其他

发现一个舔狗福利!这个Python爬虫神器太爽了,自动下载妹子图片!

对于Python的自动化测试或者是爬虫开发者来说,对于selenium库想必都听说过,selenium本身是作为Web应用测试工具,但是作为爬虫工具也有很广泛的用途。Selenium虽然好用,但是它大多数的时刻都是和Web的网页元素之间打交道,需要用到html网页的标签,CSS选择器等知识。虽然自动化程度较高,但是使用起来仍然不是很方便,上手也不是很容易。今天,小编就带领大家来认识一款基于Selenium的库——Helium。Helium库简介Helium库是基于Selenium基础上的更加高级的Web自动化工具,它能够通过网页上可以看见的标签和名称等信息来进行用户交互。我们可以用来进行点击键盘的按键、点击标签、滚动鼠标等一系列的鼠标和键盘操作。而Helium的安装也是非常的简单,如下图所示:大家只需要pip
2020年8月18日
其他

30个Python奇淫技巧集

我们的青铜菜鸟群最近加了很多人,有不少是学生加入的,在后台的留言跟我们说,时间紧任务重,又要考研,又要学Python,而Python里面的技巧又非常多,能否整理一份技巧集给我们。今天小编熬夜整理了一份,内容是基础篇覆盖了字符串,列表,字典和基础序列容器。不要小看青铜篇,这份资料里面收集了很多奇淫技巧,很多小编也是第一次遇到,非常值得收藏。下面我挑选几个给大家看一下,小编觉得都是非常经典的代码技巧。01.字符串拼接-生成器法用生成器yield来做字符串的拼接,我还是第一次遇到,在项目里面并不常见,但是如果是复杂的业务逻辑,需要缓冲字符串到时候可以试试。02.字符串关键字搜索我们字符串的搜索文件名,或者关键字结尾,很多时候都是用正则,或者是''.endswith(),其实还有一个内置的强大的函数fnmatch也可以用。03.字符串里面可变数据的动态替换好吧,我承认我大部分时间都用普通方法,学了Python这么久,才知道用format_map,这个不错。04.过滤列表方法通常我们分析两个列表里面的数据,进行排序的,比较普通的做法是合成一个字典然后进行排序,或者是两个循环,然后进行yield缓存。这里用compress这个内置模块一键搞定,真是很爽。05.列表搜索-堆函数对于嵌套的列表字典搜索排序,在项目里面非常常见,有了heapq这个函数,可以方便很多,以后要多用它。06.复杂列表分类-group法groupby配合lambda函数进行对复杂的数据结构进行分类,实在是太酷了。虽然都是小技巧但是万丈高楼平地起,所有的大项目都是一块一块的代码组成的,所有复杂的问题最后都是化成一个一个小的知识点来解决的,希望对大家有帮助。限于篇幅,小编就不一一展开30个技巧集,为了方便大家阅读,我整理成一份完整的pdf文件,大家可以细细阅读,然后思考体会。如何获取呢:1).扫描下面的二维码2).输入:青铜长按上面的二维码
2020年7月11日
其他

卧槽,神操作!一句查询让Python帮忙自己写程序

对于很多初入Python编程的同学们而言,对于Python程序的编写,往往会十分生疏,学会了Python的语法,但是转头就忘了,或者是想实现一个基础的功能,但是程序不知道怎么去写。自己去网上找相应的问题,然后挑选合适的程序进行修改,非常的耗时耗力。今天,小编就带领大家借助一个新的Python库来解决这个问题,让大家只通过一个问题查询的语句,便可以自动获得对应的程序,省略自己编程带来的烦恼。
2020年7月8日
其他

再见HTML ! 用纯Python就能写一个漂亮的网页

我们在写一个网站或者一个网页界面的时候,需要学习很多东西,对小白来说很困难!比如我要做一个简单的网页交互:要懂后端,比如Python里面的Django或者Flask,或者是Java里面的SpringBoot要懂前端,现在都叫大前端了(因为很复杂),比如前端的框架Vue/React,
2020年7月2日
其他

Python精选库大全,建议收藏留用!

Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多。而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器学习,金融领域,后端开发,云计算,游戏开发都有涉及。万丈高楼平地起,Python这座大厦能够如此强大,就是拥有强大的成千上万的库的支持,无数牛逼的轮子在支持这座大厦,今天我们来一起梳理一下,俯瞰整个Python宝库。小编大概列了一下整个Python库的应用的方法面面,粗略算算就有20几个方向。左右两边分两个方向,左边负责进攻(主外),每一项单独拉出来都是精品,都是Python应用里面拳头产品;右边负责守(主内),都是涉及底层的配置,算是整个大厦的地基。下面我们挑选每个领域的的精品库,展现给大家,看完之后,你一定会大叫,卧槽,这么多库我都没有见过~~1Python大厦的底层基建环境管理管理
2020年6月30日
其他

笑喷了,我用Python帮韦小宝选最佳老婆组合

端午放假在家,平时上班真的很忙很忙,没有时间休息!而码农放松的最好的办法躺着看电视剧煲电影,有的人是喜欢看电影,有的人是打游戏,当然还有的码农酷爱看动漫。小编其实三者都喜欢,而且还是一个武侠金庸迷,放假在家翻了翻金庸的电视剧
2020年6月28日
其他

我总结的80页《菜鸟学Python精选干货.pdf》,都是干货

最近后台有很多小伙伴留言,咨询一些Python的问题,有一些是转行的小伙伴,有一些是文科的同学,竟然还有一些是初中生也关注了我们,非常感谢大家的支持。为了更好的福利大家,这次我们公开了一份内部的精选资料。一共有80页,45个知识点整理。这份资料来自我们的小密圈,我们公众号有一个内部的小密圈,里面有1000多人,累计发布了很多干货在里面,运营了有2年的时间,假期整理了一份,献给大家,希望这些干货对大家有帮助。里面有对入门常见问题的整理有大龄码农的学习Python的苦恼有高手进阶的杂谈技巧总结比如对于菜鸟一个菜鸟写程序的蝶变-1.我们完成一个程序,首先是让程序跑起来1).用最直接的方法,让程序先能work.2).比如直接用函数写,直接用假的变量,先把程序运行起来3).运行正常的逻辑,让程序跑通-2.先初步重构代码1).变量名,函数名字的重构2).函数的状态要不要有返回值3).if
2020年6月27日
其他

用Python一键生成炫酷九宫格图片,火了朋友圈

作为一个男同胞来说,为了给女朋友拍一张美美的照片,着实需要花费很大的时间和精力,不仅仅需要从众多的图片中精心挑选,而且还需要有着超强的图片精修能力,才能得到一张张达到女友要求的图片,真心不容易啊~朋友圈发出去一张照片显得很单薄,有没有啥好的办法呢,小编今天就带领大家来制作一个微信的九宫格图片,发朋友圈一定能搏一把眼球!对于九宫格的朋友圈大家应该不会陌生,如下图所示,小编先用我最喜欢的一个动漫里面的女神焰灵姬做demo,下图就是焰灵姬做的一个微信九宫格的图片:也就是我们将一张完整的图片分割成9个不同的部分,然后利用微信的九宫格排列,组成一张图片,提升美感的同时,也让图片变得丰富起来。下面就跟随小编来看看是如何利用程序实现的吧。01.设计一个界面小编为了提升用户的体验,设计了一个用户界面,界面如下图所示:上图中,我们只需要按照提示输入图片的转换地址和转换后图片保存的文件夹地址,然后只需要点击“开始转换”即可完成。界面程序如下图所示:整个的界面,我们设置了几个关键的控件:例如Label,是用来在界面上展示文本信息的;而Entry则是用来让用户输入文本信息的控件;Button就是按键空间,对应了界面上的“开始转换”按键,其绑定了我们的转换程序self.Run函数;self.Run便是我们程序转换的主函数,它完成了对于一张图片的读入,并将其分割成9张图片,并保存9张图片的功能;02.敲黑板划重点,如何分割图片上面只是完成了外表的壳子的功能,可以认为是前端的功能,后端的图像的处理功能才是关键。这里就是用到了强大的cv2这个库。上面的程序一共完成了这么几步:首先将图形以较长边为基准,填充为正方形,这里为什么填充为正方形呢?因为微信图片显示九宫格的时候,都是按照正方形进行显示的。如果不填充为正方形,分割出来的会是长方形,会造成图片存在部分丢失的现象。当我们把图像填充为正方形,这样分割出来的图片依旧是正方形,不会出现图片部分丢失的问题。接着填充完之后,按照新图片的边长来分割图片,分割图片的边长就是新图片的三分之一最后我们将分割出来的图片保存到指定的文件夹内即可。03.效果展示下图就是小编分割出来后,进行微信朋友圈展示的效果图:看完效果图,大家是不是感觉瞬间档次就提升了呢。最后,小编以视频的形式为大家展示一下如何使用该程序:视频来了,一睹为快是不是有点酷啊,需要本篇源码的小伙伴,可以直接在下方获取!看百遍读千遍,不如动手做一遍,然后把生成的图在朋友圈秀一下。源码还有很多地方可以改进,欢迎小伙伴添砖加瓦,动起来!扫码输入:【九宫格图】获取本篇源码
2020年6月23日
其他

菜鸟也疯狂!8分钟用Python做一个酷炫的家庭随手记

每个月都有各种各样的开销,不当家不知道柴米贵呀!柴米油盐酱醋茶样样都要开销,吃的穿的,各种开销,每个月都没有啥结余,小编月初是富人,月底就光了。都说理财从记账开始,小编我用过很多记账软件,但是都不是很好用,对我来说太复杂了。个人喜欢极其简单的Todolist那种风格,于是我喜欢开始用文本来记录每个月的开销,小编的开销如下:账单:6月1.伙食费,-30002.零花钱,-10003.房租,-30004.车贷,-30005.工资,+100006.理财,+8007.朋友聚餐,-5008.买衣服,-5009.水电费,-10010.油费,-30011.交通补贴,+80012.货币基金,+60013.手机费,-100如果用短短的20行Python代码,分分钟把它变成一个炫酷的随手记的账单呢,其实很简单。我们学Python的目的就是学以致用,能解决日常问题的Python才是真正有趣的!01.第一步把上面的文本的内容复制到如下:bill=''''''声明一下变量,然后把文本的每一个月记录黏贴到字符串里面bill='''账单:6月1.伙食费,-20002.零花钱,-5003.房租,-30004.衣服,-10005.工资,+100006.理财,+8007.朋友聚餐,-5008.买衣服,-5009.水电费,-10010.油费,-30011.全勤奖,+100012.货币基金,+60013.手机费,-10014.水果,-30015.地铁+公交,-400'''02.处理数据虽然我们已经在内存里面声明一个变量bill来记录我们的月账单,但是我们需要进行加工,对数据进行切割和加工,还要进行清洗!好比你买会来一条鱼,我们要斩头去尾,去鱼鳞然后剔鱼肉。家庭的开销,我们分收入和支出两部分,而原生的数据,里面有中文,序列数字,标点,还有开销的数字,所以我们需要清洗并提取数据。先对账单进行头尾的处理,第一行是我们的账单的名字,剩下的都是具体的账单内容。03.切割数据我们把数据用推导列表进行展开,通过'-'认为是每月开销,'+'认为是每月收入。然后再对每一段数据进行清洗,取掉序列标号。接着把开销的字符串变成整数里面有大量的字符串,比如'-100','+1000',这些都是字符串,我们必须转为整型或者浮点型才能计算。04.计算开销明细经过上面的数据准备,我们可以动手进行计算,看看花了多少钱,还结余多少。>>收入:
2020年6月22日
其他

首播过亿,火爆全网,我分析了《乘风破浪的姐姐》,发现了这些秘密

最近,由芒果TV推出的综艺节目《乘风破浪的姐姐》,可谓是火爆了全网,堪称年度综艺前几名的存在,首播播放量便过亿!相比青春有你,这些姐姐虽然在年龄上可能不具有优势,但是她们身上散发的个人魅力还是相当了得,个个都是实力牌。方便大家更好的对选手们有一个全方位的了解,小编抓取了参赛姐姐们的信息,并带领大家一步步的看一下,从我们提取到的数据中能得到哪一些信息。01数据的获取首先,我们需要做的就是抓取到选手们的信息,这里,我们爬取的是公开在百度百科和维基百科上的选手信息。由于两个网站采用的都是静态的页面,所以抓取也相对简单,我们以较为复杂的百度百科抓取为例,来介绍一下程序的抓取。如下图所示:网页的源代码中对应着选手的一些信息,包括姓名,宣传照和职业等等信息。我们需要分析网页源代码来提取宣传照图片的地址、选手的姓名以及职业,部分程序如下图所示:上图中,我们利用GetPicSource函数首先提取了宣传照图片的下载地址;然后利用BeautifulSoup库来解析网页源代码,由于不同的div标签数量不一致,所以需要格外自己的分析,并进行解析;接着将我们提取到的信息进行保存即可。对于维基百科的信息提取也是同样的操作,最终我们抓取到的信息,包括了选手们的姓名,年龄,出生年月,出生地以及图片的下载地址,职业以及初始舞台分数等信息。02数据的处理对于信息提取完毕后,接下来就是对于数据的处理。我们先来看一下我们提取到的数据:我们可以看到,我们已经抓取到了我们需要的数据,接下来我们就可以对数据进行简单的清晰,并进行分析。对于宣传照的抓取和保存,可以简单的利用五行代码即可搞定,程序和提取结果,如下图所示:03数据的分析我们对于选手的年龄进行一下分析,这里需要注意的是,小编采用的是pyecharts1.8.1版本进行的可视化展示。同时pyecharts1.x和pyecharts0.x版本之间存在较大的差异。如果大家在运行源码时出现找不到模块的错误,大多是版本不正确引起的,需要大家格外的注意。好了我们接着进行程序和结果的展示:1).年龄的分布我们首先对年龄进行分段划分,然后对分段年龄进行可视化展示,如图所示,选手的年龄大都集中在33-40和26-33的年龄段,相比于其他选秀节目,《乘风破浪的姐姐》堪称是大龄选秀。2).职业分布对于选手的职业分布,我们可以看到,参赛的选手大多数演员和歌手出身,但是选手中存在许多身兼数职的现象,比如说某位参赛选手,既是歌手同时也是演员,可谓是演而优则唱的代表。3).出生地分布对于选手的出生地,我们只是选取了出生地在中国的选手,我们可以看到,选手中湖南选手是最多的,其次是四川的选手,从整体的南北方分布来看,南方的选手要多于北方。4).年龄vs得分关系最后,我们来看一下评分前五名的选手在年龄和初舞台评分上的关系,我们可以看到,前五名的选手得分都在86分以上,而她们的年龄则是分布在30岁左右。对于参加比赛的整体选手,她们的平均年龄为35岁,而评分前五名的选手,她们的平均年龄仅为30.8岁,可见,年龄因素对于成绩存在一定的反比例影响。以上就是小编今天为大家带来的《乘风破浪的姐姐》的一些解密,大家可以下载源码以及小编为大家下载好的数据,进行进一步的分析,发现更多的秘密,大家赶快行动起来吧。今天你看了《乘风破浪的姐姐》吗?欢迎留言区点评。需要源码可以在文末获取。618福利活动,当当4折起冲鸭!羊毛薅起来!当当618专享不到4折,Python书籍囤起来!近期原创热门:避坑指南!Python里面的这九个坑再见,付费录屏软件!我用70行Python代码打造免费版!真香!一行Python代码,帮你制作小姐姐的表情包学Python还是Java,
2020年6月19日
其他

Github获8300星!用Python开发的一个命令行的网易云音乐

最近在逛Github发现了一个非常有趣的库musicbox,是用纯Python打造的,收获了8300颗星。Python语言简单易学,好玩有趣,身边越来越多的小伙伴都开始学习Python。她的魅力非常大,不仅长期霸占了编程排行榜前三,而且拥有数以万计的开源库,这些轮子可以组合运用,创造出很多好玩有趣的项目。今天我们就来看一下这个酷酷的项目,一个命令行版本的网易云音乐,界面整洁漂亮,功能强大,值得学习!一共有17个功能,真的是麻雀虽小五脏俱全,加了很多的功能:320kbps的高品质音乐歌曲,艺术家,专辑检索网易22个歌曲排行榜网易新碟推荐网易精选歌单网易主播电台私人歌单,每日推荐随心打碟本地收藏,随时加❤播放进度及播放模式显示现在播放及桌面歌词显示歌曲评论显示一键进入歌曲专辑定时退出Vimer式快捷键让操作丝般顺滑可使用数字快捷键可使用自定义全局快捷键作者是一位张同学,看他的location是在上海。这个项目是用纯Python代码完成的,目前收获了8300颗星,非常厉害!竟然能把网易云音乐上的功能做了一个命令行界面,了不起,关键是界面还做的很酷!其实小编也是一个资深网易云音乐的爱好者,看到这个项目非常亲切,迫不及待的安装体验了一把。1安装使用虽然这个是一个命令行版的网易云音乐,但是播放器是不能省的,需要安装一个播放器mpg123,这个库其实就是对MPEG
2020年6月17日
其他

一道Python面试题,硬是没憋出来,最后憋出一身汗!

Python语言目前是最火的语言之一,语法简单,功能强大,最新的TIOBE已公布2020年6月的编程语言排行榜,Python已经连续多个月都在前三甲了,非常火爆!现在学习Python的同学越来越多,面试的环节,很多面试官让你任选语言进行编程。Python因为简单,很多小伙伴愿意用Python进行答题。最近我们的一个粉丝交流群,有一位同学跟我分享了他面试的经历。小李学了Python大概有2年多了,他跟我讲了前段时间面试某杭州大厂的一道面试题,注意是面试题,不是笔试卷。现场让你手写代码,压力山大啊~~也许是因为紧张的原因,也许是因为自己算法基础底子不深的原因,反正现场憋了很久,没有憋出来。到底是什么样的一个算法题呢,一起来看一下。1面试的题目题目:假设你手上有面值1块,2块,5块各若干张纸币,你现在需要支付给商家6元钱,请问你有多少种组合,列出每一种组合?要求:1).在白板上手写代码或者直接在电脑上写2).分析你的算法,如何优化3).对搜索的结果进行分析看起来这个问题似乎很简单,就是一个空间组合搜索,然后加起来的面值为6即可,但是现场面试给你思考的时间,不会超过1分钟。小李当时就心里咯噔一下,leetcode的题目少刷了,其实面试之前也准备了,刷了一些算法题,但是还是手生了一些。大家可以思考一下,如果是你的话,你先不看下面的答案,现场手写能写出来吗?思路:这个题目其实网上也很多类似的,就是钞票的选取方案而已,一般的解法都是递归。递归只要设计出口即可。如果我们的方案等于6元即退出,如果超过了6元就放弃,如果不足6元就继续添加更多的钞票即可。bills是钞票面额的列表(假如为[1,2,5]),然后target是目标值(假如为6),然后填入一个空列表的方案
2020年6月15日
其他

避坑指南!Python里面的这九个坑,坑的就是你!

Python里面有一些坑,让你防不胜防,菜鸟经常会弄晕,而学习多年的Python老鸟也会时不时中招。小编整理了9个坑,都是会经常碰到的坑,让你大呼我曾经也碰到过!虽然是小的问题,但是在实际的项目中,哪怕一个很小的错误,都会引起一连串的问题。有的时候,为了找这一个微小的bug要花费很大的力气,让人很郁闷。坑1.lambda自由参数之坑排序和分组的key函数常使用lambda,表达更加简洁,但是有个坑新手容易掉进去:但是实际却输出:
2020年6月12日
其他

真香!一行Python代码,帮你制作小姐姐的表情包,靠谱吗?

(我的IU女神)对于小姐姐的动态表情包,相必我们大多数人都不会拒绝,而且都会选择默默的将其收藏(不要问我怎么知道的),一方面小姐姐的美貌会让人赏心悦目,另一方面也显得朋友间的交流更加的充满动态感。为了更加丰富大家的“小姐姐表情包”,今天,小编就带领大家直接从视频中直接提取小姐姐的动态图,并逐步的深入,最终制作我们想要的动态表情包。我们今天的讲解会沿着下面的线路进行,先一下整个的思路:01.视频提取动态图首先我们来进行第一部分的讲解——从视频中提取动态图。这一部分,我们采用moviepy函数库进行实现,我们结合下图的程序来讲解一下我们是如何实现的:上述的程序中虽然短小精悍,但是做了很多事情:首先实例化了一个VideoFileClip类对象;然后我们将视频的时间范围根据自己的需求进行裁剪,其中参数中的(0,
2020年6月10日
其他

冲鸭!羊毛薅起来!当当618专享不到4折,Python书籍囤起来!

满150再减30元花120元买300的书优惠码有效期:6.9-6.20优惠码数量有限,先到先得哦01入门经典想打好基础,选择畅销榜的热门好书准没错!《Python核心编程(第3版)》作者:
2020年6月10日
其他

一个炫酷的Python库,让你的终端输出方式,让你逼格秒变高!

的五大神器程序员GitHub专注于分享GitHub上有趣的开源库包括Python,Java,Go,前端开发等优质的学习资源,分享程序员圈的新鲜趣事,热门干货,职场感悟。点的“在看”,我都当成了喜欢
2020年6月8日
其他

50行Python代码,一键获取微博热点

小编闲暇时喜欢看热点,会收集微博,微信搜一搜上的热点,了解一下最近的娱乐八卦新闻。但是在浏览微博的时候,想把微博热点给复制下来,但是却怎么也复制不了,鼠标一放上去就变成了“小手”的形状。还有微信上的搜一搜,微信热点,文字都不好复制下来。肿么办~~Python号称无所不能,既然是玩Python的呢,为啥不利用Python给自己打造一款截屏的文字识别工具,用来提升自己的效率。1整体的思路小编花了几个小时的时间,查阅了相关的资料,完成了这个小demo的设计,拿来与大家一同分享。我们要实现的目标就是,通过快捷键进行截屏之后,将识别的文字信息输出到屏幕之上或者是保存到本地的文件中。先来说说这个demo的实现流程,如下图所示:大概的步骤:第一步,我们利用快捷键进行截屏第二步,然后将截屏的图片进行保存第三步,我们利用百度文字识别API进行文字的识别,最后我们将识别出来的文字进行保存。2图像的截取和保存下面我们首先来完成第一和第二步,程序如下图所示:这里小编直接采用了微信的截屏快捷键,大家只需要在电脑上登陆微信电脑版,然后点击“alt+A”即可进行截屏,为了更加方便大家理解,小编这里制作了一张流程图,如下所示,大家先理解思路:然后我在给大家细细的一行一行讲解代码原理:当我们按下“alt+A"后,同时激活了微信截屏和程序继续执行;由于程序要从剪贴板中拿到图片,而剪贴板中的图片必须等待微信截屏中获取;接着程序必须等待5秒,让微信完成截屏并将图片放入到剪贴板中去,当完成这一步之后,程序才能继续向下执行;此时程序中最后两句,我们使用PIL库中的ImageGrab文件内的grabclipboard函数来获取剪切板当中的图片,并将其保存到本地的图片文件当中。我们通过下面的动图来展示一下效果:(动画盯着看10秒)3图像的识别和文字提取上面的程序完成了我们的截屏和保存,下面的程序则实现了第三步和第四步的处理。就是把图像里面的文字通过AI技术提取,然后保存。上述的程序中,我们直接采用百度文字识别的API接口即可(如何使用百度AI接口这个前面的历史文章提到多次)。程序以二进制的形式读入了图片,并将其以base64进行编码;然后我们构造了接口的请url,其中self.access_token是接口的访问令牌,我们通过post的方式来提交参数信息;然后获取接口返回给我们的结果,如果结果正确返回的话,那我们就将结果写入到本地的指定txt文档内;否则程序就会输出“something
2020年6月2日
其他

Python高手进阶|实战4大并发秘籍

Python从菜鸟进阶到高手,并发是一个必懂的阶段,很多同学对这个概念比较难理解,因为并发的库很多,而且比较复杂。其实并发在实际的生产环境是非常重要的一个知识点,应该说是必知必会,今天小编给大家实战总结一下,希望对大家有帮助。1实战爬取维基百科例子平时我们有很多任务,尤其是比较耗时的大量任务要处理,一定会用到并发处理。毕竟串行太慢了,下面我们去爬一个维基百科的网站:我们来爬取红框里面的导航文本部分,这是一个非常简单的爬虫(关于爬虫的文章前面写的太多太多了,大家可以翻历史文章)1).连接网页2).爬取网页函数设计的时候我们希望入参是一个元组(url,words),方便后面做并发处理网页非常简单,直接用requests取爬取,获取text用pyquery来解析网页,获取对国家的描述数据结构用字典对来存储2PK前做点准备工作1).如果我们现在要爬取100个国家的信息,有几种办法呢:最慢的串行爬取自己手动构建一个线程池,把要爬取的100国家都扔到共享队列里面,让多个线程共享爬取利用concurrent.futures标准库里的线程池来爬去用多进程来爬取,虽然网页请求是CPU密集型的,用进程有点浪费,但是我们作为对比,是可以试一下的用协程也叫微线程,是一种绿色线程,用来做高并发很爽2).为了准确的计算每一种方法的耗时,我们写一个函数专门来计算时间:下面我们用上面的5种方法逐一运行,为了简单期间我们统一爬取5个国家,每种方法上面用装饰器@cost_time来计算一下,看看到底哪种方便比较简单,速度又最快~~3慢慢的串行处理先来段最通俗的one
2020年5月30日
其他

卧槽!一行Python代码写的游戏,我能这样玩一天!

生成漂亮的词云Python和Go都很火,我要怎么选?漫画,假装自己是Python高手,学会这十招就可以看了范伟和葛大爷的电影,我决定用Python做个石头剪刀布点的“在看”,我都当成了喜欢
2020年5月28日
其他

一年一度的618来了,程序员畅销书籍走起!100-50,200-100!

没错一年一度的618来了,哪些书值得买?跟着畅销榜买总没错,小编盘点了最受程序员关注的异步畅销书,他们大部分来自于Pearson(培生)。购书要趁早,5月27-5月31日,在京东购书全场每满100减50元,每满200减100,不仅如此,我为大家申请到了专属优惠券,买减后叠加优惠券满200减20元、满400减40元,数量有限先到先得哦买书要趁早,断货买不到别后悔哦。01.如何获取优惠码公众号回复【京东1】,【京东2】抽奖获取叠加优惠卷限量500个满200-20,先到先得公众号回复【京东3】,【京东4】抽奖获取叠加优惠卷限量500个满400-40,先到先得02.如何使用优惠券1、优惠券兑换地址:https://u.jd.com/BD2tMZ2、输入优惠券兑换码3、点击兑换即可【03.菜鸟学Python
2020年5月27日
其他

80行代码!用Python做一个哆来A梦分身

对于分身术,大家想必都或多或少的从《火影忍者》的动漫上看到过,炫酷的影分身场面,每每看到都觉得非常过瘾。今天,小编其实是蓝胖子的铁粉,满满的童年回忆啊!今天Python来实现一个简单的哆啦A梦分身术,看看python是如何实现影分身之术。01.技术设计要达到影分身的效果,需要一个背景图片和一个前景图片。我们以背景图片为基础,然后不断的在背景图片上添加前景图片,从而达到影分身的效果。这里我们采用python内置的turtle库来实现这一效果。但是turtle库对于图片的使用,只能是gif格式的图片,这就带来了新的问题,那便是如何获取gif图片,我们平时使用的大都是jpg和png格式的图片。我们需要将jpg和png的图片转化为gif格式。02.难点处理对于前景和背景,通常是采用png和jpg格式的图片,因为png格式图片带有透明度,这样的话,将其放置在背景图片中不会存在背景而显得很突兀。普通的png转gif的方式,会丢失掉png图片的透明度,从而导致最后的结果中前景图片存在背景,从而出现下面的这种结果:这样的效果显然不合适,所以这里小编采用自己的程序处理方式,将前景图片转化为gif的格式,同时保持了gif图片的背景透明化,部分程序如下所示:程序的主入口是convert_image函数;函数首先获取一个图片中未出现的(R,G,B)元组colour;然后将图片中的背景填充为colour,在图片保存为gif的过程中;根据color_index函数来将图片中像素值为colour的部分透明化,便完成了从png图像到gif图像的转化。03.实行分身有了图片的转化之后,接下来就是要实现分身术的效果,我们需要将前景图片不断的出现在北京图片中的各个位置上,同时要保证前景图片位于北京图片的显示范围内。对于这部分程序的编写,其部分程序如下所示:上述的程序中,self.create_gif函数目的是将jpg或者是png图像转化为gif格式的图像。而self.
2020年5月26日
其他

让你纵横 GitHub 的五大神器

上都会有直接浏览代码的需求,如果有的项目层级比较多,浏览代码就很不方便,每次点击一个项目文件后,整个项目列表就会隐藏,想看其他文件只能会退到后再次进入,这就很蛋疼。Octotree
2020年5月24日
其他

值得收藏!8大技巧,带你了解菜鸟和高手的区别!

对于Python编程者而言,或许大家都认为Python是非常简单易学的,在学习一段时间的Python之后,都认为自己的Python编程水平已经非常好了,但是python编程绝对不是简单的几句语法就可以囊括的了。Python语言的简洁性,易读性,和高级语言等特点需要我们不断的在日常的学习和练习中不断提高,为了方便大家对自己的编程等级有一个大概的了解,今天小编就从几个方面来带领大家区分一下,初级和中级python编程者的区别。1.解决问题的能力作为一个编程者,面临的一个大的问题就是解决bug,因为我们的程序不可能从始至终一点错误都不出,如何定位错误的发生,以及快速而高效的给出最佳的解决方案,是区分初级编程者和中级编程者的一个特征,对于编程者而言,不断的从解决bug的过程中累计经验,也是一个提升自己编程能力的有效途径。上述函数中,由于局部变量未初始化导致报错,我们可以采取异常处理机制来捕获错误,然后采用改变全局变量值和不改变全局变量值的方式来解决错误。2.对于问题的触类旁通在平时的工作和学习中,我们经常会碰到相似的问题,我们需要能够从两个问题中提取共性,并不断的完善代码,使代码的鲁棒性更加好,逐步提高对于代码的复用性,是我们提高自己编程能力的一个途径。例如,我们现在要获取一个文件的类型名称,例如,我们想获取py文件的类型,我们可以直接对传入的字符串执行下列函数:对于py文件这样的程序没问题,但是对于图片文件就不合适了,那么这两个文件的共性是什么呢?那就是文件类型前都有一个”.”我们便可以改进我们的函数:我们通过改进程序改进了代码的鲁棒性,同时,我们可以利用os库,直接一行代码就可以进行解决。3.理解程序能够运行的原因对于
2020年5月22日
其他

太赞了!Pdf转Word,我用Python 轻松搞定表格和水印!

继上一次为大家推出了将pdf转word之后(卧槽!Pdf转Word用Python轻松搞定!),引起了大家的热烈讨论,我也总结了大家的一些意见和建议,今天就进一步的为大家推出一个新的版本。从pdf中提取表格数据,并保存到本地的excel文件当中,并且还为大家加入了添加水印和去除水印的功能。虽然在去除水印的效果上可能不如付费的项目那么好,但是也足够大家在日常生活中进行使用,下面我们就一起来看看吧。01.如何提取表格首先要面临的第一问题就是如何提取pdf中的表格,如下图所示:我们需要将上述的表格进行提取,并保存到本地的excel文件之中,程序如下所示:上述程序中,我们利用pdfplumber库来打开一个pdf文件,然后如果我们想要提取某几页的表格,可以在pageindexs这个形参中指明,否则我们就提取pdf文件中所有的表格信息,并保存到我们的本地excel表内,结果如下图所示,我们提取了pdf中所有的表格:02.水印的处理接下来就是水印的处理,我们先来进行添加水印,也就是给我们的pdf文件添加我们的专属logo,这里我们添加的是图片水印,效果如下所示:我们的程序也很简单:上述程序中,我们首先将水印图片利用word保存为pdf格式,然后通过PyPDF2库中的PdfFileReader类来读取图片水印并通过PdfFileWriter添加到我们指定的pdf中,完成图片水印的添加。既然有图片水印的添加,那肯定有图片水印的去除,其达到的效果就是上述程序达到的相反效果,去除图片水印的程序如下图所示:我们利用fitz库来打开pdf文件,并统计里面的图片文件,因为我们的图片水印也是图片,所以能够得到水印图片的信息,我们打印出来图片的信息,其信息中的索引2和索引3就代表着图片的大小,我们根据图片的大小判断是否为水印图片,来隐藏pdf文件中的水印图片,达到去除水印的目的。上述的程序针对的是图片水印,但是,我们日常面临的水印都是背景水印,类似于下图的情况。这种情况下,上述的程序就不管用了,但是我们还有办法,就是利用像素进行处理,我们将pdf转换成图片,然后调节图片的对比度和亮度来达到删除水印的目的,然后将转换完后的图片转换为pdf即可,部分程序如下图所示:上述程序中,是利用fitz库将pdf文件中的每页pdf转化成指定大小的图片文件,并保存到指定的文件夹内。最终转化后的结果如下图所示:上图我们可以看到,我们成功的删除了背景水印,但是由于调节的原因,对于保留的文本也有一定的影响,但是影响不是很大。如果大家感兴趣的话,可以借鉴ps的处理技术,通过背景水印模板来去除水印,达到更好的去除效果,但是这需要水印模板和我们pdf模板中的水印在位置,形状和大小等方面完全一致,要求比较高,不如上述方法来的简单。以上就是小编今天为大家带来的分享,我们完成了对于表格的提取,和图片水印的添加和去除以及背景水印的去除,大家也赶紧动手应用起来吧。后记自学编程的过程是很痛苦的,有的时候没有人指导,慢慢的会变成从入门到放弃,可能懂的人只要花1-2分钟就能帮你解决的问题,不懂的人要折腾几个小时。最近不断的有小伙伴希望我们建一个交流群,有想加入的同学,可以跟小助手联系。这个群的目的如下:1.
2020年5月19日
其他

王者归来!2020 年 5 月编程语言排行榜,Python竟然排老三

每个月都会公布一次编程语言的排行榜,这份排行榜排名基于全球技术工程师、课程和第三方供应商的数量,其中包括了流行的搜索引擎以及技术社区,如
2020年5月16日
其他

我的神!用Python竟然还能做一个文字套娃

我打赌,学会这6招,谁再敢笑你的Python程序慢!点击阅读原文,直达菜鸟B站大本营
2020年5月13日
其他

卧槽!Pdf转Word用Python轻松搞定!

大家在日常的工作学习过程中,都会遇到一个问题就是将pdf中的文本内容转化为word的形式,也就是从只读变成可读写的形式。面对这种情况,大家大都采用网上的工具,但是网上的工具良莠不齐,很难达到我们的需求。今天,小编就带领大家利用python来实现如何将pdf的内容转化为word文档。同时我们还将提取pdf中的图片,保存到我们的指定文件夹内。01.文字的提取我们首先要做的是对于pdf中文本的提取,如下图所示:Pdf中文字是只允许我们进行只读,但是无法进行更改,所以我们要做的就是提取pdf中的文字信息,然后将提取到的文字写入到word文件当中,让我们能够进行后续的改写。对于文字的提取,我们利用的是pdfminer函数库,其主要的函数如下图所示:程序首先利用get_content_from_pdf函数来返回pdf中提取到的数据;然后分别创建了PDFResourceManager对象来保存共享数据内容,PDFPageAggregator对象来将资源对象处理成我们需要的格式,而PDFPageInterpreter则是用来处理页面的内容;程序中page_index用来帮助我们设定需要提取哪几页的内容,对于我们需要提取的页面,通过创建的PDFPageInterpreter对象来对页面信息进行解释;最后通过PDFPageAggregator对象来对数据进行处理;这里的layout中就包含了页面解析出来的各种对象。包括文本,图片等信息。但是小编发现,对于图片的提取,pdfminer的效果很不好,所以后面针对于图片的提取,小编采用的fitz库进行单独的处理,取得很好的图片提取效果。说了这么多,我们先来看一下对于文本的处理结果。我们的pdf是一个两页的pdf文档,我们只让程序去提取第一页的文本,从上图可以看出,程序完整的提取出第一页的文本,没有任何的错误。02.图片的提取有了对于文字的处理,接下来我们就来看一下如何提取pdf中的图片,并将其保存到本地。对于图片的提取,程序如下图所示:上述的程序中,我们利用fitz库来提取pdf文档中的对象,然后通过字符串匹配来判断对象是不是图片类型,如果不是的话,我们直接进行跳过即可。如果判断对象是图片类型的话,我们边可以通过创建PixMap对象来提取图片,并保存到我们指定的路径下即可。结果如下图所示:上图可以看出,我们正确的将图片进行了提取,从而达到了我们的图片提取的目的,而且小编也尝试过多个图片的提取,同样也是没有任何压力。可以在短短的几秒内完成pdf文档的所有图片的提取。以上就是小编为大家带来的pdf转word的提取,我们经过讲解,不仅仅完成了对于pdf文档中文本的提取,而且还完成了对于图片的提取,从而大大的缓解我们工作的压力,提高了工作的效率,大家也赶快下载源码,应用起来吧。需要本篇源码,长按上面的二维码后台输入:pdf近期热门:●
2020年5月11日
其他

牛逼操作!我用Python做了一个编程语言20年的动态排行榜!

在编程语言的舞台上,一直有着谁是最好的语言的竞争,小编虽然一直用着几种编程语言,但是感觉个人的想法不能代表着大家的想法。虽然关于最好语言的争论从未停止过,但是关于编程语言的热度排名,我们可以从TIOBE
2020年4月23日
其他

我打赌,学会这6招,谁再敢笑你的Python程序慢!尤其是最后一大招!

点击关注上方“菜鸟学Python”,设为“置顶或星标”,第一时间送达干货。对于Python编程,大家想必都或多或少的掌握了不少知识点,但是python为人所诟病的一大缺点是其运行速度比较慢。其中一大主要的原因是python是动态的,解释性的语言,而非静态的语言。而这就意味着python解释器在执行程序时,并不知道变量的具体类型。例如C++程序中,int
2020年4月21日
其他

我用Python分析了《青春有你2》109位漂亮小姐姐,真香!

图片来源网络当下,最火的综艺,最具有话题性的综艺莫过于《青春有你2》了,里面不仅仅有爱打篮球的坤坤,而且还有109位漂亮的小姐姐,她们不仅为我们带来精彩纷呈的表演,还为我们带来了很多话题梗,表情包,像是“淡黄的长裙,蓬松的头发”,大家或多或少都会听过这句话。当然了,这些话题和表情包的广泛传播,代表着我们对选手和节目以及各位导师的喜爱,正是因为喜欢,所以大家才会去讨论。今天,小编就通过Python来为大家介绍一下这109位美丽的小姐姐吧。01数据获取首先我们通过爱奇艺的官方公布的助力网站,来获取小姐姐们的一些数据。包括姓名、年龄、身高等信息,以及他们的照片信息。这里我们通过爱奇艺的官方助力网站,来获取小姐姐们的照片信息。我们通过爬取网页动态加载的json数据,获取到每一位小姐姐的信息,包括照片,姓名和排名信息,程序如下图所示:上述程序中,我们首先抓取并解析json数据,然后逐个提取选手的姓名以及图片的链接地址并保存到本地。接下来我们就去获取选手的身高,年龄等信息,这些数据,小编通过维基百科搜索《青春有你2》进行获取的。由于网页属于静态网页,所以爬取相对简单,程序如下图所示:上述程序中,我们获取网页源代码并进行解析,然后获取每位选手的信息,由于网页给出的是繁体字,所以我们将其转换为简体字,这里抓取的数据和我们第一部分抓取的数据,其相同的部分是选手的姓名。所以我们可以利用这一点,将两部分进行合并,进行保存。02数据分析获取数据之后,我们接下来来看一下选手们的信息分布。1).对于选手的年龄分布我们剔除了4位没有显示年龄的选手。可以看出,选手最多的年龄分布在20-23之间,而26-29之间的年龄人数相对较少,看来想要出道真的需要趁早啊。2).对于身高的分布我们可以看出,选手身高在167~169之间,这样的身高真的是非常完美了。选手最矮的身高也是158厘米,看来对于身高,太矮的也是不行的。3).对于选手的籍贯分布这里我们只是关注了国内的情况,对于其他国家,例如日本和马来西亚,并不在我们的统计范围内。可以看出,来自山东的人数是最多的,而在南方省份中,四川是人数相对较多的。这对于想要找美丽小姐姐的朋友,或许会有一些启发吧。对于选手的经济公司,可以看到,丝芭传媒和个人训练生推出的新人遥遥领先其他公司,丝芭传媒中,被大家熟知的SNH48组合,可谓是非常火爆的,鞠婧祎小姐姐就曾是SNH48的成员哦。4).颜值分析最后,我们来看一下选手的颜值分析吧,这里,我们通过百度AI的人脸颜值分析,来为选手的颜值进行打分。首先我们来看一下爬取的部分选手照片:小编不仅感叹“我好了”!闲话少说,我们来看一下程序
2020年4月8日
其他

我用动画展现Pycharm十大实用技巧

macOS)。将光标放在当前行中的任何位置(刚刚完成编辑),然后可以使用正确的缩进获得空的下一行。对于上面的行,请使用“在当前位置之前开始新行”(Ctrl-Alt-Enter
2020年4月7日
其他

80%的人都不知道,全球Python库下载前10名

题图:漫威宇宙英雄Python的简洁性,不仅仅在于其语法简单,还有各种python库函数的支持,为大家节省了大量的时间和精力,所以网上有人戏称python的编程者为调包侠。但是你知道全球最受欢迎的python库嘛?今天小编就从PYPI网站的过去365天的python库下载量上,来看一下全球最火的22个python库。01.Urllib3Urllib3在过去365天中,下载量达到了9.55亿次。Urllib3是一个功能强大的,用于http客户端的python库,相比于python标准库中的urllib库,Urllib3提供了更全面的特性,包括线程安全,客户端SSL/TLS验证等,不仅如此,Urllib3广泛的被其他库依赖,有接近1200个库依赖Urllib3库。Urllib3的使用也非常的简单,如下图所示:图中我们创建请求对象,然后请求www.baidu.com网站的信息,输出状态码和返回的数据信息。02.six库six库是对于python2和python3的兼容库,使用six库可以使写的代码不用进行修改就能在python2或者python3的环境下进行运行,如下图所示:我们可以看到,six库对Python2和Python3的名字等做了统一,比如在Python2中,字符串的类型使unicode,而在python3中,字符串的类型是str,Python3叫,那么就可以使用six.string_types的类型。如果运行在Python2上,six.
2020年4月3日