平凡而诗意

其他

实用工具 | 6款免费OCR工具,第一款是神器

每当工作和学习中遇到PDF文档和文字图片时,都会非常令人头疼。重复性且无异议的劳动,让人心力憔悴,随着OCR技术的成熟,越来越多的人开始考虑利用OCR解决PDF和图片文字识别问题。近两年OCR方面的工具层出不穷,但是真正经得起考验的却少之又少,大多数都是借势营销、汲取利益的噱头,本文就来介绍6款强大的OCR工具,覆盖网页端、PC端、手机端,总有一款适合你,文末有下载方式。本期内容图片和PDF是我们日常学习和工作过程中接触较多的文件存储方式,它的确对数据的传输和内容的安全性带来了便利,但是,也为内容使用带来了一定的麻烦--需要重复性的劳动。每当我们需要PDF或者图片中的文字,用于编辑或者翻译时,这时候就开始让人头疼,暴力复制会引起很多格式的错乱,最终只能无奈的重新输入一遍。重新输入对于篇幅较小的可以考虑,但是对于内容较多的却让人望而却步。随着这两年OCR[1](Optical
2020年2月9日
其他

PyHubWeekly | 第五期:秒级处理十亿级表格数据

练手缺少数据?Pandas处理十亿级数据效率低下?想要获取最新的股票/期货数据?希望学习更多Python冷门知识?本文都将满足各位的这些需求,下面就来详细看一下本期的PyHubWeekly。本期内容PyHubWeekly每周定期更新,精选GitHub上优质的Python项目/小工具,本期为大家推荐GitHub上4个优质的Python项目,它们分别是:•tushare•python-cheatsheet•vaex•sh•python-small-examples下面分别来介绍一下上述5个GitHub项目。tushareStar:8.8k链接:https://github.com/waditu/tushare数据作为当前很多应用场景是至关重要的一环,例如,计算机视觉、数据分析,没有数据,后续的开发工作和算法准确性就无从谈起。我们在kaggle、ImageNet能够找到很多开放的数据资源用于我们的开发和研究工具,但是,这些数据这些数据更过的是偏重于工业,更重要的它们都是静态数据,也就是说不能及时的对数据进行更新迭代。金融是数据分析应用非常多的一个方向,也是和我们生活比较密切相关的一个方向,例如,股票等。
2020年2月8日
其他

实用工具 | 一款丰富强大的Python绘图工具

Python受欢迎的主要原因之一就是它丰富的工具包,画图是我们在开发过程中非常常见的一种场景,因此,画图工具自然不胜枚举。其中,比较知名的就是matplotlib[1],它可以覆盖我们日常工作中大多数场景。但是,它自身也有诸多弊端,例如,对新手不够友好、多图展示和离线查看比较麻烦。本文就来介绍一下另一款强大的Python画图工具--pyecharts,它可以作为matplotlib的有力补充。前言可视化是一种给人最直观感受的方式,当我们做数据分析、算法验证、效果展示时,绘图就成了一种非常有必要的手段。就如同,我们要看近几个月的股票走势,当看到成千上百个连续数据点时,很难从中发掘出什么规律,但是,当把它按照一定维度绘制出来,就能对股票的走势一目了然。提到Python绘图,很多人第一时间会想到matplotlib,的确,它是Python中使用最多、应用最为广泛的一款Python工具包。但是,在使用matplotlib的过程中我也感受到了一些让我觉得不足的场景:•多图展示•离线查看•动态效果•图像种类多图展示当我需要把多张数据结果在同一个画布上展示出来时,就需要结合循环、subplotlib等方式,而且需要代码冗长,另外,最为重要的是当展示在同一张画布时灵活度较小,而且图像大小会受到一定局限。离线查看在有些时候,使用matplotlib绘图,窗口会随着程序的终止而自动销毁,虽然可以借助matplotlib中保存图像的函数解决问题,但是保存后会损失掉原图像中的部分信息,例如,动态效果。动态效果有些时候需要绘制三维等复杂图像,或者自带动态效果的图像,由于matplotlib的UI是基于比较老的tkinter开发的,所以,会出现明显的卡顿和不流畅现象。图像种类matplotlib能够满足我们日常工作中大多数场景,它包含柱状图、散点图、折线图等等,能够满足大多数数据分析的场景。但是在一些特殊场景却捉襟见肘,例如,地图、仪表盘、水球图、词云图。因此,本文就来介绍另一款强大的绘图工具pyecharts[2]。在介绍pyecharts之前首先来了解一下Echarts。Echarts技术栈中和可视化最为密切的应该就数JavaScript了,当我们浏览网页、使用基于js开发的分发工具时,会被它的可视化效果惊艳到,因此,能够利用JavaScript开发一款图表工具?Echarts的回答是肯定的。ECharts,缩写来自
2020年2月6日
其他

PyHubWeekly | 第四期:清理无效代码,给你的项目瘦瘦身吧!

往期精彩回顾Python参数配置库ConfigParser详解【进阶Python】第十讲:可变对象与拷贝迫不及待把这款开发神器推荐给大家!抛弃bash,拥抱zsh!文章好看就点这里
2020年1月23日
其他

抛弃bash,拥抱zsh!

before.”,的确,当使用这款命令行工具之后,我就开始一发不可收拾,一直使用到现在。这里需要说明的是,oh-my-zsh和zsh并不是等价的。zsh(z
2020年1月22日
其他

迫不及待把这款开发神器推荐给大家!

Code逐渐成长为一款最受欢迎的IDE之一。它具有丰富的插件、远程开发、轻量化、配置便捷等优势。Gitpod就是一款基于VSCode
2020年1月20日
其他

【进阶Python】第十讲:可变对象与拷贝

第三期:有了这款Python小工具,再也不用担心复杂Linux命令Python参数配置库ConfigParser详解Github上那些简单且值得推荐的Python小工具实用工具
2020年1月19日
其他

PyHubWeekly | 第三期:有了这款Python小工具,再也不用担心复杂Linux命令

fire.Fire(Calculator)接下来,我们可以在命令行下调用对应的接口,也可以通过参数名称直接传参,>
2020年1月17日
其他

Python参数配置库ConfigParser详解

1.2读取并输出结果,print(config["section_1"].getint("a"))print(config["section_1"].getfloat("b"))#
2020年1月15日
其他

PyHubWeekly | 第二期:GitHub上优质的Python项目

some_dict[5]"Python"按照正常的结果some_dict[5.0]不是应该输出“JavaScript”吗?为什么输出了“Python”?下面就是解释,5.
2020年1月11日
其他

Github上那些简单且值得推荐的Python小工具

那些细节教你如何做到这一点,比如,何时使用异常、怎么给变量起名、怎么编写条件分支等等,看似简单的可能也是最难的地方。5.
2020年1月3日
其他

实用工具 | 2款播放器让你免费听遍全网无损音乐

分布式消息发布订阅系统Kafka从搭建到使用教程
2019年12月29日
其他

大数据 | Spark机器学习工作流开发指南

1.2之前它携带的机器学习库是MLlib,它包含了聚类、逻辑回归、SVM等常用的机器学习算法,因此,它也得到了广泛的应用。但是,在机器学习工作流、数据格式、性能方面有所限制,因此,在Spark
2019年12月24日
自由知乎 自由微博
其他

实用工具 | 你距离PS大神只差这6款免费在线工具!

分布式消息发布订阅系统Kafka从搭建到使用教程
2019年12月22日
其他

简易教程 | 分布式消息发布订阅系统Kafka从搭建到使用

中一些专业术语。Producer:消息生产者,负责把产生的消息发送到Kafka服务器上。Consumer:消息消费者,从Kafka服务器读取消息。Consumer
2019年12月21日
其他

教程 | 一文搭建你的第一个免费专属博客

Date()/36e5)];修改后:.src='/static/api/js/share.js?v=89860593.js?cdnversion='+~(-new
2019年12月20日
其他

办公效率 | 让你突飞猛进的10个Word技能

上下对齐遇到需要上下对齐的情况怎么办呢?不断的敲空格吗?这样太低效了,为什么不试试标尺功能呢?使用对齐制表符,轻松解决这个问题。选择制表符,选择制表符位置,tab键:9.
2019年12月16日
其他

学习工具 | 推荐10款提升自己的优质APP

收下这3款工具,再也不用担心英语翻译!我最终还是选择了VS
2019年12月8日
其他

Google | Python编程规范指南

code的文章中提到了TODO注释,这是一个良好的习惯,对临时代码进行TODO注释或者FIXME注释,能够很容易定位到即将解决的问题所在处。导入模块格式:每个导入应该独占一行。#
2019年12月1日
其他

实用工具 | 收下这3款工具,再也不用担心英语翻译!

邀请我建了一个QQ学习交流群,旨在“分享、讨论、学习、资源分享、就业机会、互联网内推、共同进步!”,感兴趣的可以加一下,也可以添加我的QQ~QQ群:953760111QQ号:498073774135网页、英语这看似毫不相关的两个词汇在我们大多数工作场景都会接触到。我们需要从各种不同的网站快速获取我们需要的知识,相对于参差不齐的中文网站,有很多英语网站提供的答案更加靠谱,例如,Stack
2019年11月30日
其他

我最终还是选择了VS code!

Runner这是一款支持C、C++、Java、Python等主流编程语言快速运行的插件,它能够便捷的运行当前活动页代码文件、能够运行选定代码段、运行自定义命令,对于调试代码具有很大的帮助。▲END
2019年11月22日
其他

开发工具 | 即将jupyter的新一代notebook

11上进行成功测试,如果其他JDK版本不成功,可以切换一下Java版本。安装Python依赖包为了执行Python,需要配置Python3.X和pip3.x,然后执行下面命令安装一些依赖包,$
2019年11月18日
其他

【动手学计算机视觉】第十八讲:卷积神经网络之GoogLeNet

Challenge)中出现了两个经典、影响至深的卷积神经网络模型,其中第一名是GoogLeNet、第二名是VGG。没错,本文的主角就是2014年ILSVRC的第一名--GoogLeNet(Going
2019年11月17日
其他

效率工具 | 一款基于深度学习的代码自动补全神器

CSS和Bash这22种编程语言。PythonJavaC++支持的编辑器首先要注意,我前面所说的是7类编辑器,而不是7款,它支持vs
2019年11月16日
其他

【进阶Python】第八讲:代理模式

wrong!")然后就是实现Client来调用对应的功能,为了测试上述代理的功能,使用3个测试样例,密码错误,用户名正确;密码正确,用户名错误;密码正确,用户名正确;密码错误,用户名正确def
2019年11月15日
其他

实用工具 | 让动画从1080p秒变4k

解压复制到指定文件夹把上一步下载HLSL压缩包解压,放到下面路径,C:\Users\YourUserName\AppData\Roaming\MPC-BE\Shaders4.
2019年11月7日
其他

2019年双十一有哪些值得购买的东西?

什么是值得买?我个人对购物可以说是一窍不通,虽然手机上也安装了某宝的APP,但是基本处于几个月不打开一次的状态。因此,无论各大电商平台活动搞的多么火热,我都是无动于衷,也不关注,今年依然是这样。
2019年10月31日
其他

强烈推荐 | 竟然有这么优质的github项目!

不是一个标题党,想出这么一个名称的确有一些自卖自夸的感觉。一直以来,我推荐了很多其他人的项目和开源的实用工具,这一次我鼓起勇气来推荐一下自己的开源项目,虽然对比于这个标题存在很大差距,甚至在有一些高手眼里有一些班门弄斧的感觉,但是这也的确是整合八个月来的心血,我也一向坚持一个原则,如果能够让一个同学觉得有用,这就值了。下面,开始正文......
2019年10月29日
其他

【进阶Python】第七讲:接口与抽象基类

class,ABC),提到这个概念应该会马上联想到面向对象、继承。作为继承的一种,它拥有继承中代码共享、提高代码的重用性等优点。例如,下面示例,class
2019年10月28日
其他

【动手学计算机视觉】第十七讲:卷积神经网络之VGG

2款强大的C盘清理工具【进阶Python】第五讲:迭代器与生成器【动手学计算机视觉】第十五讲:卷积神经网络之LeNet【动手学计算机视觉】第十六讲:卷积神经网络之AlexNet文章好看就点这里
2019年10月27日
其他

【进阶Python】第六讲:单例模式的妙用

Server,我们需要通过host、user、passwd来连接数据库进行读取数据,这时候就需要一次认证,多次调用,请注意这句话,很关键。普通模式我们首先来实现一个连接SQL的类,class
2019年10月19日
其他

实用工具 | 2款强大的C盘清理工具

Tool只需要1分钟内就可以完成垃圾的扫描,我说的1分钟是对绝大多数机型,如果性能好一些的电脑10秒内即可完成扫描。最后还需要补充3点,Windows
2019年10月16日
其他

【动手学计算机视觉】第十六讲:卷积神经网络之AlexNet

Hinton的身影。AlexNet之所以这么有名气,不仅仅是因为获取比赛冠军这么简单。这么多年,目标识别、目标跟踪相关的比赛层出不穷,获得冠军的团队也变得非常庞大,但是反观一下能够像
2019年10月13日
其他

实用工具 | 推荐3款令人惊艳的截图工具

你真的会用jupyter吗?【进阶Python】第五讲:迭代器与生成器【动手学计算机视觉】第十五讲:卷积神经网络之LeNet文章好看就点这里
2019年10月11日
其他

大数据处理 | Spark集群搭建及基本使用

PYTHONPATH=$SPARK_HOME/python:$SPARK_HOME/python/lib/py4j-0.10.7-src.zip:$PYTHONPATHexport
2019年10月3日
其他

大数据处理 | HDFS文件系统配置及基本使用

jpsHDFS基本使用HDFS的使用和Linux命令非常相似,例如上传数据用put,创建目录用mkdir,查看目录内容用ls,删除目录用rm,但是也有不同之处,下面就来看一下简单的示例,创建目录$
2019年9月30日
其他

【进阶Python】第五讲:迭代器与生成器

相关文章【进阶Python】第一讲:开篇【进阶Python】第二讲:装饰器【进阶Python】第三讲:类的特殊方法(上篇)【进阶Python】第四讲:类的特殊方法(下篇)文章好看就点这里
2019年9月28日
其他

开发工具 | 你真的会用jupyter吗?

development),否则下方插件是不可选状态。我们可以通过命令来管理开启或关闭某个插件,但是我觉得还是通过直接勾选我们需要的插件效率更高。选择插件我们从上面可以看出,jupyter
2019年9月15日
其他

【动手学计算机视觉】第十五讲:卷积神经网络之LeNet

0.9953125准确率为99.5%,可以看得出,在效果方面,LeNet在某些任务方面并不比深度卷积神经网络差。打开tensorboard可以直观的看到网络的结构、训练的过程以及训练中数据的变换,$
2019年9月14日
其他

效率工具 | 神器AutoHotkey使用教程

Hotkey!return看完第一个动作的介绍,应该很容易理解这个动作,第一行的含义是ctrl+j快捷键。第二行的含义是发送一段字符串。第三个动作:快捷字符输入“This
2019年9月12日
其他

【动手学计算机视觉】第十四讲:正则化之Dropout

detectors《深度学习》资源获取我把参考文献中列出的4篇文章和《深度学习》这本书籍的电子版进行整理共享了,感兴趣的可以关注公众号,回复关键字“dl”获取。▲END
2019年9月1日
其他

【进阶Python】第四讲:类的特殊方法(下篇)

输出3---------------------------------------------------------------------------KeyError
2019年8月28日
其他

【动手学计算机视觉】第十三讲:批量归一化

tf.nn.batch_normalization(conv_1)relu_1
2019年8月25日
其他

实用资源 | 推荐6个高赞有趣的Github项目

music。网易云音乐是很多人喜欢的一款音乐播放器,我也不例外,但是发现它上面的音乐越来越少,当你想听一首歌时发现,它竟然是灰色的,也就是不能听。有了这个项目,它可以从QQ
2019年8月23日
其他

【动手学计算机视觉】第十二讲:激活函数

ReLU函数、高斯函数、softmax函数等,虽然函数有很多,但是比较常用的主要就是逻辑函数和ReLU函数,在大多数卷积神经网络模型中都是采用这两种,当然也有部分会采用Leaky
2019年8月21日
其他

【进阶Python】第三讲:类的特殊方法(上篇)

Animal(object))时同时就从基类中继承了__new__方法,所以就不需要重新在子类中实现,如果把上述注释取消掉,再看一下,class
2019年8月18日
其他

【进阶Python】第二讲:装饰器

None可以看出,通过使用装饰器,函数fun_one的元信息都丢失了,那怎么样才能保留装饰器的元信息呢?可以通过使用Python自带模块functools中的wraps来保留函数的元信息,from
2019年8月10日
其他

【进阶Python】第一讲:开篇

从入门到实践》如果时间有限,我认为入门阶段可以通过菜鸟教程、廖雪峰Python进行学习。如果时间充足,我认为可以看一下入门书籍,因为更加严谨一些。《Python编程
2019年8月4日