机器学习实验室

其他

Sci-Hub反围剿,开通支付宝:让天下没有付费的论文

虽然这还只是一项政策,计划到2022年4月才会被彻底执行;但到了那时候,出版商将无法获得所有受UKRI资助者的论文版权,且必须允许作者自由地分享自己的作品。
2021年8月11日
其他

程序员加入新团队必问的 20 道问题

如何设置开发环境?也许团队文档中有明确的要求,但你应该了解需要在开发机器上安装哪些不同的工具,才能让你成为一名高效的团队成员。一次性解决95%的要求,总好过在开发的过程中不断遇到错误和依赖项。4.
2021年7月29日
其他

Swin Transformer:基于Shifted Windows的层次化视觉Transformer设计

【原创首发】机器学习公式推导与代码实现30讲.pdf
2021年7月18日
其他

TransUNet:基于 Transformer 和 CNN 的混合编码网络

图3显示了TransUNet、R50-ViT-CUP、AttentionUNet和UNet四个模型在多器官分割数据上的可视化效果。从视觉效果上的对比来看,TransUNet无疑是跟Ground
2021年7月8日
其他

SETR:基于视觉 Transformer 的语义分割模型

SETR编码器流程跟作为backbone的ViT模型较为一致。先对输入图像做分块处理,然后对每个图像分块做块嵌入并加上位置编码,这个过程就将图像转换为向量序列。之后就是Transformer
2021年7月4日
其他

ViT:视觉Transformer backbone网络ViT论文与代码详解

https://mp.weixin.qq.com/s/ozUHHGMqIC0-FRWoNGhVYQ
2021年6月6日
其他

算法工程师的日常,一定不能脱离产业实践

【原创首发】机器学习公式推导与代码实现30讲.pdf
2021年3月19日
其他

谈中小企业算法岗面试

XGBoost为什么要展开到二阶导数/当损失二阶不可导的时候怎么办
2020年12月17日
其他

算法工程师研发技能表

C++跟Python一样,甚至重要性还要强于Python,C++对于模型算法的工业化部署和落地至关重要。C++在线教程参考:https://www.w3cschool.cn/cpp/
2020年12月2日
其他

做人不能过拟合

在复杂的事物发展过程中,有许多的矛盾存在,其中必有一种是主要的矛盾,由于它的存在和发展规定或影响着其他矛盾的存在和发展。
2020年11月29日
其他

技术人要学会自我营销

每个人都会经历各种各样的自我营销。对技术人来说,面试就是一个最常见的自我营销机会。在面试中,你通过自己的表达将自己所掌握的技术和经验呈现给面试官,面试官根据你的“营销”来决定是否录用你。
2020年11月22日
其他

技术学习不能眼高手低

统计学出身的深度学习算法工程师。进击的Coder。
2020年11月15日
自由知乎 自由微博
其他

真正想做算法的,不要害怕内卷

统计学出身的深度学习算法工程师。进击的Coder。
2020年11月4日
其他

如何进行深度学习代码单元测试?

bottleneck_dim=16)只剩下一个问题了。unittest包发现并运行unittest.TestCase的所有子元素。因为这包括不能实例化的抽象基类,所以我们总是会有一个失败的测试。
2020年8月21日
其他

【深度学习笔记】我的第一本新书出版啦~

CNN图像分类:从LeNet5到EfficientNet
2020年8月14日
其他

【原创首发】机器学习公式推导与代码实现30讲.pdf

机器学习公式推导与代码实现系列全部30讲已经全部完成,为方便大家学习使用,笔者特地整理成252页的PDF文档供大家下载阅读。
2020年7月30日
其他

数学推导+纯Python实现机器学习算法30:系列总结与感悟

document.getElementById('js_content').addEventListener("selectstart",function(e){
2020年7月29日
其他

数学推导+纯Python实现机器学习算法24:HMM隐马尔可夫模型

由第22讲我们知道含有隐变量的概率模型可以通过EM算法来进行迭代求解。应用EM算法求解HMM模型参数也叫Baum-Welch算法。基于Baum-Welch算法求解HMM模型参数过程如下:
2020年7月27日
其他

数学推导+纯Python实现机器学习算法23:CRF条件随机场

https://stackoverflow.com/questions/9729968/python-implementation-of-viterbi-algorithm/9730083
2020年7月24日
其他

数学推导+纯Python实现机器学习算法22:EM算法

由于我们只能观察到最后的抛掷结果,至于这个结果是由硬币A抛出来的还是由硬币B抛出来的,我们无从知晓。所以这个过程中依概率选择哪一个硬币抛掷就是一个隐变量。因此我们需要使用EM算法来进行求解。
2020年7月21日
其他

数学推导+纯Python实现机器学习算法20:随机森林

Forest)就没有太多难以理解的地方了。所谓随机森林,就是有很多棵决策树构建起来的森林,因为构建过程中的随机性,故而称之为随机森林。随机森林算法是Bagging框架的一个典型代表。
2020年7月17日
其他

数学推导+纯Python实现机器学习算法19:CatBoost

CatBoost提供了两种Boosting模式,Ordered和Plain。Plain就是在标准的GBDT算法上内置了排序TS操作。而Ordered模式则是则排序提升算法上做出了改进。
2020年7月14日
其他

【原创首发】深度学习语义分割理论与实战指南.pdf

图像分类、目标检测和图像分割是基于深度学习的计算机视觉三大核心任务。三大任务之间明显存在着一种递进的层级关系,图像分类聚焦于整张图像,目标检测定位于图像具体区域,而图像分割则是细化到每一个像素。
2020年7月10日
其他

数学推导+纯Python实现机器学习算法18:LightGBM

从头开始实现了一个完整的LightGBM算法是一个复杂的系统性工程,限于时间和精力,这里笔者就不再进花时间手撸该算法。LightGBM开发团队提供了该算法的完整实现,这使得我们能够方便的进行调用。
2020年7月3日
其他

数学推导+纯Python实现机器学习算法21:最大熵模型

document.getElementById('js_content').addEventListener("selectstart",function(e){
2020年6月28日
其他

数学推导+纯Python实现机器学习算法25:kmeans聚类

Analysis)是一类经典的无监督学习算法。在给定样本的情况下,聚类分析通过特征相似性或者距离的度量方法,将其自动划分到若干个类别中。常用的聚类分析方法包括层次聚类法(Hierarchical
2020年6月20日
其他

数学推导+纯Python实现机器学习算法27:LDA线性判别分析

document.getElementById('js_content').addEventListener("selectstart",function(e){
2020年6月14日
其他

数学推导+纯Python实现机器学习算法26:PCA降维

虽然sklearn中提供了PCA降维的API,但其背后算法是用SVD来实现的。numpy模块下提供了强大的矩阵运算函数,下面我们用numpy来实现一个PCA算法。
2020年6月9日
其他

数学推导+纯Python实现机器学习算法29:马尔可夫链蒙特卡洛

所以MCMC的关键问题在于如何构造满足条件的马尔可夫链。常用的MCMC构建算法包括Metropolis-Hasting算法和Gibbs抽样。Metropolis-Hasting算法
2020年6月6日
其他

数学推导+纯Python实现机器学习算法28:奇异值分解SVD

我们可以尝试将SVD用于图像的压缩算法。其原理就是保存像素矩阵的前k个奇异值,并在此基础上做图像恢复。由SVD的原理我们可以知道,在SVD分解中越靠前的奇异值越重要,代表的信息含量越大。
2020年5月23日
其他

数学推导+纯Python实现机器学习算法17:XGBoost

有了GBDT的算法实现经验,XGBoost实现起来就并没有太多困难了,大多数底层代码都较为类似,主要是在信息增益计算、叶子得分计算和损失函数的二阶导信息上做一些变动。同样先列出代码框架:
2020年4月10日
其他

数学推导+纯Python实现机器学习算法16:Adaboost

document.getElementById('js_content').addEventListener("selectstart",function(e){
2020年4月6日
其他

数学推导+纯Python实现机器学习算法15:GBDT

树定义代码框架,主要包括树的基本属性和方法。基本属性包括根结点、最小划分样本数、最大深度和是否为叶子结点等等。基本方法包括决策树构建、决策树拟合、决策树预测和打印等方法。class
2020年4月3日
其他

深度学习100问-19:什么是空洞卷积?

rate),K为经过扩展后实际卷积核大小。除此之外,空洞卷积的卷积方式跟常规卷积一样。当a=1时,空洞卷积就退化为常规卷积。a=1、2和4时,空洞卷积示意图如下:空洞卷积不同的扩张率
2020年3月1日
其他

深度学习100问-18:如何计算CNN的感受野?

其中RF_l+1为当前特征图对应的感受野大小,也就是我们要计算的目标感受野,RF_l为上一层特征图对应的感受野大小,f_l+1为当前卷积层卷积核大小,最后一项连乘项则表示之前卷积层的步长乘积。
2020年2月29日
其他

深度学习100问-17:图语义分割有哪些常用的评价指标?

平均像素准确率其实更应该叫平均像素精确率,是指分别计算每个类别分类正确的像素数占所有预测为该类别像素数比例的平均值。所以,从定义上看,这是精确率(Precision)的定义,MPA的计算公式如下:
2020年2月15日
其他

深度学习100问-16:为什么U-Net在医学图像上表现优越?

乍一看很复杂,U形结构下貌似有很多细节问题。我们来把U-Net简化一下,如下图所示:从图中可以看到,简化之后的U-Net的关键点只有三条线:下采样编码上采样解码跳跃连接
2020年2月11日
其他

深度学习100问-15:什么是深监督(Deep Supervision)?

看到这个联合损失函数是不是有种正则化的味道,实际也正是如此,辅助loss能够起到一种类似正则化的效果。可以看到,Conv4在加深监督和不加深监督的平均梯度差异。如下图所示:Torch示例
2020年2月9日
其他

深度学习100问-14:图像语义分割有哪些经典的上采样方法?

目前已知的大多数分类网络,比如说VGG、ResNet、MobileNet、Inception和DenseNet等,均可用于分割时的信息编码,那么恢复图像像素的上采样方法都有哪些呢?
2020年2月5日
其他

深度学习框架之争:TensorFlow退守工业界,PyTorch主导学术界?

如果你想在研究中使用像胶囊网络这样的新算子,你该怎么做?如果你想在机器学习框架目前还不支持的新型硬件加速器上运行你的模型,你又该怎么做?现有的解决方案往往还不够完善。正如论文「Machine
2019年11月20日
其他

深度学习100问-13:深度学习如何制作个人数据集?

转换完成后会生成一个标签文件夹,包括原始图像img.png、标签图像label.png、标签可视化图像label_viz.png、标签名称的.txt文件和.yaml格式标签名称文件。
2019年11月17日
其他

深度学习100问-12:深度学习有哪些经典数据集?

Database》的论文,之后从2010年开始基于ImageNet数据集的7届ILSVRC大赛,这使得ImageNet极大的推动了深度学习和计算机视觉的发展。ILSVRC大赛历届经典网络。
2019年11月16日
其他

深度学习100问-11:什么是学习率衰减?

我们可以先定义一个指数衰减函数,然后将这个函数传入到keras的LearningRateScheduler回调函数中。使用LearningRateScheduler函数,我们可以自定义指数衰减函数。
2019年11月15日
其他

深度学习100问-10:如何部署一个轻量级的深度学习项目?

API。主要技术框架为Keras+Flask+Redis。其中Keras作为模型框架、Flask作为后端Web框架、Redis则是方便以键值形式存储图像的数据库。各主要package版本:
2019年10月12日
其他

深度学习100问-9:为什么EfficientNet号称是最好的分类网络?

图a是一个基线网络,图b、c和d这三个网络分别对该基线网络的宽度、深度和输入分辨率进行扩展,而图d网络就是EfficientNet的主要思想,综合宽度、深度和分辨率对网络进行复合扩展。
2019年9月18日
其他

深度学习100问-8:什么是Batch Normalization?

shift的变换。从作者在论文中的表述看,认为每一层都做BN之后可能会导致网络的表征能力下降,所以这里增加两个调节参数(scale和shift),对变换之后的结果进行反变换,弥补网络的表征能力。
2019年9月3日
其他

深度学习100问-7:dropout有哪些细节问题?

前段时间朋友圈被一个谷歌将dropout写成专利的新闻刷屏了,纷纷发出这也行的感叹。当然,这里我们仅专注于dropout技术本身,以此为例说明dropout的重要性。
2019年8月27日
其他

Kaggle是建模比赛,不算数据产业实践

跟大家分享一个有趣的故事。有一天,熊大跟一个做货车车联网的朋友互相切磋学习。对方提到一个问题,说他们有一个物流客户非常认可他们的数据价值。希望通过货车车联网数据帮助手下货车司机改进驾驶行为。
2019年8月27日
其他

深度学习100问-6:有哪些经典的卷积类型?

https://towardsdatascience.com/intuitively-understanding-convolutions-for-deep-learning-1f6f42faee1
2019年8月20日