Quantcast

有了杰出人物而不爱惜的民族是很可悲的

要“割掉方方舌头”的女孩,你被蛋壳驱赶大家都笑了

袁伟时:中国的奴性和戾气从哪里来?

“芯片大学”虚晃一枪,人才断层问题不能跑步解决

两大中国首富双双被重挫-释放信号强烈

民间帝王赖小民和性感女星舒淇与许晴

深度解读 | 姜文《让子弹飞》

【连车新闻】全力攻关一昼夜,确保运输三十站

Facebook Twitter RSS

分享到微信朋友圈

点击图标下载本文截图到手机
即可分享到朋友圈。如何使用?

自由微信安卓APP发布,立即下载!

有三AI

言有三新书来袭,业界首次深入全面讲解深度学习人脸图像算法

关于配图,书中所有的图全部都是原创,而很多的地方因为图片版权或者绘制难度问题,无法给大家配图,这也是长期以来被一部分读者诟病的地方,读者可以到我们公众号或者直接阅读文献进行知识补全。
2020年7月22日

【杂谈】有三AI专业版学习扑克牌上线,一副扑克,看懂AI核心技术

目前AI技术在各行各业中都大展拳脚,作为专业人士,我们当然要学习其中的重要知识,而不仅仅是当一个看客。总的来说,有这么几方面的知识是肯定要学习的。
2020年7月21日

【技术综述】基于3DMM的三维人脸重建技术总结

在BFM模型中,3D顶点数为53490个,作者选择了一个大小为256×256×3的图片来进行编码,其中像素数目等于256×256=65536,大于且接近53490。这个图被称为UV位置图(UV
2020年7月20日

【总结】有三AI大量原创视频和图文资料,你都存下来了吗

本书详解了从上个世纪90年代萌芽的卷积神经网络技术,到最新的技术,时间跨度超过30年,并不只是简单罗列当前各类模型,而是会从起源开始分析背后的原理,条分缕析地剖析其中设计思想。
2020年7月17日

【技术综述】人脸妆造迁移核心技术总结

由于GAN等技术的成熟,人脸的妆造迁移算法得到了长足的进步,不过在实际落地中仍然会面临着一些难题,如大姿态和大表情的妆造迁移问题,后续的一些研究者们也基于此做出了一些工作,比如Pose-Robust
2020年7月10日

【技术综述】人脸风格化核心技术与数据集总结

人脸图像是计算机视觉领域中研究历史最久,也是应用最广泛的图像。近几年随着研究方法的进步以及相关数据集的收集,人脸风格化成为了一个非常热门的研究领域和应用方向,本文我们来介绍其中的核心技术和相关资源。
2020年6月29日

【杂谈】有三AI限量定制版书签来了,你准备好入手了吗?

眼看着上半年就要结束了,6月份有三出了一本新书,在上半年的尾巴时间节点给大家带来了少量与书配套的文化产品,定制版“有三AI书签”,供有收藏需求的同学自取,下面请听介绍。
2020年6月28日

【杂谈】2020年如何长期、系统,全面地学习深度学习和计算机视觉,这是有三AI的完整计划

不是所有的从业者都需要在深度学习理论上有所建树,但是我们必须要熟悉它。熟悉它的学习机制,为什么有效,到底适合什么样的任务。熟悉其中初始化,激活机制,归一化,正则化,优化方法,优化目标,可视化等内容。
2020年6月22日

【通知】有三AI发布150页深度学习开源框架指导手册与GitHub项目,欢迎加入我们的开源团队

除了12个开源的使用,本手册中还包括一个统一的各类深度学习模型结构和权重可视化工具,以及各类深度学习模型绘制工具,如下:
2020年6月20日

言有三新书来袭!业界首次深入全面讲解深度学习模型设计

本书是一位在深度学习与计算机视觉领域工作多年的有为青年根据自身经历和经验,以理论结合案例的形式系统阐述深度学习模型,尤其是卷积神经网络模型发展历程的好书。本书内容非常完整、专业,值得认真阅读、学习。
2020年6月10日

【总结】最全1.5万字长文解读7大方向人脸数据集v2.0版,搞计算机视觉怎能不懂人脸

人脸方向包含5个,left、front、right、left-front及right-front。遮挡类型分为4个,即人造的纯色遮挡物、人造的复杂纹理遮挡物、手/头发等身体造成的自遮挡以及复杂类型。
2020年6月3日

【通知】有三AI更新420页14万字视觉算法工程师成长指导手册,可下载收藏打印

本周末,5月30日晚20:00到22:00会针对“如何学习计算机视觉”做一场直播,届时也将会对指导手册进行答疑。这是有三AI的首场付费直播,可以进行回看,感兴趣的同学可以扫码加入。
2020年5月29日

【通知】2020年有三AI-CV夏季划升级,更多项目,更高难度,更加落地

Caffe源代码解读,修改与模型部署(C++接口),需要掌握Caffe的设计思想,核心代码解读,学会Caffe代码的自定义与修改,学会使用C++接口进行模型部署。
2020年5月26日

【AI不惑境】AutoML在深度学习模型设计和优化中有哪些用处?

Photos,就需要在保证准确率的情况下压缩得到更小的模型。对于这一类场景,作者定义了一个奖励,它是准确率和硬件资源的函数。基于这个奖励函数,智能体在不损害模型准确率的前提下探索压缩极限。
2020年5月25日

【通知】如何让你的2020年秋招CV项目经历更加硬核,可深入学习有三秋季划4大领域32个方向

图像质量小组需要掌握与图像质量相关的内容,学习的东西包括8大方向:图像质量评价,图像构图分析,图像降噪,图像对比度增强,图像去模糊与超分辨,图像风格化,图像深度估计,图像修复。
2020年5月22日

【AI不惑境】模型量化技术原理及其发展现状和展望

当然了,二值量化还有非常多的技术,包括XNorNet[3]等基于重建的模型,优化目标敏感的二值化模型,基于阈值的二值化改进,激活值正则化等,篇幅有限不再详述,读者可以阅读综述文章[4]进行学习。
2020年5月17日

【通知】有三个人指导以及VIP星球6月份之后升级,你的专属AI顾问了解一下

24小时免费答疑。除了不帮忙写代码,一切问题都可以咨询讨论,必知无不言,言无不尽。其实大部分情况下我们并不需要那么多资料,而是需要在关键时刻点醒自己,少走弯路的人,很多时候,就那一两句话。
2020年5月13日

【百战GAN】二次元宅们,给自己做一个专属动漫头像可好!

如今二次元文化拥有数以亿计的群众基础,有三自己也是一个动漫宅。早期的时候醉心于日本动漫,这几年醉心于国产动漫,在知乎写的第一篇文章还是给国产动漫打call。
2020年5月11日

【通知】2020年有三AI-CV春季划升级,更多项目,更多框架,更高难度

2020年有三AI-CV春季划从2020年5月6日起即刻启动,学费为1888RMB,在此之前报名仍按照2019年春季划学费1500RMB,联系有三微信Longlongtogo即可报名。
2020年4月30日

【AI不惑境】模型剪枝技术原理及其发展现状和展望

如上图,基于重建误差的剪枝算法,就是在剪掉当前层B的若干通道后,重建其输出特征图C使得损失信息最小。假如我们要将B的通道从c剪枝到c',要求解的就是下面的问题,第一项是重建误差,第二项是正则项。
2020年4月22日

【总结】有三AI秋季划图像质量组3月直播讲了哪些内容,为什么解决好底层图像处理问题那么重要

小提示:直播的地点就在微信群内,并且所有资料发放也在微信群内,为防止资源外泄不会再更新云盘,这都是为了保护图像算法小组成员的权益。另外,加入图像质量小组可以免费加入有三的摄影星球。
2020年4月18日

【调参实战】BN和Dropout对小模型有什么影响?全局池化相比全连接有什么劣势?

Linux系统,推荐ubuntu16.04或者ubuntu18.04。使用windows系统也可以完成,但是使用Linux效率更高。
2020年4月17日

【杂谈】为什么我们的CV人才培养计划命名为‘春夏秋’而不是‘低中高’

【人脸算法小组】需要掌握当前人脸图像领域的主要算法,具体包括8大方向:人脸检测,人脸关键点检测,人脸识别,人脸属性分析,人脸分割,人脸美颜,人脸编辑与风格化,三维人脸重建。
2020年4月16日

【知识星球】关于模型压缩,有三AI知识星球近一个月从模型精简,硬件实现,到模型剪枝分享了哪些内容

每一个通道完全独立,一个输入通道为M的移位操作,将有(Dk*Dk)^M种操作,搜索空间太大,所以接下来我们对其进行限制。将M个通道分为(Dk*Dk)个组,组内共享移位操作,称之为一个shift
2020年4月15日

【杂谈】万万没想到,有三还有个保密的‘朋友圈’,那里面都在弄啥!

不过对于提问我有一个建议,希望大家能够提供足够多的细节(包括但不限于数字和图片)。很多朋友上来就问“我的模型不收敛”怎么办,看到这个问题有三表示很绝望,想起了李宁的广告词,“一切皆有可能”啊。
2020年4月12日

【总结】有三AI秋季划人脸算法组3月直播讲了哪些内容,计算机视觉你不可能绕开人脸图像

人脸关键点算法。人脸关键点检测是人脸识别算法的预处理步骤,用于对人脸进行对齐,本身它也是很多人脸算法的基础,我们总结了人脸关键点标注的发展以及当前的核心技术。
2020年4月11日

【总结】有三AI秋季划模型优化组3月直播讲了哪些内容,为什么每一个从事深度学习的同学都应该掌握模型优化的内容

数据整理。数据整理看似很简单,但是习惯和流程往往会反映出工程人员和公司的素质,学会数据的整理,挑选,去重,分级,往后做项目会少走很多弯路,有三也写了一个基于C++的去重项目供参考使用。
2020年4月9日

【调参实战】那些优化方法的性能究竟如何,各自的参数应该如何选择?

上面的梯度下降算法公式用到了数据集所有的数据,这在解决实际问题时通常是不可能,比如ImageNet1000有100G以上的图像,内存装不下,速度也很慢。
2020年4月7日

【调参实战】如何开始你的第一个深度学习调参任务?不妨从图像分类中的学习率入手。

数据集多样性适中,包含了20类场景的自然场景,每一类的场景非常的均匀。图片的尺寸是300*400或者400*300,规格统一,符合大多数深度学习图像任务的处理分辨率,尤其是图像分类。
2020年4月6日

【杂谈】有三AI秋季划增加生成对抗网络小组,你准备好大GAN一场了吗

那如何从理论上和实践上更好地学好GAN这一个基础技术呢?为了满足更多的朋友们能够更加方便地与大家交流并且得到实时的指导,我们给有三AI秋季划新增了了GAN小组,介绍如下:
2020年4月3日

【百战GAN】如何使用GAN拯救你的低分辨率老照片

随后研究者提出在网络的后端进行分辨率放大,通过扩充通道数,然后将其重新分布来获得高分辨率图,这套操作被称为(PixShuffle)[2],这样整个网络大部分计算量是对低分辨率图操作,如下图:
2020年4月1日

【百战GAN】GAN也可以拿来做图像分割,看起来效果还不错?

该框架输入图x,经过生成器G之后得到分割结果G(x),然后一边将G(x)和x一起作为判别器的输入,另一边将真实标注y和x一起作为判别器的输入,前者判别器输出为fake,后者为real。
2020年3月27日

【百战GAN】新手如何开始你的第一个生成对抗网络(GAN)任务

大家好,欢迎来到专栏《百战GAN》,我们在公众号已经输出了非常多的GAN相关的理论,这一次我们开设《百战GAN》专栏,在这个专栏里,我们会进行算法的核心思想讲解,代码的详解,模型的训练等内容。
2020年3月25日

【知识星球】图像生成玩腻了?视频生成技术何不来了解一下

G1采用的是encoder-decoder这种结构,它包含了多个3D卷积层-反卷积层对,使用了跳层连接,这是一个典型的U-Net结构,实现对视频内容的建模,优化目标为逐像素的L1重建损失。
2020年3月20日

【CV项目实战】纯新手如何从零开始完成一个工业级图像分割任务的整个流程?

接下来,我们需要对数据进行标注。图像分割任务要求对每一个像素进行预测,所以需要像素级别的标注结果,当然我们实际标注的时候往往是通过画轮廓形成闭合区域,下面使用我们自己开发的工具进行标注,步骤包括:
2020年3月16日

【CV项目实战】纯新手如何从零开始完成一个工业级的图像分类任务?

FER)作为人脸识别技术中的一个重要组成部分,近年来在人机交互、安全、机器人制造、自动化、医疗、通信和驾驶领域得到了广泛的关注,成为学术界和工业界的研究热点,是人脸属性分析的重点。
2020年3月14日

【杂谈】有三AI知识星球一周年了!为什么公众号+星球才是完整的?

(1)公众号付费图文。昨天我们也跟大家说了,公众号将开始包含一部分付费内容,其中作者同意发布到知识星球社区的,将在一周后进行同步。有三承诺,凡是价值不超过知识星球年费10%的,一律会同步到社区。
2020年3月13日

【通知】这是有三AI第一篇付费文章,100万文字原创后我们会不会从此全面进入付费时代

今天这篇文章,将重点解答以下问题,同时也需要大家在文末留言提出意见,这很重要,也会影响我们接下来的决策。本文涉及解答的问题包括:
2020年3月12日

【知识星球】这几年人脸都有哪些有意思的数据集?

CartoonSet10k和CartoonSet100k,分别包含10000和100000张卡通人脸图。每一张卡通人脸图都有16个组件,其中12个面部属性和4个颜色属性。
2020年3月8日

【总结】循序渐进,有三AI不得不看的技术综述(超过100篇核心干货)

其实除了以上综述类的文章,还有一些虽然没有标注为总结或者综述但实际上也是综述的文章,包括图像降噪,人脸的各个领域,已经被包含在各类文章中,就不一一点破了,喜欢的朋友自己去找找吧,这是一个很大的矿。
2020年2月24日

【杂谈】那些底层的图像处理问题中,GAN能有什么作为?

由于在该框架中两幅用于融合的原始图(src)和目标图(dst)是在不同拍摄条件下的同一场景,因此作者使用了目标图作为重建真值。当这个条件不满足时,则使用无监督的方式进行训练。
2020年2月20日

【杂谈】如何系统性地学习生成对抗网络GAN

当然GAN只是知识星球里很小的一部分内容,整个生态的介绍大家可以阅读下面文章,添加有三微信Longlongtogo加入可优惠30元。祝大家在GAN的坑里越陷越深,取得成绩!
2020年2月18日

【杂谈】计算机视觉在人脸图像领域的十几个大的应用方向,你懂了几分?

以上人脸的主要应用场景,每一个方向虽然都有了许多进展,但是也遗留着很多的难题并没有解决,人脸算法是整个计算机领域中最大的方向,值得每一个立志于从事计算机视觉领域的算法人员深入掌握。
2020年2月16日

【GAN优化外篇】详解生成模型VAE的数学原理

自编码器(autoencoder)在深度学习中占有重要地位,它最开始的目的是用于降维或特征学习。一般的自编码器由编码器(encoder)和解码器(decoder)两个神经网络构成,如下图所示:
2020年2月13日

【通知】有三AI项目研发组成员招收条件及可对接业务暂行方案

随着陆续有各种各样的AI方向的开发需求诞生,有三AI从2020年初起正式建立研发组,现在先发布暂行管理方法,等后续公司成立再进行正式的人员管理。
2020年2月12日

【杂谈】学习AI技术总有那么多问题,有三24小时给你答疑它不香吗?

书籍《深度学习之图像识别:核心技术与案例实战》唯一作者,上市两月,已重印,虽有瑕疵,依旧干货。目前已经全职做内容生态,希望为人工智能知识普及作出贡献,今年还会有新书出版。
2020年2月11日

【通知】有三AI GPU平台上线新功能,GPU/CPU可灵活选择

很多同学想学习深度学习,却苦于没有GPU,阿里云腾讯云等GPU实在是太贵了,所以我在DBChain的帮助下,前段时间上线了GPU平台,地址是:https://www.yousanai.cn。
2020年2月10日

【GAN优化】小批量判别器如何解决模式崩溃问题

有三AI知识星球由言有三维护,内设AI知识汇总,AI书籍,网络结构,看图猜技术,数据集,项目开发,Github推荐,AI1000问八大学习板块。其中网络结构1000变部分有大量GAN实战相关的内容。
2020年2月7日

【杂谈】2020年有三AI计算机视觉培养计划详解,该不该学&怎么学CV的简单讨论

计算机视觉技术诞生于半个多世纪以前,随着深度学习技术的成熟开始在很多领域大规模落地,以研究方向来说,大大小小至少数十个领域,我们公众号介绍过一些,大家也可以自己去了解。这里我重点想说的有几件事情。
2020年2月6日

【杂谈】为了让大家学好深度学习模型设计和优化,有三AI都做了什么

有三AI知识星球是我们的第一付费生态,与公众号相同,都是专注于系统性原创,其中最重要的板块就是网络结构1000变,已有几百期内容,这是对公众号内容难度的升级,以及天池直播中网络模型的具体介绍和实战。
2020年2月4日

【通知】休假结束,有三AI所有学习资料汇总!

2020年1月份有三AI公众号以及知识星球处于休整期,因此内容停更,今天已经是最后一天了,下周一(2月3日)恢复更新,先给大家(尤其是公众号的新粉丝们)总结一下我们迄今为止所有免费和付费的学习资料。
2020年1月31日

春节前重要通知,有三AI团队正式成立,三大部门等你加入!

随着AI技术在各行各业大规模落地的开始,2020年一定是非常好的一年,也提前祝大家春节愉快!对我们生态内容还不熟悉的,可以查看2019年的年终总结!
2020年1月15日

【年终总结】2019年有三AI做了什么,2020年我们要做什么?

为了满足更多层次人员的需求,年底我们开设了新的公众号《有三言选》,在有三言选公众号中,包括AI好书推荐,好工具推荐,有三图书馆等模块。其中有三图书馆每周组织共享送书活动,欢迎大家多多参与助人助己。
2019年12月31日

【NLP】有三AI的NLP培养计划终于来了,如何在专家一对一指导下系统性学习自然语言处理

如上图所示,在这一章的课程中会包含5个NLP基本任务,通过基础理论讲述和6个实践项目让大家牢牢则掌握这些重要的任务。目前这部分课程我们已经准备好了代码和参考资料,这部分的内容会在2月中旬更新完成。
2019年12月30日

【NLP-语义匹配】详解深度语义匹配模型DSSM

总的来说词袋模型就是把文本看成是一个装着词的袋子,记录一个文本中,有这个词几个,那个词几个。前提到过,当词典非常大时,用词袋模型会造成维度灾难。所以DSSM还引入了word
2019年12月29日

【年终总结】有三AI至今在人脸图像算法领域都分享了哪些内容?

年龄特征作为人类的一种重要生物特征,如果基于人脸图像的年龄估计问题得到解决,那么在日常生活中,基于年龄信息的各种人机交互系统,例如与年龄相关的安全监控,与年龄有关的智能广告推荐系统等都将从中获益。
2019年12月27日

【年终总结】2019年有三AI知识星球做了什么,明年又会做什么

这半年多的时间里,星球留下了600多条足迹,其实已经是一个不小的生态了。但是,我相信大家想要更多,而我也应该做到更好。那么,除了做好已有的板块之外,明年还应该再加哪些内容呢?至少有两块是确定的。
2019年12月26日

【杂谈】当前知识蒸馏与迁移学习有哪些可用的开源工具?

PaddleSlim是百度提出的模型优化工具,包含在PaddlePaddle框架中,支持若干知识蒸馏算法,可以在teacher网络和student网络任意层添加组合loss,包括FSP
2019年12月24日

【年终总结】2019年有三AI NLP做了什么,明年要做什么?

常常有人说AI寒冬将至,笔者认为是产业界变得更理性和实际而已。基于现有的技术,也能够满足很多行业相当一部分的智能化需求,接下来,应该会有越来越多行业开始+NLP。
2019年12月22日

【知识图谱】知识推理,知识图谱里最“人工智能”的一段

那么,如何从现有的知识中,推理出来新的知识和结论呢?反应快的同学很快就能想到,可以预先定义好准确的推理规则,然后基于这些规则,基于推普中的知识推导出新的结论和知识。例如,预先定义好这样的规则:
2019年12月21日

【杂谈】当前模型量化有哪些可用的开源工具?

TensorRT是Nvidia提出的神经网络推理(Inference)引擎,支持训练后8bit量化,它使用基于交叉熵的模型量化算法,通过最小化两个分布的差异程度来实现。
2019年12月18日

【杂谈】有三AI知识星球最近都GAN了哪些内容?

从上图结构可以看出,它首先对输入图像进行正脸对齐,然后使用风格迁移算法将要换的脸图进行面部纹理迁移得到结果图,接着进行反对齐,即恢复人脸的初始姿态,最后基于人脸掩膜与原始图像采用seamless
2019年12月17日

【知识图谱】获取到知识后,如何进行存储和便捷的检索?

互联网时代,人类在与自然和社会的交互中生产了异常庞大的数据,这些数据中包含了大量描述自然界和人类社会客观规律有用信息。如何将这些信息有效组织起来,进行结构化的存储,就是知识图谱的内容。
2019年12月16日

【杂谈】当前模型剪枝有哪些可用的开源工具?

keras-surgeon是一个keras的模型剪枝工具,不得不说keras的用户还是很努力的,比如之前介过的AutoML工具Auto-Keras,该项目支持神经元,通道以及网络层级别的剪枝操作。
2019年12月15日

【杂谈】有三AI专栏作者邀请,在这里写文章能获得什么,有什么不同?

对于专栏作者来说,我们期望作者也能够系统性地完善自己的知识储备。按时更新专栏,可以促进持续学习,约束惰性。在经历过一个成功的专栏之后,也能提升作者的个人影响力,收获更多的东西。
2019年12月14日

【每周CV论文推荐】换脸算法都有哪些经典的思路?

当前最流行的Deepfakes就是在使用同样的编码器的约束下,分别训练A图像和B图像的编解码器。使用时将A的特征输入解码器B从而实现换脸,感兴趣的可以参考开源代码[7]进行尝试。
2019年12月13日

【AutoML】当前有哪些可用的AutoML平台?

Intelligence)是阿里巴巴推出的机器学习服务平台,包含3个子产品,分别是机器学习可视化开发工具PAI-STUDIO,云端交互式代码开发工具PAI-DSW,模型在线服务PAI-EAS,
2019年12月12日

【杂谈】GAN对人脸图像算法产生了哪些影响?

人脸图像是整个图像领域里面研究人员最多,应用最广的一个方向。GAN作为时下最新兴的深度学习模型,在人脸图像领域里已经颇有建树,今天咱们就聊聊GAN对人脸图像算法的一些主要影响。
2019年12月9日

【杂谈】如何系统性地学习生成对抗网络GAN

如今你就是只对GAN感兴趣,不想加入星球那怎么办呢?可以考虑一下有三在今日头条开设的《百战GAN》图文专栏,目前只需19.9,很快就会涨价,扫码可以了解详情,一定会更新超过100期内容。
2019年12月5日

【小结】除了网络搜索(NAS),AutoML对深度学习模型优化还有哪些贡献?

有三AI秋季划已经正式启动报名,模型优化,人脸算法,图像质量共24个项目,助力提升深度学习计算机视觉算法和工程项目能力。有三AI秋季划出炉,模型优化,人脸算法,图像质量等24个项目等你来拿
2019年12月4日

【知识图谱】知识抽取是什么,怎么做?

互联网时代,人类在与自然和社会的交互中生产了异常庞大的数据,这些数据中包含了大量描述自然界和人类社会客观规律有用信息。如何将这些信息有效组织起来,进行结构化的存储,就是知识图谱的内容。
2019年12月3日

【每周CV论文推荐】 人脸识别剩下的难题:从遮挡,年龄,姿态,妆造到亲属关系,人脸攻击

年龄的变化使得人脸的图像特征发生很大的变化,跨年龄的人脸识别无疑也是一个很难的问题,同时也是一个具有重大社会价值的课题。从年龄不变特征提取到年龄仿真,相关的研究非常多,这个综述可以作为一个好的开始。
2019年12月2日

【AutoML】强化学习如何用于模型量化?

上一期给大家介绍了AutoML技术在模型剪枝中的应用,而量化作为模型压缩的另外一个技术,是学术界和工业界的重点研究方向,今天给大家介绍AutoML在模型量化中的应用思路。
2019年11月29日

【知识图谱】如何构建知识体系:知识图谱搭建的第一步

面对结构化的知识,知识体系构建的任务其实就是提炼出来结构化语料中蕴含的概念以及概念之间的关系。结构化数据通常存储在关系型数据库中,上述任务通常就变成了分析数据表中的字段内容、主键以及外键之间的关系。
2019年11月26日

【每周CV论文推荐】 初学深度学习单张图像三维人脸重建需要读的文章

Motion等方法这一次没有介绍,后面再说。关于3DMM模型的基础公众号几年前有过简单的解读,之前的一个计算机视觉大综述也有介绍,大家可以快速参考。
2019年11月25日

【总结】言有三&阿里天池深度学习模型设计直播汇总,附赠超过200页直播PPT课件

如果想知道直播中的各种网络的细节以及进行更多的延伸,可以加入有三AI知识星球,其中的网络结构1000变板块就是专门介绍各种模型结构,已经超过200期,理论和实战兼备,形式如下:
2019年11月23日

【杂谈】有三AI不得不看的技术综述(超过100篇核心干货)

现如今我们坚持不接广告,只做原创,系统输出,已经有超过400期文章了,在这里诚意邀请喜欢分享原创内容的同学加入,成为专栏作者,不仅可以督促自己学习,还可以获得个人收入以及平台的资源扶持。
2019年11月22日

【每周CV论文推荐】 初学深度学习人脸属性分析必读的文章

人脸年龄的估计包括真实年龄和表观年龄,也分为年龄值和年龄段的估计,最简单的方法就是基于分类或者回归的思路进行预测,IMDB-WIKI[1]是当前最大的人脸年龄数据集。
2019年11月20日

【知识图谱】知识表示:知识图谱如何表示结构化的知识?

此外,因为知识图谱最重要的功能就是实现知识推理,进行语义计算。为此,一些知识的数值化表示方法的研究开始出现。基于数值化的知识表示,有利于知识推理,但目前仅处于研究阶段,感兴趣的同学可以自行搜索学习。
2019年11月19日

【AI产品】前沿黑科技,安利一款能让你的照片动起来的app

GAN等生成式模型,关于最新的视频生成/预测技术,推荐大家一定要关注GAN,目前的研究还是在起步阶段,但是它未来一定会给视频生成带来更大的突破,生成更加自然的效果。
2019年11月18日

【NLP实战】基于ALBERT的文本相似度计算

BERT4KERAS是苏老师基于kears实现的几个BERT模型,包括BERT,ALBERT和ROBERTA,基于BERT4KERAS可以快速的使用这些模型,也能够快速的实现对BERT改进的想法。
2019年11月16日

【每周CV论文推荐】 初学活体检测与伪造人脸检测必读的文章

FakeSpotter是南洋理工,阿里巴巴,小米等合作提出的假脸检测框架,与一般的使用最后的特征进行分类的思路不同,使用了每一层神经元的激活特性来进行分析。
2019年11月15日

【AI产品】如何让Google的AI给你捕捉最美的自拍瞬间

这一次的场面过于“血腥”,我就不上自己的自拍照了,看看官方的一些自拍,当你打开APP后做一些动作,如果Selfissimo觉得是一张不错的自拍的话会自动抓取的噢。
2019年11月14日

【AutoML】如何使用强化学习进行模型剪枝?

Photos,就需要在保证准确率的情况下压缩得到更小的模型。对于这一类场景,作者定义了一个奖励,它是准确率和硬件资源的函数。基于这个奖励函数,智能体在不损害模型准确率的前提下探索压缩极限。
2019年11月13日

【知识图谱】人工智能技术最重要基础设施之一,知识图谱你该学习的东西

知识体系的构建有两种方法,一种是自顶向下,即先构建一个完善的知识体系,再将知识填充到这个知识体系中;另外一种是自底向上,即在知识抽取的过程中,自动的扩充和构建知识体系。目前比较流行的自底向上的方法。
2019年11月12日

【知识星球】分组卷积最新进展,全自动学习的分组有哪些经典模型?

作者用他们在DenseNet框架上进行实验,只使用了DenseNet1/10的计算量,就取得了相当的性能,之所以能够降低计算量,就是因为对1*1卷积进行了分组学习,3*3卷积则使用标准分组卷积替代。
2019年11月9日

【AI产品】听着AI为照片生成的专属轻音乐,你还会失眠吗

欢迎来到《AI产品》专栏,这一个专栏是面向所有对人工智能技术感兴趣的朋友。在这个专栏里,我们会给大家推荐好玩的AI产品,剖析背后的关键技术,并推荐相关学习资料。
2019年11月7日

【AutoML】损失函数也可以进行自动搜索学习吗?

functions[2]也是致力于学习最优的损失函数,但是它不是基于强化学习,而是直接基于梯度下降。具体到图像分类任务中softmax损失来说,需要学习一个sigmoid权重函数σ。
2019年11月6日

【NLP】ALBERT:更轻更快的NLP预训练模型

大体来说,上述预训练模型确实都基于BERT了做了一些改进,在模型结构、训练模式等方面都有一些创新。但是大部分的预训练模型也有一个共通的“特点”,即模型相对“笨重”,预训练成本高。
2019年11月5日

【AutoML】优化方法可以进行自动搜索学习吗?

Search[1]是一个自动搜索优化方法的框架,它使用强化学习方法设计的RNN结构控制器进行学习,该控制器在每一步中给优化器生成权重更新方程,从而实现最大化模型准确率,示意图如下:
2019年11月4日

【NLP实战】如何基于Tensorflow搭建一个聊天机器人

encoder先将cell进行deepcopy,因为seq2seq模型是两个相同的特征抽取模型,但是模型参数不共享,所以encoder和decoder要使用两个不同的LSTMCell。
2019年11月3日

【直播】如何获得更加高效的深度卷积神经网络

后续的直播时间我们会在平台通知,请大家及时关注即可。如果想知道直播中的各种网络的细节以及进行更多的讨论,可以添加有三微信Longlongtogo申请加入有三AI知识星球。
2019年10月31日

【AI产品】你我当年的老照片,如今修复了可还行?

欢迎来到《AI产品》专栏,这一个专栏是面向所有对人工智能技术感兴趣的朋友。在这个专栏里,我们会给大家推荐好玩的AI产品,剖析背后的关键技术,并推荐相关学习资料。
2019年10月30日

【知识星球】卷积核和感受野可动态分配的分组卷积

分组网络的不同分支可以拥有同样的感受野,也可以拥有不同的感受野,不过以往都是通过手动进行分配。然而不同的感受野对于不同的任务来说,应该有不同的重要性,ScaleNet就可以学习到不同的权重。
2019年10月30日

【AutoML】归一化(Normalization)方法如何进行自动学习和配置

具体来说,minibatch越小,BN越不稳定,权重系数越小,IN和LN的权重系数则越大;minibatch越大,BN的权重系数就越大,反之IN和LN的权重系数越小。
2019年10月28日

我为什么要冒险从工业界离职做内容平台有三AI

工作之后有装备有氛围了,才算是真正上道,摸爬滚打好几年,看到太多人的知识系统千疮百孔,随手就在一些小问题上埋雷。网络上的信息虽多,真正能让大家循序渐进学习到完成项目所需要知识技能的好东西真的不多。
2019年10月27日

【AutoML】激活函数如何进行自动学习和配置

本次我们讨论的内容不涉及到一些学习参数的激活函数如Prelu,而是集中于全新的激活函数形式的探索以及逐层自适应的方案。研究点虽小,也有可以关注一下的。
2019年10月26日

【NLP实战系列】Tensorflow命名实体识别实战

训练时,应该是输入汉字序列,然后预测出一个BIO序列,所以我们的输入数据还需要整理,将汉字和标记分开,得到汉字序列及其标记序列,并且要将汉字及其标记转换成他们在字典里的序号,转化结果如下:
2019年10月25日

【每周CV论文推荐】 初学深度学习人脸识别和验证必读文章

DeepID系列总共有4篇文章,其中三篇值得读。DeepID1训练了一个多层CNN对约10000个人提取人脸识别特征,使用分类任务的方法。DeepID2添加了验证损失,DeepID
2019年10月24日

【AI产品】一键时光穿梭表情互动,这款FaceApp你知否?

Lab开发的人脸app,2017年上架后迅速取得成功。软件本身非常的简洁,定位就是一款工具类app,当然分付费和免费版,没有冗杂的社区(这是我非常讨厌的国内app喜欢做的功能)。
2019年10月23日

【NLP-ChatBot】能干活的聊天机器人-对话系统概述

通常来讲,对话系统会面向某一个任务,具备处理一些业务的能力。对话系统首先能够理解人类给出的信息,将其表示为一个内部状态,然后根据策略和对话状态选择一些动作,最后把动作转化为自然语言的表达形式。
2019年10月22日

有三AI秋季划出炉,模型优化,人脸算法,图像质量等24个项目等你来拿

模型优化小组的目标,就是掌握深度学习模型设计,调参,优化,部署。需要学习的东西包括8大项目:数据使用,模型使用和调参,模型性能分析,紧凑模型设计,模型剪枝,模型量化,模型部署,NAS。
2019年10月21日

【NLP实战系列】朴素贝叶斯文本分类实战

数据读取过程的任务很简单,就是从语料文件中将语料读到内存中,组织成一个列表,列表中每一项组成为(data,label),如('明天天气怎么样','get_weather')。
2019年10月20日

【每周CV论文推荐】 初学深度学习人脸关键点检测必读文章

Network)将人脸关键点检测与性别、是否带眼镜、是否微笑及脸部的姿势这四个子任务结合起来构成一个多任务学习模型,一些子任务比如脸部姿态在后来的人脸关键点检测框架中被经常使用。
2019年10月19日

【完结】12篇GAN的优化文章大盘点,浓浓的数学味儿

第五篇文章向大家介绍了GAN的IPM框架。关于GAN的目标函数,除了f-divergence外还有另一大类:IPM,非常熟悉的WGAN便是属于IPM框架下的一种GAN,IPM(integral
2019年10月17日

【GAN优化】解决模式崩溃的两条思路:改进优化和网络架构

它的核心思想是这样的:即使单个生成器会产生模式崩溃的问题,但是如果同时构造多个生成器,且让每个生成器产生不同的模式,则这样的多生成器结合起来也可以保证产生的样本具有多样性,如下图的3个生成器:
2019年10月16日

【直播】如何设计性能更强大的深度卷积神经网络

后续的直播时间我们会在平台通知,请大家及时关注即可。如果想知道直播中的各种网络的细节以及进行更多的讨论,可以添加有三微信Longlongtogo申请加入有三AI知识星球。
2019年10月15日

【NLP-ChatBot】搜索引擎的最终形态之问答系统(FAQ)详述

搭建一个问答系统是非常耗费时间和人力的事情,不管是传统的QA,还是近来的KBQA。对传统的QA,FAQ库的建立和维护都异常费事;对于KBQA,知识图谱的搭建,就是一个难度巨大的工程。
2019年10月14日

【NLP实战】tensorflow词向量训练实战

normalized_embeddings.eval()print(final_embeddings)fp=open('vector.txt','w',encoding='utf8')for
2019年10月13日

【知识星球】有三AI 10月新主题,千奇百怪GAN上线!

使用开源项目,https://github.com/kozistr/Awesome-GANs/tree/master/LAPGAN,结果如下,包括3个判别器和生成器的损失曲线以及最终的生成结果。
2019年10月11日

【完结】16篇图像分类干货文章总结,从理论到实践全流程大盘点!

在数据集制作过程中,由于主观、客观的原因,会导致标签噪声的出现,其存在会对最终的分类模型性能造成一定的影响。因此,在实际应用过程中,总是要对现有的数据集进行清洗,以避免标签噪声的干扰。
2019年10月11日

【每周NLP论文推荐】 知识图谱重要论文介绍

知识图谱是NLP中非常重要的底层基础建筑。知识图谱之于自然语言处理,就像内功之于武侠世界中的武功。一个优质的知识图谱网络能够极大的提升下游NLP任务的效果。
2019年10月9日

【图像分类】 图像分类中的对抗攻击是怎么回事?

现实生活中相应系统的保密程度还是很可靠的,模型的信息完全泄露的情况也很少,因此白盒攻击的情况要远远少于黑盒攻击。但二者的思想均是一致的,通过梯度信息以生成对抗样本,从而达到欺骗网络模型的目的。
2019年10月9日

【NLP-ChatBot】我们熟悉的聊天机器人都有哪几类?

闲聊式的机器人,开发难度非常的大,需要巨量的数据集以及能兼顾灵活度和准确度的算法模型。目前,闲聊式的机器人效果都差强人意,个人认为后续需要结合优质的知识图谱网络以及强大的增强学习算法。
2019年10月8日

最后24小时,有三AI夏季划报名即将截止

不论是以后要成立的公司,还是有三AI内容平台,都会优先从自己培养的人才队伍中挑选成员,可以说季划学员就是我们明日之星。不论是成为合伙人,还是成为专栏作者,其中会有不少人成为平台将来的中坚力量。
2019年9月30日

【NLP-NER】如何使用BERT来做命名实体识别

鉴于BERT的强大,在下游任务中,引入BERT是很自然的想法。像谷歌这些资源丰富的大佬,帮我们预训练好了模型,并且开源出来,当然要好好利用。这里就介绍下,如何基于谷歌开源出来的BERT
2019年9月29日

【每周CV论文推荐】 深度学习人脸检测入门必读文章

Detection,可以认为是传统技术和深度网络相结合的一个代表,和VJ人脸检测器一样,其包含了多个分类器,这些分类器采用级联的结构进行组织,不同之处在于Cascade
2019年9月29日

【图像分类】 标签噪声对分类性能会有什么样的影响?

在数据集制作过程中,由于主观、客观的原因,会导致标签噪声的出现,其存在会对最终的分类模型性能造成一定的影响。因此,在实际应用过程中,总是要对现有的数据集进行清洗,以避免标签噪声的干扰。
2019年9月28日

【GAN优化】什么是模式崩溃,以及如何从优化目标上解决这个问题

生成的样本全部聚集在左边的峰下,这时虽然生成样本的质量比较高,但是生成器完全没有捕捉到右边的峰的模式。(如果使用多种猫的图像训练GAN,最终GAN只能产生逼真的英短,而无法产生其他品种)。
2019年9月27日

【知识星球】剪枝量化初完结,蒸馏学习又上线

上表展示了MobileNet的实验结果,分别比较更窄的MobileNet和更加稀疏的MobileNet的结果,可以发现稀疏的MobileNet性能明显优于稠密的MobileNet。
2019年9月26日

【每周NLP论文推荐】 对话管理中的标志性论文介绍

欢迎来到《每周NLP论文推荐》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。
2019年9月23日

【NLP-NER】命名实体识别中最常用的两种深度学习模型

引入双向LSTM层作为特征提取工具,LSTM拥有较强的长序列特征提取能力,是个不错的选择。双向LSTM,在提取某个时刻特征时,能够利用该时刻之后的序列的信息,无疑能够提高模型的特征提取能力。
2019年9月23日

【直播】深度卷积神经网络模型设计技术

后续的直播时间我们会在平台通知,请大家及时关注即可。如果想知道直播中的各种网络的细节以及进行更多的讨论,可以添加有三微信Longlongtogo申请加入有三AI知识星球。
2019年9月22日

有三AI GPU租用平台上线,低至1小时不到1块钱

登录,接下来邮箱会收到登录账号和密码,跟使用自己本地的服务器毫无二致,只是租用的时候注意自己选定时长,暂时还不支持续租。如果你想出租自己闲置的GPU,也可以按照相关流程操作。
2019年9月21日

【NLP-NER】什么是命名实体识别?

NER是一个非常基础,但是非常重要的任务,今天先做一个整体的介绍。后续小Dream哥会相继详细的介绍上述几种常见的NER模型。在具体的模型中,大家能够更为细致的体会NER任务的真正作用和意涵。
2019年9月20日

【知识星球】模型量化从1bit到8bit,二值到三值

其中S,Z都是量化参数,Z就是对应实数0的量化值,S是一个浮点数因子。q就是量化的整数,r是浮点数,对于不同的矩阵,可以使用不同的量化参数,比如权重使用8bit量化,偏置使用32bit量化。
2019年9月18日

【AutoML】如何选择最合适的数据增强操作

大家好,欢迎来到专栏《AutoML》。在这个专栏中,我们会讲述AutoML技术在深度学习中的应用。这一期讲述在数据增强中的应用,这也是AutoML技术最早期的应用之一。
2019年9月17日

【GAN优化】如何选好正则项让你的GAN收敛

这篇文章用了一个非常简单且直观的Dirac-GAN进行实验,首先说明了标准的GAN或者WGAN是无法收敛到纳什均衡的,需要添加正则项。接下来,WGAN-GP也无法收敛,而一致优化正则项和zero
2019年9月16日

【知识星球】有没有网络模型是动态变化的,每次用的时候都不一样?

如上图所示,它在正常网络通道上包含了多个旁路分支,这样的思想是基于观察到随着网络的加深,表征能力越来越强,大部分简单的图片可以在较浅层时学习到足以识别的特征,如上图中的Exit
2019年9月11日

【杂谈】如何从数据准备,模型设计与调优,训练到部署完成整个深度学习算法流程

对于一个深度学习算法工程师来说,拥有丰富的项目经历当然是重要的,但是拥有完成整个从数据准备到模型上线的能力更加重要。这意味着可以独立承担项目,也是全栈工程师那么招人爱的原因了。
2019年9月10日

【每周CV论文推荐】 初学GAN必须要读的文章

首先当然是要读GAN之父Goodfellow的文章[2]了,引用量已经超过了10000+,不过因为GAN模型同时包含了生成学习和判别学习模型,也推荐大家读一读文[1]对两者的对比。
2019年9月10日

【每周NLP论文推荐】 生成式聊天机器人论文介绍

生成式聊天机器人是研究的热点,现在看来,通过端到端的方式,构建一个可靠又可控的聊天机器人还是没有太多方法。本篇我们来看看,聊天机器人的研究者们在这方面都做了哪些努力。
2019年9月9日

【NLP-词向量】从模型结构到损失函数详解word2vec

embedding之后,通过一个project和softmax层,计算出字典V中每个词的概率,再构建交叉熵之类的损失函数,然而直接对词典里的V个词计算相似度并归一化显然是极其耗时的。
2019年9月9日

【杂谈】为什么邀请大家加入硬核知识星球有三AI

对于一些非常优秀而且对大家有用的GitHub项目,比如网络图绘制,爬虫,可视化工具,模型优化工具,编程学习工具,我们在真正使用和评估之后,会给大家进行推荐。凡所推荐,必属精品。
2019年9月8日

【每周CV论文推荐】 初学深度学习图像分割必须要读的文章

多尺度和特征融合对于语义分割任务非常重要,ParseNet[8]使用了全局特征和局部特征融合的方案,PSPNet[9]则使用了多尺度的池化特征,都是早期比较经典的模型。
2019年9月7日

【GAN优化】详解GAN中的一致优化问题

这篇文章承接上一篇文章,在GAN中利用动力学的成熟知识,添加了一个正则项,保证了GAN在足够小的学习速率的情况下能收敛进入纳什均衡状态,是一项非常有价值的工作。下一期的任务将继续延此路线展开。
2019年9月6日

【杂谈】工程能力差,C++水平菜?CUDA没写过?我推荐玩下Caffe

新手在环境安装上卡住,其实并不是Caffe难,而是使用者对Linux系统非常不熟悉,这个锅Caffe不背。还从未听过哪家做深度学习算法开发的公司不基于Linux环境,你今天不学会到了公司更痛苦。
2019年9月5日

【图像分类】 实战图像分类网络的可视化

一直以来,深度学习被认为缺乏可解释性和基础理论支撑,往往被人们看做一个“黑匣子”。为了展现神经网络的内部特征并构建相应的理解过程,使神经网络更加可靠,相关的网络可视化研究越来越受人们重视。
2019年9月4日

【知识星球】剪枝还是不剪枝,剪了到底有什么好?

上表展示了MobileNet的实验结果,分别比较更窄的MobileNet和更加稀疏的MobileNet的结果,可以发现稀疏的MobileNet性能明显优于稠密的MobileNet。
2019年9月4日

【每周CV论文推荐】 初学目标检测必须要读的文章

RCNN系列不能很好地适用多尺度目标预测的问题,FPN框架将高层的特征与低层的特征进行融合,分别对每一层进行预测,多尺度从此是一个性能强劲的目标检测框架中必不可少的元素。
2019年9月3日

【NLP-词向量】词向量的由来及本质

词嵌入是所有自然语言处理任务所必须要经历的步骤,非常的重要。词向量在网络上已经有了大量的文章,但是,出于我们专栏的完整性系统性的考虑,笔者还是决定加上这样一个专题。
2019年9月3日

【每周NLP论文推荐】 聊天机器人中FAQ相关的论文推荐

今天推荐FAQ相关的论文,FAQ是聊天机器人的一种,它主要是基于用户的question,匹配相应的答案,返回给用户answer,没有太多的多轮交互。FAQ有较多的应用,如天猫精灵,小度等。
2019年9月2日

有三AI模拟面试服务上线,一对一服务助你求职

参加CV岗位面试,请添加小助手淡泊明志微信Scytmj,交付面试费用和简历,协助安排面试时间。(PS额外福利,有三AI季划学员可以免费享受所有服务,一小时面试可以半价加入有三AI知识星球)
2019年9月2日

新手如何使用有三AI系统性跟读AI领域的论文

每周读论文板块是有三AI的一个专栏,在这个专栏里,本着有三AI一贯的原则,专注于让大家能够系统性完成学习,不追求最新,但追求是同一主题中最干货的文章。该板块有以下特点:
2019年8月30日

【知识星球】模型压缩和优化板块火热更新中

模型压缩有许多的方法,比如使用小卷积,多尺度,去除全连接层,瓶颈结构等思路设计紧凑的网络,也有对权重进行量化剪枝等方法,而DeepRebirth则采用了另外一种思路,即将Non-tensor
2019年8月30日

【每周NLP论文推荐】 掌握实体关系抽取必读的文章

一般传统的串联抽取方法是在实体抽取的基础上进行实体之间关系的识别。在这种方法中,先期实体识别的结果会影响到关系抽取的结果,前后容易产生误差累积。针对这一问题,基于传统机器学习的联合模(Joint
2019年8月29日

【每周CV论文推荐】 初学高效率CNN模型设计应该读的文章

因为是每周论文阅读,就不给大家推荐太多文章(每周10篇左右)。对于更高效(紧凑)的模型设计,这里给出的文章仅仅是冰山一角。如果你对模型优化感兴趣,有三AI知识星球中有更多的内容。
2019年8月29日

【完结】 12篇文章带你完全进入NLP领域,掌握核心技术

隐马尔科夫模型引入了马尔科夫假设,即当前时刻的状态只与其前一时刻的状态有关。但是,在序列标注任务中,当前时刻的状态,应该同该时刻的前后的状态均相关。于是,在很多序列标注任务中,引入了条件随机场。
2019年8月28日

【GAN优化】从动力学视角看GAN是一种什么感觉?

需要说明,对于常微分方程,只有某些特殊类型的方程能求得解析解,大部分是很难求得解析解的,所以实际中主要依靠数值法来近似计算求得数值解,以一个简单的具有初始值常微分方程为例:
2019年8月27日

【杂谈】一招,同时可视化18个开源框架的网络模型结构和权重

深度学习开源框架众多,对于开发者来说其中有一个很硬的需求,就是模型结构和权重的可视化。使用过Caffe的同学都因为强大的Netscope可以离线修改实时可视化网络结构而暗爽,那其他的框架怎么样呢?
2019年8月26日

【NLP】GPT:第一个引入Transformer的预训练模型

OpenAI非常的倔强,一直沿用单向语言模型的思路。这个特点让GPT2.0的语言生成能力令人惊叹。GPT和BERT是目前为止影响力最大的两种预训练语言模型,至今为止,胜负还没有定论,我们且关注。
2019年8月26日

【每周NLP论文推荐】 开发聊天机器人必读的重要论文

第一篇论文给到这篇微软出的聊天机器人综述式的文章。论文讲解全面而到位,介绍了聊天机器人的分类以及发展状况和工作原理。对于一位想切入聊天机器人领域的AI算法工程师来说,是一篇比较好的入门文章。
2019年8月24日

【技术综述】视频分类/行为识别研究综述,从数据集到方法

密集采样是对不同尺度下的图像进行规则采样,不过真正被用于跟踪等不是所有点,因为平滑区域的点没有跟踪意义,通过计算每个像素点自相关矩阵的特征值,并设置阈值去除低于阈值的特征点来实现这个选择。
2019年8月23日

【图像分类】 关于图像分类中类别不平衡那些事

随后的十余年里,由于深度学习受到计算资源的限制、数据集采集的难度较大等影响,相关研究并没有得到进一步的探索,直到近年来才大放异,而深度学习领域内的类别不平衡问题,也得到了更加深入的研究。
2019年8月22日

【杂谈】认识有三AI的一年,从机械转行CV到专栏作者

随着思考的深入,我逐步开始意识到,固守传统的机械领域,对以后的发展规划也许会是一个阻碍。于是我开始搜集一些交叉领域的发展现状,慢慢选中了自己心仪的方向——智能图像检测,也选中了心仪的导师。
2019年8月22日

【NLP】XLnet:GPT和BERT的合体,博采众长,所以更强

在结构上,XLnet采用改进后的transofmerXL作为特征抽取器。前面讲过TransformerXL,他主要有两个优化,一个引入了序列循环机制;一个是引入了相对位置编码。
2019年8月20日

【每周CV论文推荐】 CV领域中数据增强相关的论文推荐

jittering的方法,即将图像先在一个范围内进行随机缩放然后裁剪,可以提升训练精度,这两篇文章的引用量加起来超过了60000,需要精读,因为随机裁剪效果远超其他方法。
2019年8月19日

【图像分类】简述无监督图像分类发展现状

PCA算法即主成分分析算法,是机器学习领域中一种典型的旋转数据集的方法,旋转后的特征在统计上不相关。通过数据集的旋转,可以根据新特征对解释数据的重要性来构建子集,从而构造新的数据集表示方式。
2019年8月17日

【每周NLP论文推荐】 介绍语义匹配中的经典文章

语义匹配也是NLP中比较基础的任务,它的主要目标是计算两个querry、两个文本之间的关系,包括相似度、问答关系等。在搜索引擎、智能问答、知识检索、信息流推荐等系统中都有应用。
2019年8月16日

CV算法岗秋招临门最后一脚,有三补招最后20个春季划徒弟

另一方面,很多的同学喜欢看视频,我虽然不主张用视频学习,不过针对图像中比较重要的领域,比如人脸图像各个方向,GAN,以及深度学习,传统图像算法都有自己录制的系列视频,网上是不公开的。
2019年8月15日

【每周CV论文推荐】 初学者必须精读的5篇深度学习优化相关文章

从事深度学习岗位,扎实的深度学习理论基础是必须掌握的,在前面我们已经给大家推荐过入门必须的模型结构相关的文章,今天给大家推荐必须精读的优化技术相关的文章。
2019年8月15日

【知识星球】图像降噪模型和数据集内容开启更新,经典问题永垂不朽!

Removal是一个Attention机制与GAN的结合,在判别器和生成器中同时使用Attention机制学习定位雨点信息,利用GAN网络补全被雨点覆盖的区域,获得了很好的结果。
2019年8月14日

【GAN优化】GAN训练的小技巧

选择合适的参数,理论上的最优解z1与z2存在固定的常数差值(此差值由ε决定),便不会出现z1无限大,远大于z2的情况了。如果将此技巧用在GAN的判别器中,即对生成器生成的样本输出概率值0变为β
2019年8月14日

【NLP】TransformerXL:因为XL,所以更牛

事实上,问题的关键在于,在计算当前序列当前层的隐藏状态时,如何引入前一个序列上一层的隐藏状态。TransformerXL的做法很简单,就是按照序列长度的维度将他们concate起来。如下的公式所示:
2019年8月13日

言有三新书再印,从理论到实践系统性学习计算机视觉

三大基础任务中的模型未能及时收录最新的模型,这一方面是基于书应该只收录稳定和经典的内容,另一方面也是因为技术发展太快。不过大家放心,主流内容和细节肯定是全的,新内容在公众号和知识星球中都有。
2019年8月12日

有三AI发布360页11万字深度学习CV算法工程师成长指导手册,可下载收藏打印,未完待续

于是问题就来了,怎样才能完成系统性学习呢。开源资料众多,但是广大新手们不一定能走上正确的学习路线,很多已经在本行的朋友也需要重新回过去查漏补缺自己的知识。
2019年8月12日

如何系统性掌握深度学习中的数据使用

数据集地址:https://www.kaggle.com/c/state-farm-distracted-driver-detection/data,发布于2016年。
2019年8月10日

【图像分类】 基于Pytorch的细粒度图像分类实战

这是因为细粒度图像间存在更加相似的外观和特征,同时在采集中存在姿态、视角、光照、遮挡、背景干扰等影响,导致数据呈现类间差异性大、类内差异性小的现象,从而使分类更加具有难度。
2019年8月9日

如何系统性掌握深度学习模型设计和优化

模型是深度学习的核心技术之一,我们平时在从事相关工作时,有很大一部分精力都在模型设计和优化上。对于新手朋友们来说,往往只会跑一跑别人的模型或者只会盲目的简单修改一下参数,不知道该如何进行设计和优化。
2019年8月7日

【每周NLP论文推荐】 NLP中命名实体识别从机器学习到深度学习的代表性研究

论文提出了一个无需人工标注就可以自动标记数据并训练NER的模型--AutoNER。实验表明,AutoNER训练的模型在3个数据集上均与有监督的benchmark相当。感兴趣的同学可以参考下。
2019年8月7日

【NLP】 深入浅出解析BERT原理及其表征的内容

上图是BERT的模型结构,它由多层的双向Transformer连接而成,有12层和24层两个版本。BERT中Transformer的实现与上一期讲的Transformer实现别无二致。
2019年8月6日

【每周CV论文推荐】 掌握残差网络必读的10多篇文章

假如进一步将残差连接的思想发挥到极致,把所有层都与其他所有层相连,就可以得到DenseNet。假如连接是双向的,就是CliqueNet。它们都是比原始的残差网络更加高效的设计,非常有用。
2019年8月5日

【知识星球】从SVM对偶问题,到疲劳驾驶检测,到实用工业级别的模型压缩技巧

改变了问题的复杂度。不管是直接采用优化方法还是拉格朗日方程的原问题,都需要直接求特征向量w,因此求解的复杂度与样本的维度有关。而在对偶问题下,直接求ai即可,这只和样本数量有关,复杂度降低了很多。
2019年8月4日

【杂谈】手把手带你配置深度学习环境

注意:这里的CMakeLists.txt是指在/opencv-4.0.0/samples/cpp/example_cmake目录下的CMakeLists.txt文件。
2019年8月3日

【AI不惑境】计算机视觉中注意力机制原理及其模型发展和应用

Net)[3]是2017届ImageNet分类比赛的冠军网络,本质上是一个基于通道的Attention模型,它通过建模各个特征通道的重要程度,然后针对不同的任务增强或者抑制不同的通道,原理图如下。
2019年8月1日

【每周NLP论文推荐】从预训练模型掌握NLP的基本发展脉络

读论文是做AI的人必需要下的功夫,所以咱们开通了专栏《每周NLP论文推荐》。本着有三AI的一贯原则,即系统性学习,所以每次的论文推荐也会是成系统的,争取每次能够把一个领域内的“故事”基本说清楚。
2019年7月31日

如何获得言有三个人技术指导,1小时0.1元,不要女朋友,只跟你聊(撩)!

6、额外福利。赠送价值不断升高的有三AI知识星球,赠送有三AI文化产品学习扑克牌(以后还会有更多,今天更有T恤赠送),优先获得有三AI唯一计算机视觉群的入群资格,星球和文化产品介绍如下:
2019年7月31日

【NLP】 理解NLP中网红特征抽取器Tranformer

上图是Transformer中self-attention的计算过程。其实在Transformer中,Q,K,V指的都是输入序列乘上不同的权重W_Q,W_K,W_V。上述过程,可以用如下的公式概括:
2019年7月30日

第二套产品发布!如何做一个更有身份的有三AI粉丝?

嘿嘿,今天又来发布有三AI第二套文化产品了。大家还记得我们第一套产品不,那就是有三AI大众版学习扑克牌,400套已经所剩无几了。
2019年7月30日

【知识星球】总有些骨骼轻奇,姿态妖娆的模型结构设计,不知道你知不知道,反正我知道一些

卷积操作本身具有非常固定的几何结构,标准的卷积操作是一个非常规矩的采样,通常是正方形,如果卷积核采用非规矩的采样,即它的形状不再是标准的方形,而是任意形状,则称之为可形变卷积(Deformable
2019年7月29日

【每周论文推荐】 初入深度学习CV领域必读的几篇文章

在VGG网络不能再通过加深得到进一步性能突破的时候,Inception模型(又名GoogLeNet)使用了拥有不同感受野并行的多分支Inception结构,进一步加深了网络深度并成为当年的基准模型。
2019年7月29日

【杂谈】为何有三AI只做原创,从不转载

在第一年里,大部分文章都是有三写的,但是我不希望以后也是这样。三人行必有我师,相互学习是不可缺少的。很多的朋友都有能力也有创作欲望,而我们平台正是提供了这样的机会,而且具有一些优势。
2019年7月28日

【图像分类】细粒度图像分类是什么,有什么方法,发展的怎么样

相对于粗粒度图像分类任务的数据集,细粒度图像数据获取难度要更大一些,其搭建往往需要更加专业的相关知识。近年来,越来越多的细粒度数据集出现,这也侧面反应了这一领域的发展势头和实际需求。
2019年7月27日

【杂谈】怎么使用有三AI完成系统性学习并赚钱

2《方向综述》,覆盖图像分类,分割,目标检测,图像降噪,GAN,可视化,损失函数等等内容,对计算机视觉或者深度学习的某一个研究方向进行深入全面的解读,几个代表性文章如下:
2019年7月26日

【知识星球】几个人像分割数据集简介和下载

数据集地址:http://www.cse.cuhk.edu.hk/~leojia/projects/automatting/,发布于2016年,无法下载可以移步有三AI知识星球。
2019年7月25日

有三AI 1000问回归,备战秋招,更多,更快,更好,等你来战!

不会入选的内容如:“目标检测的最新进展”,"怎么设计更高效的模型”等主题。会入选的内容如:“为什么图像分类输入大小多是224*224”,“OpenCV中彩色图像的顺序为什么是BGR而不是RGB”。
2019年7月24日

【NLP】 聊聊NLP中的attention机制

我们回想一下,引入Attention机制的本意,是为了在信息处理的时候,恰当的分配好”注意力“资源。那么,要分配好注意力资源,就需要给每个资源以不同的权重,Attention机制就是计算权重的过程。
2019年7月23日

【AI不惑境】深度学习中的多尺度模型设计

上面说了这么多的方法,相信动手能力强的同学一定可以基于这些方法进行排列组合和拓展。另外,对于某些领域中的专用技巧,比如目标检测中的不同尺度的Anchor设计,不同尺度的训练技巧,在这里没有讲述。
2019年7月22日

【杂谈】为什么有三AI自断财路,从来不接广告

熟悉我的人都知道,这个公众号倾注了我很多心血,我希望它专注/保持初心,个人风格便是如此。因为一点印刷失误,自己写的第一本书都不做二次宣传,公众号文章的内容和格式更是屡次打回给专栏作者,逐字逐句地读。
2019年7月21日

【Python进阶】你真的明白NumPy中的ndarray吗?

从上图可以明显的看出从要想到达第三维度(轴2),必须跨过第四维度(轴3),需要跨过3个元素,字节数为12;要想到达第一维度(轴0),必须跨过第二、三、四维度,总共12个元素,字节数为12*4=48。
2019年7月20日

【知乎直播】千奇百怪的CNN网络架构等你来

大家知道有三从很久很久之前就致力于CNN网络架构相关的研究,至今公众号已经写过很多的文章,知乎也回答过相关的问题,直播也做过几次分享,首先我们回顾一下已有的内容,然后再看看今天发布的新的直播预告!
2019年7月20日

【图像分类】 基于Pytorch的多类别图像分类实战

本次实战选择的数据集为Kaggle竞赛中的细胞数据集,共包含9961个训练样本,2491个测试样本,可以分为嗜曙红细胞、淋巴细胞、单核细胞、中性白细胞4个类别,图片大小为320x240。
2019年7月19日

【图像分类】从数据集和经典网络开始

本篇文章提炼出用于图像分类的数据集及其适用方向,涵盖人物、医学、动物、工业等多个领域,同时基于业界最权威的分类评价数据集——ImageNet,分析近年来图像分类中经典网络所取得的进展。
2019年7月19日

【知识星球】视频分析/光流估计网络系列上线

不管是Chairs还是Things3D,其中的运动幅度都是比较大的,而真实数据的运动位移很小,这就导致训练出来的模型在真实数据集上表现差,细不精度低,如下图左图。
2019年7月18日

【GAN优化】GAN训练的几个问题

在实践中,我们发现生成器往往不能涵盖所有的模式,通常只包含部分模式。在训练过程中,生成器的概率放置不断地从一个模式转换到另一个模式中,不断往复,这样训练结束后,生成器产生的样本必定有大量的重复。
2019年7月17日

【知识星球】猫猫狗狗与深度学习那些事儿

欢迎大家来到《知识星球》专栏,这两天有三AI知识星球会更新一些猫狗相关的数据集和任务,可爱的猫猫狗狗对深度学习可是做出了不少的贡献呢。
2019年7月16日

AI修行三十篇文章到不惑,已经掌握了什么,接下来还要说什么

基于数据的池化策略,归一化策略,优化方法,数据增强,模型搜索等技术全部都被技术人员广泛研究,如果不熟悉,那就读【AI不惑境】数据压榨有多狠,人工智能就有多成功先了解一下。
2019年7月16日

【NLP】 NLP中应用最广泛的特征抽取模型-LSTM

Schmidhuber指出可以选择恒等函数作为激活函数,并且令w_j,j=1便可满足上式,保证梯度在误差随时间传递之后不至于出现梯度消失或者梯度爆炸。这个想法很简单和朴素,因此Sepp
2019年7月15日

【知识星球】视频分类/行为识别网络和数据集上新

上表分别是只使用空间网络和只使用时间网络的结果,结果表明空间网络过拟合很严重,时间网络性能远超空间网络,说明运动信息更加重要。另外从5~10增加帧数有微小性能提升,所以最终使用的帧数是10。
2019年7月15日

【Python进阶】实战Python图形文件操作基本编程

当提到文件/文件夹遍历时我们就不得不提python中的os.walk这个简单易用的文件、目录遍历器。它可以帮助我们高效的处理文件、目录方面的事情。话不多说,我们直接看代码和具体用法。
2019年7月14日

【知识星球】超3万字的网络结构解读,学习必备

同时使用最大pooling和均值pooling算法,然后经过几个MLP层获得变换结果,最后分别应用于两个通道,使用Sigmoid函数得到通道的Attention结果。
2019年7月13日

【杂谈】什么是我心目中深度学习算法工程师的标准

实践出真知对吧,但是有一种思路又错了,就是直接去做大量的实践,跟着别人的项目敲代码,结果是抓住了别人给你的鱼,但是没有学会打渔。没有扎实的基础,做不到举一反三,这样的实践效率很低。
2019年7月13日

【图像分割应用】医学图像分割小总结

在心脏影像分析中,医学图像分割发挥了重要的作用,尤其在心脏钙化程度量化中得到了广泛应用。此领域比较常用的图像类型为CT图像和MRI图像(核磁共振图像),并在此基础上分割左心室、识别心脏钙化程度。
2019年7月11日

【知识星球】3D网络结构解读系列上新

欢迎大家来到《知识星球》专栏,这两天有三AI知识星球专注更新3D相关的网络模型解读,共10期左右。3D网络在视频数据,点云图像,3D医学图像,光流估计等领域有重要的作用,是当前的一类主流模型。
2019年7月11日

【知识星球】颜值,自拍,美学三大任务简介和数据集下载

database等。每一张图由60个人进行评分,共评为5个等级,这60个人的年龄分布为18~27岁,均为年轻人。这是第一个比较通用的人脸颜值数据集,每一个图都提供了86个关键点的标注。
2019年7月10日

【GAN优化】一览IPM框架下的各种GAN

第二期中,我们介绍了一类框架f-divergence,在f-divergence中,通过选择不同的f(x)来构造不同的距离,然后利用共轭函数对距离进行数学变换,使得可采样得到距离的一个近似:
2019年7月10日

【NLP】 深度学习NLP开篇-循环神经网络(RNN)

下面我们基于RNN的正向传播过程来介绍下RNN的反向传播过程。RNN的反向传播与DNN的反向传播的基本理论是一致的。差别在于,因为RNN是序列的输入,因此其反向传播是基于时间的,叫BPTT(Back
2019年7月9日

【图像分类】分类专栏正式上线啦!初入CV、AI你需要一份指南针!

进行完初始的网络搭建之后,我们将介绍提升网络性能的相关策略,从原理和工程的角度理解超参数的选择、网络层数设置、数据处理等多种方法的优点和缺点,更进一步的加深对分类网络的细节理解。
2019年7月8日

【图像分类】基于Pascal VOC2012增强数据的多标签图像分类实战

多标签图像分类网络的性能需要根据平均准确率精度(mAP)来进行分析,而平均精度准确率均值需要先对每个类别的平均准确率进行计算。根据分类网络我们可以得到图像在每个类别下对应的预测得分,其具体形式如下:
2019年7月7日

【知识星球】数据集板块重磅发布,海量数据集介绍与下载

有三AI知识星球的“数据集板块”正式上线,提供数据集介绍,论文下载,数据集下载3大功能,那些因为网速问题,因为需要签license的蛋疼问题,从此不再成为问题!
2019年7月7日

【知识星球】Attention网络结构上新,聚焦才能赢

继续咱们的“网络结构1000变”板块,最近上新的内容主要是Attention机制相关的网络结构,即网络如何选择真正感兴趣的区域进行处理,下面是一个代表,更多请移步知识星球网络结构1000变板块。
2019年7月6日

【AI大咖】ML宗师乔教主,Science评选的全世界最有影响力的计算机科学家

“AlphaGo只是大众的一场梦,很多领域中,计算机是可以打败人的,但它不是智能,我们不应该把AI当做是一个了不起的、能够打败人类的技术,而是应该将它看做一种新的元素,能够让我们用它重塑整个世界。”
2019年7月5日

【图像分割应用】医学图像分割(三)——肿瘤分割

肿瘤的分割是医学图像分析领域的一个重要内容,相比较前面提到过的脑区域分割和心脏分割,肿瘤分割任务由于个体间形状、纹理等差异大,从而实现更加困难。本文就来分析一下,肿瘤分割任务。
2019年7月4日

【知识星球】做作业还能赢奖金,传统图像/机器学习/深度学习尽在不言中

具体的玩法如上,每天早上,下午,晚上,有三会在星球发布有奖问答,第一个答对的同学将获得6.66元的奖励,内容覆盖传统图像算法,机器学习算法,深度学习基础,深度学习算法,数据相关以及其他知识等。
2019年7月3日

【GAN优化】详解SNGAN(频谱归一化GAN)

简单说,特征值分解其实是对线性变换中旋转、缩放两种效应的归并,奇异值分解正是对线性变换的旋转、缩放和投影三种效应的一个析构(当V的维度大于U的维度时存在投影效应)。
2019年7月3日

【NLP】经典分类模型朴素贝叶斯解读

这是NLP基础理论系列文章中最后一篇机器学习方面的文章了,后面开始介绍深度学习相关的内容了。其他经典的模型,例如SVM,决策树,EM等,如有需要,大家可以留言,小Dream哥视情况,要不要再补上。
2019年7月2日

【技术综述】深度学习在自然语言处理中的应用发展史

Pre-Training(GPT)采用单向语言模型,用Transformer作为特征抽取器,取得了非常不错的效果,但由于主创人员营销能力欠佳,并没有像下面这一个主角一样,在NLP领域掀起滔天巨浪。
2019年7月2日

【强化学习】从强化学习基础概念开始

什么是系统?系统是一个抽象定义。它所对应的具体实体可以是任何组成的物质存在。强调物质存在是系统存在的必要前提。系统大到星系宇宙,小到细胞、分子、原子。我们对所研究的对象作出边界定义后,就构成了系统。
2019年6月28日

【知识星球】网络结构1000变上线,下半年更新500+网络模型解读

Convolution不仅是不同分辨率的分组卷积网络,而且高分辨率和低分辨率通道还存在信息交换,因此可以称为高低频分组卷积网络,比普通的多分辨率分组卷积网络性能更加强大。
2019年6月28日

【图像分割应用】医学图像分割(二)——心脏分割

本文简要介绍了医学图像分割应用领域内的心脏分割,包括心室分割和全心脏分割。在进行任务分析和难点解读后,给出了几个应用范例。下期我们一起来看一下医学领域分割的最后一个子方向:肿瘤分割。
2019年6月27日

【图像分割】图像分割专栏栏主自述:分割,我们究竟在研究什么?

后来随着研究的慢慢深入,我慢慢接触了计算机视觉的几个细分领域,掌握的知识和技能也逐渐丰富。此时,计算机视觉与神经网络在我的脑海才真正算是有了点形态,其中的趣味也就慢慢显露了。
2019年6月27日

【GAN优化】详解对偶与WGAN

Wasserstein距离是一个数学性质非常良好距离度量,数学形式稍微有点复杂。我们用一个小例子来引入,定义两个离散概率分布P和Q,其随机变量取值只能为1,2,3,4。如何对P调整使其等于Q?
2019年6月26日

【GAN优化】GAN优化专栏栏主小米粥自述,脚踏实地,莫问前程

学习的时候,我比较喜欢写一些总结,之前也在CSDN上写过一点内容,恰好龙鹏师兄也恰好在创业做相关的事情,很自然也很巧合的,就成了一个专栏作者了。
2019年6月26日

【NLP】 NLP专栏栏主自述,说不出口的话就交给AI说吧

常听人说,我这人内向,话不多;常听人说,我这人口讷,说了不该说的话。或多或少,是这些“风言风雨”,让我在接触AI早期,在CV和NLP之间选择了NLP。
2019年6月25日

【NLP】用于序列标注问题的条件随机场(Conditional Random Field, CRF)

从上面的定义可以看出,条件随机场与HMM之间的差异在于,HMM中,Y在i时刻状态与其前一时刻,即y(i-1)相关。而在CRF中,Y在i时刻的状态与其前后时刻,即y(i-1)与y(i+1)均相关。
2019年6月25日

【技术综述】多标签图像分类综述

1-错误率用来计算预测结果中排序第一的标签不属于实际标签集中的概率。其思想相当于单标签分类问题中的错误率评价指标。1-错误率越小,说明预测结果越接近实际标签,模型的预测结果也就越好。
2019年6月24日

【Python进阶】Python进阶专栏、编程与开源框架知识星球上线,等你来follow

Python高级库使用。Python如此受欢迎,一方面是其简单易用,另外一方面就是库众多,而且强大,本专栏将带领大家深刻的掌握NumPy、Scipy、Matplotlib、Pandas的高级用法。
2019年6月23日

【强化学习】数据科学,从计算到推理

science》的教材。这门课程主要介绍了统计学、推理、计算机科学的一些基础理论与关键技术,以及如何提出数据问题。教材中包含了数据科学方向学生需要了解的基础知识,是以开源项目的形式进行维护的。
2019年6月21日

【知识星球】千奇百怪的网络结构板块更新到哪里了?

《网络结构》是有三AI知识星球的一个板块,在这里,我们会覆盖几乎所有有意义的网络结构,每日一更,配以图文阅读+论文下载,下面请看当前更新状态。
2019年6月20日

【杂谈】菜鸟误入linux会有哪些惨痛的经历

下载地址https://opencv.org/releases.html,选择3.1.0版本sources下载,解压到/home根目录下,文件夹重命名为opencv
2019年6月20日

【NLP】用于语音识别、分词的隐马尔科夫模型HMM

经过上面的讲述,各位读者可能还是会对HMM有一种似懂非懂的感觉。所以这一节中介绍其在分词应用中的实践,通过完整实际的思路介绍和代码讲解,相信各位读者能够对HMM模型有一个准确的认识。
2019年6月19日

【GAN的优化】从KL和JS散度到fGAN

其中要求f(u)为凸函数,且f(1)=0。f(1)=0保证了当两个分布完全重合时,f散度为0。f(u)为凸函数保证了f-divergence的值非负。我们用Jensen不等式来简单证明一下:
2019年6月18日

【AI不惑境】移动端高效网络,卷积拆分和分组的精髓

convolution,相关的内部报告可以参考YouTube视频https://www.youtube.com/watch?v=VhLe-u0M1a8,具体的实现在它的博士论文[2]中,如下示意图。
2019年6月17日

【强化学习】强化学习专栏上线,60多篇文章等你follow

“如何最佳的匹配状态和动作”,强化学习所解决的这样很具有普遍性的问题使得强化学习在机器人学,最优控制,棋类对弈,策略博弈,飞行控制,导弹制导,预测决策,金融投资以及城市交通控制等领域都有大量的应用。
2019年6月14日

【图像分割应用】医学图像分割(一)——脑区域分割

脑部区域分割中的第一个难点是将脑与非脑(如头骨)区域区分开。在MRI图像的分割中,脑组织的亮度是一个非常重要的特征。然而,由于MRI图像中存在的噪声、部分容积效应(PVE)、偏压场效应(bias
2019年6月13日

【GAN优化】GAN优化专栏上线,首谈生成模型与GAN基础

在机器学习或者深度学习领域,生成模型具有非常广泛的应用,它可以用于测试模型的高维概率分布的表达能力,可以用于强化学习、半监督学习,可以用于处理多模输出问题,以及最常见的产生“真实”数据问题。
2019年6月12日

【NLP】自然语言处理专栏上线,带你一步一步走进“人工智能技术皇冠上的明珠”。

这里我不想再赘述,NLP技术的应用和意义,有太多的人为它背书了。下面我以构建一个能够提供查询天气服务的聊天机器人为例子,来介绍NLP任务中涉及到的一些技术,以及如何用这些技术实现对人类语言的理解。
2019年6月10日

有三AI“夏季划”出炉,今夏进阶中级CV算法工程师

有三AI大众版扑克牌,是有三AI出品的第一款产品,每一张扑克牌都是一篇技术文章,对应深度学习开源框架,深度学习模型,AI产品与就业机会,AI相关的学习资源,可以集收藏与娱乐于一身,更多可阅读介绍:
2019年6月10日

【完结】12篇文章带你逛遍主流分割网络

但是,基于插值的上采样效果通常不理想,而反卷积操作则增加了计算量。基于此,DeepLab中就提出了“空洞卷积”的概念,在不增加参数个数的基础上,实现感受野与分辨率的控制。
2019年6月7日

【AutoML】AutoML专栏上线,跟Google一起见证调参党的末日?

一直以来,网络结构的设计是一个非常需要经验且具有挑战性的工作,研究人员从设计功能更加强大和更加高效的模型两个方向进行研究,我之前在知乎上也做了两个live直播讲述对应的核心技术,感兴趣可以去听听。
2019年6月5日

【图像分割模型】全景分割是什么?

与实例分割度量的比较:标准的实例分割度量考察平均精度,即每个目标分割的置信概率用于估计precision或recall;然而,这类度量无法适应语义分割和全景分割任务的要求。
2019年6月4日

有三AI正式跨入2.0,诚邀参与内容创作以及广告须知

作为一个技术人员,编程技能是最重要的素质。AI领域不仅需要熟练掌握python,c++等编程语言基础,更需要玩转各类深度学习开源框架,所以,这里可以创作的内容非常多,代表性的内容如下:
2019年6月3日

【图像分割模型】实例分割模型—DeepMask

区别于本系列之前介绍的语义分割任务,实例分割任务有其自己的任务需求与度量矩阵。简单来讲,语义分割只分割视野内目标的类型,而实例分割则不仅分割类型,同时还需要分割同类型的目标是否为同一个实例。
2019年5月30日

再印!抽奖!有三AI学习扑克牌新一批货到

如何解锁高效写代码姿势?GitHub上有哪些优质的机器学习与深度学习资源?通过哪些国内外论坛和大神距离更近?如何最快最直接查找最新论文?先干为敬这12碗干货,熬夜学习时读一下让你神清气爽。
2019年5月29日

【图像分割模型】BRNN下的RGB-D分割—LSTM-CF

输入深度信息后,LSTM-CF利用HHA描述,将深度信息转换成视差、表面法线和高这三个通道的信息。随后,利用ReNet提取不同方向上的上下文信息,并在两个方向进行双向传播。
2019年5月28日

【移动端DL框架】当前主流的移动端深度学习框架一览

Caffe2是facebook在2017年发布的一个跨平台的框架,不仅仅支持Windows,Linux,Macos三大桌面系统,也支持移动端iOS,Android,可以说是集训练和推理于一身。
2019年5月27日

【完结】TensorFlow2.0 快速上手手册

不管你是AI小白,还是已经学习很久的大神,对于TensorFlow2.0,我们或许都需要重新学,因为它的变化太多了。当你学习TensorFlow2.0时,有如下建议供你参考:
2019年5月24日

【图像分割模型】用BRNN做分割—ReSeg

Network)的输入是序列形式的。即使在处理图像时,通常也需要对图像矩阵进行展开(flatten)操作,再应用RNN。输入序列数据后,RNN在序列的演进方向递归所有节点,并将其定向链式连接。
2019年5月23日

【图像分割模型】多分辨率特征融合—RefineNet

具体而言,网络首先通过一个卷积层处理输入进来的不同分辨率下的分割结果,从而学习得到各通道下的适应性权重。随后,应用上采样,统一所有通道下的分割结果,并将各通道结果求和。求和结果送入下一个模块。
2019年5月22日

【Git项目】想成为大咖,先从八卦大咖开始,这个GitHub项目你值得拥有

包括个人的成长经历,和其他大佬们的江湖故事,展现大咖们的个性,以Hinton为例,就出身在了一个非常牛逼的家族,其故事的精彩程度绝对可以上演一部辉煌的电视剧。
2019年5月21日

这便是有三AI一年的底蕴,那些5000粉丝1000阅读量的AI技术干货

Alpha版发布后,API也发生了很大的改变,基本上相当于重新学习tensorflow,我们开设了2.0专栏。其中Keras便是必须使用的接口了,那就一起来吐槽全世界都是Keras吧。
2019年5月20日

【AI大咖】扒一下低调的Yoshua Bengio大神

论资排辈,自然是Hinton>Lecun>Bengio,还记得之前提到的AI鼻祖Hinton门下徒子徒孙遍地,AI界许多大神都和他有着千丝万缕的关系,以下有个简单的人物关系网。
2019年5月19日

【TensorFlow2.0】如何搭建网络模型?

我们可以把Sequential理解为一个容器,然后把layers搭建的每层模型都送进这个容器中,构成整个网络模型。值得注意的layers搭建的每层模型要想放进这个容器中必须是list结构。
2019年5月17日

【图像分割模型】全局特征与局部特征的交响曲—ParseNet

在实际应用中,许多方法的理论感受野是很大的。比如前面文章中介绍过的带VGG的FCN网络中的fc7层,其理论感受野为404x404像素。但是,实验却证明,其并没有办法看到这么大的区域。
2019年5月16日

【AI不惑境】残差网络的前世今生与原理

当我们直接将一个输入添加到输出的时候,输出y可以明确的拆分为H(x,Wh)和x的线性叠加,从而让梯度多了一条恒等映射通道,这被认为对于深层网络的训练是非常重要的,一个典型的resnet网络结构如下:
2019年5月14日

【TensorFlow2.0】数据读取与使用方式

"categorical"会返回2D的one-hot编码标签,"binary"返回1D的二值标签。"sparse"返回1D的整数标签,如果为None则不返回任何标签,生成器将仅仅生成batch数据。
2019年5月13日

有三AI一周年了,说说我们的初衷,生态和愿景

言有三,本名龙鹏,先后就读于华中科技大学本科,中国科学院硕士,先后就职于奇虎360AI研究院,陌陌深度学习实验室。至于为什么要叫言有三,这个问题以前专门写过一篇文章,如果你感兴趣,可以去读一下。
2019年5月10日

有三AI终于摊牌了,第一款产品上市!

4K相聚、扑克飞来、数学猜牌、天地变色,简单的小互动轻松实现你魔术师的梦想,扑克牌是必备哦!要知道被唱歌耽误的魔术师周董,婚后还给昆凌创造魔术惊喜。对于奶茶小公举,我只想说:请盘我!
2019年5月9日

【图像分割模型】多感受野的金字塔结构—PSPNet

本文我们了解了上下文信息整合的多尺度估计网络PSPNet和其中的金字塔池化模型。除了同种特征的堆叠,我们还可以利用多特征融合提升分割的效果。下期我们就一起来看一下ParseNet。
2019年5月9日

“有三AI百人”专栏作者培养计划启动,爱写作的你还等什么呢?

我跟很多人都说过公众号的愿景,将来要是一个“作者以在有三AI发表一篇技术文章为荣,阅读者可以在这个平台完成学习闭环”的平台,那么创作者就是我们公众号真正的灵魂。
2019年5月8日

【TensorFlow2.0】以后我们再也离不开Keras了?

Alpha版已经发布,在2.0中最重要的API或者说到处都出现的API是谁,那无疑是Keras。因此用过2.0的人都会吐槽全世界都是Keras。今天我们就来说说Keras这个高级API。
2019年5月7日

【AI不惑境】学习率和batchsize如何影响模型的性能?

原理上各种改进的自适应学习率算法都比SGD算法更有利于性能的提升,但实际上精细调优过的SGD算法可能取得更好的结果,在很多的论文[3-4]中都得到过验证,我们在实验中也多次证明过这一点,如下图。
2019年5月6日

揭秘7大AI学习板块,这个星球推荐你拥有

AI知识汇总。这个板块是对知识的总结梳理,通过一张图的方式进行展现,也会涉及所有AI领域,可能是来自于公开论文,也可能是我自己的整理。
2019年5月6日

这个春天,有三最后一月的学习“季划”招生

接下来我再稍微做一点补充,总的来说,就是覆盖从“编程基础”,“开源框架”,到5个实践项目的难度从低到高的学习流程,下面是一张图供大家理解,该有的已经都列举出来了,列举出来的自然也是会有的。
2019年5月5日

言有三新书预售,不贵,有料

三大基础任务中的模型未能及时收录最新的模型,这一方面是基于书应该只收录稳定和经典的内容,另一方面也是因为技术发展太快。不过大家放心,主流内容和细节肯定是全的,新内容等着公众号就好了。
2019年5月5日

有三AI小程序上线,把你的代码show给世界

目前这个小程序是我五一期间赶着写上去的,程序还不够鲁棒。后台的服务器是一个2核CPU的ubuntu系统(GPU贵啊,有三吃土中),配置还不如日常办公笔记本,有几个注意事项请大家注意一下:
2019年5月3日

【AI产品】五一出游赏花草,你一定需要这款“形色”

而当数据量不断增加后,数据的清洗和标注又是另外一个更为复杂问题,形色团队在这方面上也可以称的上斥巨资。通过数据集上的努力,形色最初的模型比较简单,获得的准确率接近50%,这让团队看到了希望。
2019年5月1日

【AI不惑境】网络的宽度如何影响深度学习模型的性能?

从AlexNet的96层到Vgg,Resnet等多数网络使用的64层,到高效网络Mobilenet的32层和Shufflenet的24层,似乎已经探到了下限,再往下性能就无法通过其他的方法来弥补了。
2019年4月30日

【AI产品】超长文详解作业帮产品逻辑和技术原理

在家长端,主打的特色功能是口算批改和作文搜索,则该需求的指向性更为明显,背后的技术原理和流程本质上和作业帮也是比较相似的,但家长版的整体体验更加简洁,因为对于家长而言,更多的是起到辅助和陪伴的角色。
2019年4月29日

【杂谈】除了有三写的230+,还有谁在有三AI公众号写文章

过去的一年里,有三写了200多篇,超过30万字的技术文,接下来当然会接着写文章,但是也有另外一个很重要的事情,就是“人才培养”,或者说“专栏作者的培养”,今天来对我们的文章写作情况做一个汇总。
2019年4月28日

【图像分割模型】以RNN形式做CRF后处理—CRFasRNN

从定义上来说,当一个随机过程在给定现在状态及过去所有状态的情况下,其未来状态的条件概率分布仅依赖于当前状态;换句话说,在给定现在状态时,其过去状态(即该过程的历史路径)是条件独立的。
2019年4月27日

【TensorFlow2.0】TensorFlow2.0专栏上线,你来吗?

TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,自2015年问世,并在去年11月迎来三周岁生日,已经发展为世界上最受欢迎和被广泛采用的机器学习平台之一。
2019年4月27日

【直播预告】如何设计性能更强的CNN模型

有三带领的2019年小队精英学习“春季划”已进入深度学习篇,想上车速来,仅此一趟,点击跳转领取。
2019年4月26日

【AI大咖】再认识Yann LeCun,一个可能是拥有最多中文名的男人

无助。在此期间也正是神经网络所处的冰点期。2003年,LeCun为自己的重生打下了基础。那一年,他成为纽约大学教师,并与Hinton和Bengio结成非正式的联盟,共同重启对神经网络的研究。
2019年4月26日

【完结】AI1000问以后知识星球和B站见啦

做图像处理的我们应该都知道,OpenCV是我们必备的一个工具,在使用OpenCV读取图像时你应该也发现了读取出来的数组居然是BGR格式,而不是我们听的最多,用的最多的RGB格式,这是为什么呢?
2019年4月25日

【AI不惑境】网络深度对深度学习模型性能有什么影响?

看下面的一个对比图[2],实线是一个只有一层,20个神经元的模型,虚线是一个2层,每一层10个神经元的模型。从图中可以看出,2层的网络有更好的拟合能力,这个特性也适用于更深的网络。
2019年4月24日

【完结】深度学习CV算法工程师从入门到初级面试有多远,大概是25篇文章的距离

所以这是对还没有在Linux上面真正进行日常开发工作的小朋友说的,要正式进入AI行业发展,Linux是必备和唯一的操作系统,“软”兵器,我还没有听过哪家公司在Windows或者Mac上面训练模型的。
2019年4月23日

【AI产品】深扒美图秀秀中掳获万千少女芳心的“AI秘籍”

不可否认,基于机器学习原理,Andy接受的训练数据越来越多,“绘画经验”越来越丰富,它已经从一个机械死板的绘画小白,变得越来越成熟,而美图爸爸给它的终极定位是向它的兄弟微软小冰看齐,称霸AI绘画界。
2019年4月22日

【图像分割模型】快速道路场景分割—ENet

其中,图(a)对应的是ENet的初始模块,也就是前文提到的缩小输入图像分辨率,从而去除视觉冗余、减小计算量的部分;图(b)对应的则是重复使用,从而构建网络主体的bottleneck模块。
2019年4月21日

【完结】优秀的深度学习从业者都有哪些优秀的习惯

有些bug的产生,是因为初学者的误操作,有些bug的出现,是必然的环境冲突,需要我们定制环境。频繁面对bug的时候,最需要的首先是保持心平气和,冷静一下再解决,毕竟这是程序员一辈子的事儿。
2019年4月20日

【杂谈】如何应对烦人的开源库版本依赖-做一个心平气和的程序员?

https://github.com/NVIDIA/nvidia-docker/releases/download/v1.0.1/nvidia-docker_1.0.1-1_amd64.deb
2019年4月19日

【AI-1000问】segmentation和matting有什么区别?

它与图像分割不同,也是我们通常所说的抠图。我们知道photoshop里面可以抠图,有个边缘羽化的功能,大家如果分割完直接替换背景,可能会带来很多不自然的边缘过度,一眼就能看出来是假图。
2019年4月18日

【知识星球】每日干货看图猜技术,你都会吗?

1、我们的所有技术文章都是非常系统性的,甚至是难度依次增加的,这带来了一个劣势,就是灵活性不够。虽然我不是很喜欢碎片化的知识,但是如果在玩耍中学习到知识,倒是不失为一个学习的好途径。
2019年4月18日

【AI产品】产品小姐姐分析抖音背后的计算机视觉技术

但是同时体验中也有一个感受是,有些功能存在相近或冗余,比如之前大火的所谓控雨术,在体验中发现并没有什么“控制的效果”,同时对于道具的分类也不是十分清晰,有点混乱,可能也是由于功能选项实在是太多了。
2019年4月17日

【AI大咖】认真认识一代AI教父Hinton

2006年Hinton在Science上发表文章揭开了深度学习的序幕。2009年Hinton的2位学生使用神经网络赢下了一个语音识别比赛。2012年另外两个学生轻松赢下了当年的ImageNet
2019年4月16日

有三AI VIP会员发售,你的私人AI顾问已上线

平台花了很大的心血,多少有一些口碑,所以慕名而来问问题的朋友很多,通常情况下我会直接邀请进群(我们技术群快满了,满员后不再加人,群多了是种心理负担),问的问题大概有以下几类。
2019年4月15日

【分割模型解读】感受野与分辨率的控制术—空洞卷积

下图是空洞卷积结构的示意图,从左到右比率(rate)分别为1、6和24,比率可以粗暴理解为卷积核内相邻两个权重之间的距离。从图中可以看出,当比率为1的时候,空洞卷积退化为常见的卷积。
2019年4月14日

【杂谈】AI工业界都有哪些值得参加的比赛?

对于FlyAI竞赛平台,由于有三AI作为FlyAI的合作伙伴,自然是有一些特殊权益的,可以添加有三微信Longlongtogo或者小助手微信flyaixzs,或者在本文下方留言,从专属链接跳转。
2019年4月13日

【直播预告】计算机视觉中数据增强原理和实践

应广大粉丝要求,以后有三AI会多组织直播,分享更多实践的干货知识,下面预告一下下周六的知乎Live直播-计算机视觉中数据增强原理和实践。
2019年4月12日

【杂谈】扒一扒Reddit,Medium,Quora与知乎等国内外高质量AI社区与内容平台

许多企业都采用Medium作为全公司或其中一个项目的博客发布平台,包括Airbnb,Facebook,Kickstarter,Udacity,Block.one,Square,Towards
2019年4月11日

【杂谈】天下苦公众号久矣,如何利用这几类公众号进行深度学习?

有三AI知识星球组建了,会在里面随时分享更多好用,好玩的知识噢,已经先后有国内各大互联网公司的大咖加入,还有很多优秀的自媒体个人,相信大家都认识的就不做过多介绍了。(目前知识星球维护中)
2019年4月10日

【AI不惑境】数据压榨有多狠,人工智能就有多成功

于是专家设计出各种各样的模型架构和优化目标来指导系统从数据中进行学习,与有监督的特征工程的最大区别在于使用数据的方式,这一类方法也被称为特征学习,于是我们有了传统的机器学习算法和深度学习算法之分。
2019年4月9日

【技术综述】深度学习中的数据增强方法都有哪些?

depth等方法,是专门设计来限制模型的有效容量的,用于减少过拟合,这一类是显式的正则化方法。研究表明这一类方法可以提高泛化能力,但并非必要,且能力有限,而且参数高度依赖于网络结构等因素。
2019年4月8日

【AI-1000问】为什么CNN中的卷积核半径都是奇数?

在CNN中,卷积核的大小是3*3或者5*5是最常见的。也就是说我们见到的卷积核几乎都是奇数*奇数的。在LeNet5中两个卷积层的卷积核都是5*5。
2019年4月7日

【图像分割模型】编解码结构SegNet

SegNet与FCN的对应结构相比,体量要小很多。这主要得益于SegNet中为了权衡计算量而采取的操作:用记录的池化过程的位置信息替代直接的反卷积操作。具体如下图所示。
2019年4月7日

【AI-1000问】为什么现在大家喜欢用3*3小卷积?

2、参数变少了,两个3*3和一个5*5的参数比例为3×3×2/(5×5)=0.72,同样的三个3×3和一个7×7参数比例为3×3×3/(7×7)=0.55,将近一倍的压缩,这可是很大提升。
2019年4月5日

【AI-1000问】训练为什么要分测试集和验证集?

在很多的书以及一些公开数据集中,都会将数据集分为训练集,验证集和测试集,看起来验证集和测试集并没有区别,为什么要分这两个呢?
2019年4月4日

【杂谈】深度学习必备,各路免费爬虫一举拿下

image_downloader_gui.py调用GUI界面,配置好参数(关键词,路径,爬取数目等),关键词可以直接在这里输入也可以选择从txt文件中选择。
2019年4月3日

【杂谈】想成为机器学习学霸?先学会做笔记吧

每个方法和工具都有它的特点和存在价值,大家可以根据自己的习惯进行选择,选定后就不要离手了。好的笔记工具可以帮助我们提高工作效率,但是最重要的事情还是坚持每天记笔记,经常整理笔记,这样才能更好地成长。
2019年4月2日

【公开课】“有三说深度学习”上线

第二篇:讲述开源框架,深度学习在图像分类,分割,检测,跟踪等各类任务中的核心技术,讲述基于经验的模型的设计和优化,自动化的模型设计和超参数搜索技巧。
2019年4月1日

【完结】给新手的12大深度学习开源框架快速入门项目

在选择开源框架时,要考虑很多原因,比如开源生态的完善性,比如自己项目的需求,比如自己熟悉的语言。当然,现在已经有很多开源框架之间进行互转的开源工具如MMDNN等,也降低了大家迁移框架的学习成本。
2019年4月1日

【图像分割模型】从FCN说起

如前文所述,将全连接层替换成卷积层的优势之一,是可以使网络用于稠密估计任务,并实现端到端训练。比如下图中,将全连接层替换成卷积层后,可以使得网络输出一个热度图(heatmap),而非单个类别标签。
2019年3月31日

【杂谈】提升写代码效率不得不做的三件事

通过插件可以被拓展出许多不同层次的功能,我们常用的插件有Vundle、YouCompleteMe、Solarized、nerdcommenter等等插件,具体插件的安装请看我们往期的文章:
2019年3月30日

【杂谈】三人行必有AI,你会在其一吗?

科技的不断进步,AI时代的到来,编程的能力会是人人都应该具备的能力之一,就像现在,你我他都应该学会使用计算机、手机和互联网一样,未来,如果不会编程或许就像现在身边不会用电脑的那些人一样被边缘化。
2019年3月29日

【完结】12篇文章告诉你深度学习理论应该学到什么水平

第一步知道你要做的任务是一个什么任务,找到竞争对手做好预期,想好你需要什么样的数据。第二步确定好框架,基准模型,准备好数据。然后才是第三步开始训练,从输入输出,数据的预处理到维持正确地训练姿势。
2019年3月29日

【darknet速成】Darknet图像分类从模型自定义到测试

以上就是data目录的内容,包含了各种各样的文件。图片就是测试文件了,不必说。我们首先看看imagenet.labels.list和imagenet.shortnames.list里面是什么。
2019年3月28日

【AI初识境】给深度学习新手做项目的10个建议

比如你要做一个表情识别API,要做一个美颜算法,一定要先看看你的竞争对手做的怎么样了,就算最后你做出来跟别人还差十万八千里,也不至于到最后一刻才发觉。这叫知人之明和自知之明,一定要先有。
2019年3月28日

【Lasagne速成】Lasagne/Theano图像分类从模型自定义到测试

一直没说theano是因为它的使用成本真的有点高,需要从底层开始写代码构建模型,不过今天说的这个是封装了theano的高层框架,即Lasagen,它使得theano使用起来更简单。
2019年3月27日

有三AI知识星球官宣,BAT等大咖等你来撩

毕竟不是所有的小伙伴都可以成为公众号的博主,这需要付出很多的时间,但是在社区里,你可以充分展示自己的才华,获得众人的关注,成为人气小偶像,甚至获得不少的付费收入,还有老大们的另眼青睐。
2019年3月26日

【MatConvnet速成】MatConvnet图像分类从模型自定义到测试

datadir='/home/longpeng/project/LongPeng_ML_Course/projects/classification/matconvnet/conv3/mouth';
2019年3月26日

【AI初识境】深度学习中常用的损失函数有哪些?

原始的GAN的损失使用了JS散度,两个分布之间越接近,它们的JS散度越小,但实际上这并不适合衡量生成数据分布和真实数据分布的距离,相关的分析已经非常的多了,本文如果展开就太长了,因此直接给解决方案。
2019年3月25日

【杂谈】从GitHub上星星最多的男人开始发GitHub综述资料

Github就像程序员的免费淘宝店,什么都有,良莠不齐,这次介绍的项目大多星星都很多,不过也不要过度迷恋星星,星星是可以运营出来的。慧眼识珠,多积累吧,以后会开专栏讲讲怎么用GitHub的。
2019年3月24日

【杂谈】那些酷炫的深度学习网络图怎么画出来的?

《有三AI知识星球》组建了,从下周开始,会在里面随时分享更多好用,好玩的知识噢,已经先后有国内各大互联网公司的大咖加入,还有很多优秀的自媒体个人,相信大家都认识的就不做过多介绍了。
2019年3月23日

【DL4J速成】Deeplearning4j图像分类从模型自定义到测试

欢迎来到专栏《2小时玩转开源框架系列》,这是我们第九篇,前面已经说过了caffe,tensorflow,pytorch,mxnet,keras,paddlepaddle,cntk,chainer。
2019年3月22日

【技术综述】基于弱监督深度学习的图像分割方法综述

论文中还提出了一些DeepCut方法的变体,并将它们与其它算法在弱监督条件下进行了比较。值得注意的是,该算法在解决大脑和肺的两个问题上已经得到了实验,精度还不错(使用的数据库是fetal
2019年3月20日

免费GPU刷比赛,拿奖金,第100名也能赢!

平台拥有高质量的数据集、多领域的开源项目案例,项目涉及领域:自然语言处理、图像识别、语音识别等,每周更新高质量项目专属代码样例,免费下载查看,支持多平台运行,一键配置学习环境,下面展示一些比赛
2019年3月19日

【AI-1000问】为什么信号有单位而且是dB?

dB在我们的生活中是一个常见的单位,如果你仔细观察,肯定多次见过。在无线通讯领域,衡量一个地点的某一无线基站通信信号强度我们用dB表示;在天线技术方面,dB是衡量天线性能的一个参数,名称为增益。
2019年3月19日

【AI初识境】深度学习模型评估,从图像分类到生成模型

如果对于每一类,我们想知道类别之间相互误分的情况,查看是否有特定的类别之间相互混淆,就可以用混淆矩阵画出分类的详细预测结果。对于包含多个类别的任务,混淆矩阵很清晰的反映出各类别之间的错分概率,如下。
2019年3月18日

【chainer速成】chainer图像分类从模型自定义到测试

相反,chainer采用“Define-by-Run”方案,即通过实际的前向计算动态定义网络。更确切地说,chainer存储计算历史而不是编程逻辑。这样,Chainer不需要将条件和循环引入网络定义
2019年3月17日

【杂谈】如何学会看arxiv.org才能不错过自己研究领域的最新论文?

这时,刚刚黑色的图标变成了蓝色,点击上面的library标签,可以看到它出现在了最上方。你可以像这样收藏很多自己感兴趣的文献。想删除的时候,在自己的library里面再次点击那个图标就可以删除了。
2019年3月16日

【AI-1000问】softmax loss和交叉熵有什么关系?

按照香农的理论,熵背后的原理是任何信息都存在冗余,并且冗余大小与信息中每个符号(数字、字母或单词)的出现概率或者说不确定性有关。概率大,出现机会多,则不确定性小,这个关系就用对数函数来表征。
2019年3月15日

【AI-1000问】你知道为什么GoogLeNet也被称为InceptionNet吗?

module”,二就是其直接含义——网络深度(depth)的增加。今天【AI-1000问】第六问,我们就聊聊GoogLeNet为什么也被称为InceptionNet?
2019年3月13日

有三AILab成立 | 寻找合适的你

2、让有能力的人找到产出的平台,获得回报。虽然现在文章是由我和学生汤兴旺产出,今后一定要培养更多优秀的写作者,拓宽有三AI覆盖的知识面。
2019年3月13日

【小结】据说能回答出这5个问题,至少3年AI老司机

相信大家也都知道LeNet5这个经典的卷积神经网络,它有3个全连接层,输出维度分别是120,84,10,不知道大家知不知道为什么倒数第2个全连接层的维度是84呢?你第一时间思考出答案了吗?答案在此:
2019年3月12日

【AI初识境】如何增加深度学习模型的泛化能力

Dropout在2014年被H提出后在深度学习模型的训练中被广泛使用。它在训练过程中,随机的丢弃一部分输入,此时丢弃部分对应的参数不会更新。所谓的丢弃,其实就是让激活函数的输出为0。结构示意图如下。
2019年3月11日

【AI-1000问】人脸的4个方向,你还分的清楚吗?

matching,它在识别阶段更多的是采用分类的手段。它实际上是对进行了前面两步即人脸检测、人脸校正后做的图像(人脸)分类。即人脸识别包括下面三个模块:
2019年3月10日

重新解释“季”划 & 为什么我不是在搞培训

与大部分知识平台一样,东西有付费的有免费的,免费的肯定没有付费的好,我们的做法是每100个设置价格梯度,现在发售的是第一期VIP会员,共100名,价格999,有效期一年,报完截止。
2019年3月8日

【前沿技术】浅析搜狗AI主播背后的核心技术

特征点和纹理不明显。图像处理最需要的就是明显的特征,而光滑的人脸除了特征关键点,很难在脸部提取稠密的有代表性的角点特征。这个特点,使得那些采用人脸配准然后求取三维坐标的方法面临着巨大的困难。
2019年3月7日

【AI-1000问】机器学习和模式识别是什么关系?

当然,现在已经不需要去刻意区分它们,模式识别多是一个工业界的概念,机器学习则流行于学术界,经典书籍Pattern
2019年3月7日

【AI-1000问】为什么OpenCV读取的图像格式是BGR?

今天的问题就到这里了,不知道是否解决了您心中的困惑呢?另外如果您在学习深度学习过程中遇到不懂且有趣的问题欢迎留言,说不定下一问就解答您的问题呢?
2019年3月6日

【AI初识境】被Hinton,DeepMind和斯坦福嫌弃的池化,到底是什么?

所谓感受野,即一个像素对应回原图的区域大小,假如没有pooling,一个3*3,步长为1的卷积,那么输出的一个像素的感受野就是3*3的区域,再加一个stride=1的3*3卷积,则感受野为5*5。
2019年3月5日

创业第一天,有三AI扔出了深度学习的150多篇文章和10多个专栏

擅长领域包括:熟悉caffe,tensorflow,pytorch,mxnet等主流机器学习平台。熟悉图像基础任务,AI美学,2D与3D人脸,GAN,深度学习模型优化等领域。
2019年3月4日

裸辞,迎接2019年的春天

年轻人总是为爱情而纷纷扰扰的,不过我这里平淡如水。喜欢的不是漂亮的,盛世容颜不过十年。也不是出身好的,万贯家财身外之物。喜欢有故事的人,当然这故事不是情史,而是奋斗史。
2019年3月3日

【AI-1000问】为什么LeNet5倒数第二个全连接层维度为84?

另外0~31以及127是控制字符/通信字符,控制字符如:LF(换行)、CR(回车)、DEL(删除)等;通信字符如:SOH(文头)、EOT(文尾)、ACK(确认)等,这两类字符是不可打印的。
2019年3月2日

【AI-1000问】为什么深度学习图像分类的输入多是224*224

解答2:所以要找一个7*2的指数次方,并且在300左右的,其中7*2的4次方=7*16=112,7*2的5次方等于7*32=224,7*2的6次方=448,与300最接近的就是224了。
2019年2月28日

【AI初识境】为了围剿SGD大家这些年想过的那十几招

2018最佳论文提出了AMSgrad方法,研究人员观察到Adam类的方法之所以会不能收敛到好的结果,是因为在优化算法中广泛使用的指数衰减方法会使得梯度的记忆时间太短。
2019年2月27日

【杂谈】学深度学习的你有GPU了吗

这个时代发生在2001-2005年,此时GPU用可编程的顶点渲染器替换了变换与光照相关的固定单元,用可编程的像素渲染器替换了纹理采样与混合相关的固定单元。这两部分是实现图形特效最密集的部分,
2019年2月26日

【AI初识境】深度学习模型中的Normalization,你懂了多少?

最后进行尺度缩放和偏移操作,这样可以变换回原始的分布,实现恒等变换,这样的目的是为了补偿网络的非线性表达能力,因为经过标准化之后,偏移量丢失。具体的表达如下,yi就是网络的最终输出。
2019年2月25日

【学员分享】程序员效率神器,最常用VIM插件安装大全

后插件的名称如'VundleVim/Vundle.vim'(作者+插件名),可从https://github.com/VundleVim/Vundle.vim查看说明,以下插件可以同样方法查看。
2019年2月24日

【AI初识境】什么是深度学习成功的开始?参数初始化

上面是一个四层的神经网络在sigmoid函数激活下的训练过程,可以看到最深的layer4层刚开始的时候很快就进入了饱和区域(激活值很低),其他几层则比较平稳,在训练的后期才能进行正常的更新。
2019年2月23日

【AI初识境】激活函数:从人工设计到自动搜索

回转正题,之所以需要激活函数,从生物学上来说,是因为人脑的细胞接受刺激从而产生活动,首先需要一定的阈值,没有达到阈值,几乎没用。而不同的刺激产生的输出也是不同的,达到一定值后就饱和了,再加大也没用。
2019年2月21日

【AI初识境】近20年深度学习在图像领域的重要进展节点

2011比赛并超过了人眼,这是一场交通标志的识别比赛,研究者开始对深度学习在自动驾驶中的应用前景展现出浓厚的兴趣,毕竟在上个世纪90年代无人车的研究就已经开始了。现在无人车是非常大的一个应用前景。
2019年2月20日

【AI初识境】从头理解神经网络-内行与外行的分水岭

image到conv1,再到conv2,图像越来越小。每过一级就相当于一次降采样,这就是池化。池化可以通过步长不为1的卷积实现,也可以通过pool直接插值采样实现,本质上没有区别,只是权重不同。
2019年2月18日

【杂谈】白身,初识,不惑,有识,不可知,你处于深度学习工程师哪一重境界了

进入到不惑境界,就是向高手迈进的开始了,在这个境界的重点就是进一步巩固知识,并且开始独立思考。如果说学习是一个从模仿,到追随,到创造的过程,那么到这个阶段,应该跳过了追随,进入了创造的阶段。
2019年2月15日

【AI初识境】从3次人工智能潮起潮落说起

在1943年的时候麦卡洛克-皮茨(MuCulloch和Pitts)就提出了MP模型,即最早的基于阈值逻辑的神经网络模型,用于模拟人脑神经元,它已经是感知器的原型了,开创了人工神经网络研究的时代。
2019年2月14日

【完结】总结12大CNN主流模型架构设计思想

说起来,DenseNet只不过是残差网络的升级版,将网络中的每一层都直接与其前面层相连,把残差做到了极致,提高了特征的利用率;因为可以把网络的每一层设计得很窄,提高计算性能。
2019年2月1日

【模型解读】历数GAN的5大基本结构

X和Y分别表示两个域的图像,可知这里存在两个生成器G和F,分别用于从X到Y的生成和Y到X到生成,包含两个判别器,分别是Dx和Dy。而损失本身也增加了一个循环损失,感兴趣读者可以去细读文章。
2019年1月31日

【完结】中国12大AI研究院,高调的低调的你pick谁

尽管滴滴今年在安全上出现了不少负面新闻,但我相信随着技术不断成熟,滴滴能不断推动中国AI的发展,相信她能把其拥有的交通大数据更好的应用在自动驾驶上!另外如果你想对滴滴研究院有更好的了解,请看原文:
2019年1月31日

【完结】听完这12次分享,你应该完成了AI小白的蜕变

咱们暂时还是一个计算机视觉号,所以数字图像基础是必备的。从数字图像的表示,包括位数,彩色空间,分辨率,数字图像的基本属性,包括直方图,对比度清晰度等,都是未来进军深度学习计算机视觉处理的基石。
2019年1月30日

【模型解读】浅析RNN到LSTM

state承载着之前所有状态的信息,每到新的时刻,就有相应的操作来决定舍弃什么旧的信息以及添加什么新的信息。这个状态与隐藏层状态h不同,在更新过程中,它的更新是缓慢的,而隐藏层状态h的更新是迅速的。
2019年1月29日

【AI白身境】究竟谁是paper之王,全球前10的计算机科学家

Hinton,加拿大认知心理学家和计算机科学家,深度学习三巨头之一,反向传播算法提出者之一,2006年在science期刊发表深层网络逐层初始化训练方法,揭开深度学习世纪新序幕,其弟子Alex
2019年1月29日

【研究院】低调务实的网易人工智能,你熟悉吗?

网易人工智能的产品服务主要集中在六个方面,分别是:AI平台、网易洞见、网易影见,网易见外、LOFTCAM、深度学习平台。看到这六个方面是不是很晕,下面请让我来一一介绍它们。
2019年1月28日

【AI白身境】AI+,都加在哪些应用领域了

在体育领域,人们开始对AI格外关注应该是在2016年李世石和谷歌围棋AI“AlphaGo”的比赛,根据媒体报道,比赛的第一天吸引了全球共计1亿人次观看,这应该是AI在体育领域第一次大规模的爆发。
2019年1月28日

【研究院】一年了,再看看江湖中的达摩院

同时,马云对“达摩院”的未来提出三个希望:“必须活得比阿里巴巴长”,“要服务全世界至少20亿人口“,”必须面向未来用科技解决未来的问题”,马云坦言不讳,要让达摩院超越英特尔、微软和IBM的研究院。
2019年1月27日

【AI白身境】一文览尽计算机视觉研究方向

3.57%的错误率表现超过了人类的识别水平,并以152层的网络架构创造了新的模型记录。由于resnet采用了跨层连接的方式,它成功的缓解了深层神经网络中的梯度消散问题,为上千层的网络训练提供了可能。
2019年1月25日

【研究院】人民日报点赞2次的京东AI研究院,以后还低调不

他在加入京东之前,担任微软亚洲研究院资深研究员,他领导的研究团队多次在国际图像和视频描述、识别和搜索比赛中排名第一,其研究成果先后20余次被成功转化到微软的关键产品和服务中。
2019年1月24日

2019年有三AI“春季”划,给我一个荣耀,还你一生荣耀

大家都知道去年有三AI开了“济”划,今年没有了,不过我们为大家准备了另外一套方案,名为“季”划,顾名思义,每个季节开一个,2019年除夕正好就是立春,就取名为“春季”划。
2019年1月24日

【模型解读】从2D卷积到3D卷积,都有什么不一样

这里有两个3D卷积层,卷积核大小分别是7x7x3,7x6x3,前两维是空间的卷积,后一维是时间的卷积,看得出来,不需要保持一致,而且通常空间的卷积核大小和时间就不会一致,毕竟处理的“分辨率”不同。
2019年1月23日

【研究院】滴滴研究院,都在做什么

滴滴的运行调度基于供需预测结果,大规模有序调动全城所有可用运力,实现资源最优化分配,力求解决正在发生的以及潜在供需失衡的状况,提升平台效率的同时最大化利用交通运力,缓解城市拥堵。
2019年1月23日

【AI白身境】入行AI需要什么数学基础:左手矩阵论,右手微积分

这一套对所有的函数f(x)都通用,所以以导数的反方向进行搜索,就能够减小f(x),而且这个方向还是减小f(x)的最快的方向,这就是所谓的梯度下降法,也被称为“最速下降法”,参数更新方法如下。
2019年1月23日

【AI白身境】深度学习中的数据可视化

analysis,这是一种分析、简化数据集的技术。PCA常用于减少数据集的维数,同时保持数据集中对方差贡献最大的特征,原理是保留低阶主成分,忽略高阶主成分,因为低阶成分保留了数据最多的信息。
2019年1月22日

【研究院】中国最强的AI Lab,是腾讯AI Lab吗?

策略协作型AI“绝悟”的首次露面是在2018KPL秋季赛的总决赛上(12月22日),当时“绝悟”与前KPL职业选手和职业解说组成的人类战队(平均水平超过99%玩家)进行5V5的水平测试,并取得胜利。
2019年1月20日

【模型解读】深度学习网络只能有一个输入吗

早在上个世纪90年代的时候,LeCun等研究人员就开始利用神经网络陆续进行一些研究,比如我们熟知的大名鼎鼎的LeNet5,但这绝不是唯一,今天我们来说他们的另一种网络结构,Siamese
2019年1月19日

【AI白身境】学深度学习你不得不知的爬虫基础

urllib是python自带的一个主要用来爬虫的标准库,无需安装可以直接用,它能完成如下任务:网页请求、响应获取、代理和cookie设置、异常处理和URL解析,可以说要想学会爬虫,必须要学会它。
2019年1月18日

【AI白身境】只会用Python?g++,CMake和Makefile了解一下

解释下这个build文件夹,由于cmake后会生成很多编译的中间文件以及makefile文件,所以一般建议新建一个新的目录,专门用来编译,这就是这里的build,打开build后,里面的文件如下:
2019年1月16日

【cntk速成】cntk图像分类从模型自定义到测试

欢迎来到专栏《2小时玩转开源框架系列》,这是我们第七篇,前面已经说过了caffe,tensorflow,pytorch,mxnet,keras,paddlepaddle。
2019年1月15日

【AI白身境】搞计算机视觉必备的OpenCV入门基础

calib3d模块即Calibration(校准)3D,这个模块主要是相机校准和三维重建相关的内容。包含了基本的多视角几何算法,单个立体摄像头标定,物体姿态估计,立体相似性算法,3D信息的重建等等。
2019年1月14日

【通知】集齐“有三AI扑克牌”,你就可以正式以AI工程师身份出道了

包括“AI研究院”,“深度学习模型发展”,“开源框架使用”,“深度学习理论”,“深度学习调参实践”共5大方向,其中有一些系列我们已经更新了近10篇文章,有一些系列即将更新。
2019年1月13日

【AI白身境】深度学习必备图像基础

边缘检测在计算机视觉与图像处理中基础且应用广泛。通过提取目标的轮廓,用于识别不同的物体,或作为图像的特征表示。边缘检测的基本方法有很多,它们的绝大部分可以划分为两类:基于一阶导数和二阶导数的方法。
2019年1月11日

【AI白身境】学AI必备的python基础

上面实例中,get_image是这个函数的函数名,这个函数的参数是picture_path,就是图片的路径,这个参数会传到函数体中。如果你的图片路径是d://01.jpg,这时候函数体就会变成img
2019年1月9日

【AI杂谈】从一篇参考文献比正文还长的文章,杂谈深度学习综述

前段时间公众号也做了调研,大家对这一块内容的投票最高,之所以前段时间没写,是因为我想把这一块写的尽可能完美而浅显易懂,有理论又包含实践,这一块是我们2019年的重中之重,尽情期待吧!
2019年1月8日

【AI白身境】Linux干活三板斧,shell、vim和git

Github后,进入下方这个界面,在Step1中填写好个人信息,Step2-3全部采用默认设置,即可完成github注册,记得要去自己的邮箱verify,不然后面没办法创建仓库。是不是很简单。
2019年1月5日

【AI白身境】深度学习从弃用windows开始

这一点非常重要,而一些小团队仍然不重视这个问题。还可以通过配置不同的权限,让小白们权限低一点,老司机们权限高一点,避免出现小白手贱滥用apt-get之类的命令随意更改系统软件库,造成系统崩溃的情况。
2019年1月3日

【模型训练】SGD的那些变种,真的比SGD强吗

前面说了梯度下降算法是按照梯度的反方向进行参数更新,但是刚开始的时候梯度不稳定呀,方向改变是很正常的,梯度就是抽疯了似的一下正一下反,导致做了很多无用的迭代。
2018年12月23日

【杂谈】为什么你学了AI,企业却不要你

前几个月花了一些时间招实习生,面试了近10个,最后只发了一个offer,因为实在是不满意。近半年也跟一些负责招聘的同行们聊过天,再加上18年秋招形势的印证,我们自己内部的需求,现在就是这样的状态。
2018年12月19日

【模型训练】如何选择最适合你的学习率变更策略

(gamma^iter),可知这是连续变化,学习率的衰减非常的快,gamma越大则衰减越慢,但是因为caffe中的实现使用了iter作为指数,而iter通常都是非常大的值,所以学习率衰减仍然非常快。
2018年12月17日

【资源总结】“十大深度学习方向” 专栏上线

关于深度学习中的数据集,目前缺乏系统性的介绍资料,因此我在这里给大家系统性地介绍深度学习中的数据集,从数据与深度学习的关系,重要方向的数据集,数据的增强方法以及数据标注和整理等方面进行讲述。
2018年12月14日

【AI基础】OpenCV,PIL,Skimage你pick谁

十月开始,我们有三AI学院开启了“稷”划和“济”划,帮助想入行以及想取得更多实战经验的同学。内容覆盖从自动驾驶到美颜直播等领域的实战项目,从图像基础到深度学习理论的系统知识,欢迎关注。
2018年12月13日

【技术综述】图像与CNN发家简史,集齐深度学习三巨头

第一个S层,大小为19*19*12,通道数为12,卷积的大小为5*5。第一个C层,大小为21*21*8,可知道进行了一个像素的边界补齐,从S层到C层,进行了通道的融合,输入通道为12,输出为8。
2018年12月10日

入群邀请 & 今年最后一次“稷划”

一直没有正式发过消息邀请大家入群,今天来分享一下有三的几个微信群,有需要的朋友可以来加我微信入群,Longlongtogo,不过需要简单认证防止不良人士进入噢
2018年12月8日

【技术综述】一文道尽传统图像降噪方法

那么什么是随机噪声呢?相比于图像的真实信号来说随机噪声就是一种或高或低呈现出不确定变化的一种信号,如下图所示虚线代表真实信号,红蓝线表示的就是随机噪声信号,所有的随机噪声信号求和后结果为0。
2018年12月2日

【AI研究院】360无死角认识一下女神的线上美容院-“美图秀秀”

美图公司现有1500+员工,65%以上都是技术和研发工程师,研发有关CV的所有技术,MTLAB将AI技术渗透在生活的诸多方面,带领我们在图片、小视频的海洋中遇见美的变化,感受AI的力量。
2018年11月29日

有三AI学院2018年“最后一班车”,三个月入行AI根本不存在

言有三做了这个平台,输出了很多的内容,有不短的时间了,陆续也开了一些课。但是我始终没有下定决心要做AI方向的培训,一是内心觉得有点low,二是那样会破坏我现在的学习生态。
2018年11月28日

【技术综述】万字长文详解Faster RCNN源代码

R-CNN源代码的熟悉几乎是所有从事目标检测的人员必须迈过的坎,由于目录结构比较复杂而且广泛为人所用,涉及的东西非常多,所以我们使用的时候维持该目录结构不变,下面首先对它的目录结构进行完整的分析。
2018年11月27日

【技术综述】一文道尽R-CNN系列目标检测

search方法,这种方法其实是利用了经典的图像分割方法Graphcut,首先对图像做初始分割,然后通过分层分组方法对分割的结果做筛选和归并,最终输出所有可能位置,将候选区域缩小到2000个左右。
2018年11月27日

【研究院】奇虎360AI研究院,都在干什么?

十月开始,我们有三AI学院开启了“稷”划和“济”划,帮助想入行以及想取得更多实战经验的同学。内容覆盖从自动驾驶到美颜直播等领域的实战项目,从图像基础到深度学习理论的系统知识,欢迎关注。
2018年11月26日

【数据集】自动驾驶都有什么测试基准?

发布于2016年,这是一段高速公路的视频数据集,包括10个可变大小的视频片段,以20Hz的频率记录。数据除了图像之外,还记录了一些测量值,如汽车速度,加速度,转向角,GPS坐标,陀螺仪角度。
2018年11月25日

【研究院】浅析小米与它的AI生态

崔宝秋是美国纽约州立大学石溪分校计算机科学系博士,2012加入小米科技有限责任公司,现任小米首席架构师、小米云负责人。值得一提的是,崔宝秋于1987年考取武汉大学计算机软件专业,是雷军的校友。
2018年11月23日

【数据集】一文道尽医学图像数据集与竞赛

本着合作科学进步的精神,我们可以自由共享SCR数据库,并致力于在这些分割任务上维护各种算法结果的公共存储库。在这些页面上,可以在下载数据库和上载结果时找到说明,并且可以检查各种方法的基准结果。
2018年11月22日

【资源放送】机器学习/深度学习最全公开视频大放送!

很多的大学在互联网上提供了很多关于机器学习,深度学习以及相关分支领域的很多宝藏。上面这份清单试图总结了那些很棒的CS课程,这些课程免费在线提供了高质量的学习材料,有作业,讲座,笔记,阅读和考试等。
2018年11月19日

【数据】短视频识别,都有那些行业标准?

http://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#Downloads,发布于2011年
2018年11月18日

【AI研究院】头条与抖音背后的AILab怎么样

十月开始,我们有三AI学院开启了“稷”划和“济”划,帮助想入行以及想取得更多实战经验的同学。内容覆盖从自动驾驶到美颜直播等领域的实战项目,从图像基础到深度学习理论的系统知识,欢迎关注。
2018年11月17日

【github干货】主流深度学习开源框架从入门到熟练

正所谓google有tensorflow,facebook有pytorch,amazon有mxnet,作为国内机器学习的先驱,百度也有PaddlePaddle,其中Paddle即Parallel
2018年11月15日

【学习求职必备】认真认识一下世界末日那年成立的“华为诺亚方舟实验室”

十月开始,我们有三AI学院开启了“稷”划和“济”划,帮助想入行以及想取得更多实战经验的同学。内容覆盖从自动驾驶到美颜直播等领域的实战项目,从图像基础到深度学习理论的系统知识,欢迎关注。
2018年11月13日

【学习求职必备】百度AI和它的7大AI黑科技

百度之星开发者大赛(基于PaddlePaddle的中国高校计算机大赛人工智能创意赛、KG-知识抽取赛、交通预测赛、无人车系列大赛,以及商家招牌的分类与检测、人工智能加速器应用与设计等大数据比赛)
2018年11月3日

【技术综述】一文道尽“人脸数据集”

数据集则包含了20,000张脸,5个关键点标注与40个面部属性,实际上后面被包含在了Celeba数据集中,该数据集我们后面会进行介绍。这两个数据集都使用TCDCN方法将其拓展到了68个关键点的标注。
2018年11月2日

有三AI“十一月【稷】划”,从调参大法到3D重建

同样的任务,应该选择什么样的输入,怎么使用已经训练好的模型,怎么选择参数,能不能让机器自动完成调参,为什么别人的模型工作的好好的,我就不是过拟合就是欠拟合?(关键词:cnn,3个任务,价值588)。
2018年11月1日

【学习求职必备】微软亚洲研究院和它的10大AI黑科技

十月开始,我们有三AI学院开启了“稷”划和“济”划,帮助想入行以及想取得更多实战经验的同学。内容覆盖从自动驾驶到美颜直播等领域的实战项目,从图像基础到深度学习理论的系统知识,欢迎关注。
2018年10月30日

【学习·求职必备】入行深度学习之前,应该做好哪些准备

全机重量大概18斤,再配上一些其他东西,我每天差不多背20斤上班,背了3年多了,很锻炼身体,推荐入手!当然这款机器是买不到来,我给大家推荐几个差不多的笔记本,只考虑价格和显存哈,其他的自己去揣摩。
2018年10月29日

【行业趋势】国内这10个AI研究院,你想好去哪个了吗?

http://ai.360.cn/,成立于2015年,为360搜索、360儿童手表、360智能摄像头、360机器人、360行车记录仪、360直播平台等提供技术支持。
2018年10月28日

【技术综述】你真的了解图像分类吗?

Module,它采用并行的方式。一个经典的inception结构,包括有四个成分。1×1卷积,3×3卷积,5×5卷积,3×3最大池化,最后对四个成分运算结果进行通道上组合。这就是Inception
2018年10月21日

【有三说图像】图像简史与基础

十月开始,我们有三AI学院开启了“稷”划和“济”划,帮助想入行以及想取得更多实战经验的同学。内容覆盖从自动驾驶到美颜直播等领域的实战项目,从图像基础到深度学习理论的系统知识,欢迎关注。
2018年10月14日

【技术综述】“看透”神经网络

十月开始,我们有三AI学院开启了“稷”划和“济”划,帮助想入行以及想取得更多实战经验的同学。内容覆盖从自动驾驶到美颜直播等领域的实战项目,从图像基础到深度学习理论的系统知识,欢迎关注。
2018年10月12日

【方法杂谈】你真的了解CVPR吗?

十月开始,我们有三AI学院开启了“稷”划和“济”划,帮助想入行以及想取得更多实战经验的同学。内容覆盖从自动驾驶到美颜直播等领域的实战项目,从图像基础到深度学习理论的系统知识,欢迎关注。
2018年10月10日

【数据】深度学习从“数据集”开始

十月开始,我们有三AI学院开启了“稷”划和“济”划,帮助想入行以及想取得更多实战经验的同学。内容覆盖从自动驾驶到美颜直播等领域的实战项目,从图像基础到深度学习理论的系统知识,欢迎关注。
2018年10月8日

【模型解读】从“局部连接”回到“全连接”的神经网络

与全连接神经网络相比,卷积神经网络在每一层是局部的,采用了较小的卷积核,感受实际对应到原始图像空间较大的区域,而且随着网络的加深,感受野增加。但是感受野毕竟不是全图,在降采样的过程中也会丢失信息。
2018年10月6日

有三AI“【济】划”,从图像基础到深度学习

读大学的时候,我特别讨厌和瞧不起那些来学校搞“学习习惯培养”和“人生职业规划”的人,听了之后觉得都是废话没有任何实质性内容,但是后来自己在不断调整学习习惯的过程中才发现,这一点是最重要的。
2018年10月3日

有三AI“十月【稷】划”,从自动驾驶到模型优化

虽然科学研究讲究的是定量客观评价,但很多的时候,人们的需求是找到主观感觉中更加舒服的图,可能是分辨率更高,可能是美学质量更高,可能是噪声更低,什么样的指标是我们需要的呢?
2018年10月2日

【总结】这半年,有三AI都做了什么

其实早在三年前,我就注册了这个公众号,当时粉丝几十的时候还创造过600多的阅读量,但是后面就搁置了。正式开始认真维护这个号,是今年年后,到现在已经半年多一点,是时候来做一个总结了。
2018年9月29日

【mxnet速成】mxnet图像分类从模型自定义到测试

的特点是语义上容易理解,灵活,可以精确控制行为。通常可以无缝地和主语言交互,方便地利用主语言的各类算法,工具包,debug和性能调试器,但是实现统一的辅助函数和提供整体优化都很困难。
2018年9月28日

【运营&编辑招聘】边学习边赚钱的工作,你要吗?

凡符合以上条件者,即可以联系有三微信Longlongtogo,进行相关审核。可准备相关的论文,博客等能够证明水平的一切资料。
2018年9月26日

【Keras速成】Keras图像分类从模型自定义到测试

此处还需要注意的一点是,我们现在进行的是简单的图像分类任务训练,假如要完成语义分割,目标检测等任务,则需要自定义一个类(继承ImageDataGenerator),具体实现可以查询相关代码进行参考。
2018年9月26日

【paddlepaddle速成】paddlepaddle图像分类从模型自定义到测试

正所谓google有tensorflow,facebook有pytorch,amazon有mxnet,作为国内机器学习的先驱,百度也有PaddlePaddle,其中Paddle即Parallel
2018年9月25日

【pytorch速成】Pytorch图像分类从模型自定义到测试

前面已经介绍了Caffe和TensorFlow的数据读取,两者的输入都是图片list,但是读取操作过程差异非常大,Pytorch与这两个又有很大的差异。这一次,直接利用文件夹作为输入,这是
2018年9月24日

【行业趋势】人工智能凭什么“教育”人

事实上,教育作为人类传承历史文化、探索未知的一种重要途径,一直遵循着开放、创新的思维模式,在新技术的使用上几乎一直走在其他行业前列。那么,借助人工智能技术,人类教育行业将会发展到一个什么样的地步呢?
2018年9月22日

【tensorflow速成】Tensorflow图像分类从模型自定义到测试

_,cross_entropy_,accuracy_,batch_images_,batch_labels_,loss_summary_,acc_summary_,image_summary_
2018年9月20日

【caffe速成】caffe图像分类从模型自定义到测试

太小,那么对于分类任务来说统计出来的指标也不可信,所以最好一次测试,用到所有测试数据。因为,常令test_iter*test_batchsize=测试集合的大小。
2018年9月20日

【技术招聘】你,想不想发光发热?

写文章可以验证自己很多的知识是否只是半知半解,所以首先要通过写文章来证明能力。其次,自己会并不一定意味着就能够写好文章,达到教会他人的水平,所以要通过写文章来锻炼各种表达能力。
2018年9月17日

【模型解读】“全连接”的卷积网络,有什么好?

既然丢掉某些层间连接或者整个层不影响性能,就说明这一层学习到的非线性转变很小,既然转变很小,那么每一层学习几百个通道,还有必要吗?这几百个通道,正是万恶的计算量所在。
2018年9月16日

【模型解读】“不正经”的卷积神经网络

但是同样的目标,在不同的图片中,会存在位置的偏移,角度的旋转,尺度的大小。卷积神经网络要能够应对这些情况,比如分类任务,对于同样的目标在不同图像中的偏移,旋转,尺度,要输出同样的结果。
2018年9月12日

【学习 · 求职必备】学CV必须关注的会议与期刊

Press。涵盖内容为机器学习理论及应用,神经网络、深度学习等方面的最新研究。NIPS是机器学习领域的顶级会议,在各种学术会议统计中,NIPS被认为有着很强的影响力和很高的排名,录用率30%左右。
2018年9月7日

一课道尽人脸图像算法,你值得拥有

当前人脸算法在扫脸支付与日常考勤,人机交互等安全控制,视频直播,个性化的社交,3D表情驱动等领域都广泛落地,发展迅速,作为这个方向的计算机视觉从业者,应该对其中的核心算法有所了解。
2018年9月3日

【技术综述】闲聊图像分割这件事儿

分水岭算法是一种基于拓扑理论的数学形态学的分割方法,将图像中每一点像素的灰度值表示该点的海拔高度,每一个局部极小值称为集水盆,而集水盆的边界则是分水岭。分水岭算法有很多种实现算法,常用浸水模拟法。
2018年8月31日

【学习・求职必备】可谓是相当Awesomes了,这些综述类的github项目你不可错过!

https://github.com/terryum/awesome-deep-learning-papers,这个相必大家不陌生了,整理深度学习有关的优秀papers,从出来那一天就让人兴奋。
2018年8月29日

【求职必备】学深度学习,这些公众号你有关注吗?

该公众号聚焦人工智能与深度学习的最新技术、产品和活动信息。这是一个由国内的老师学生维护的公众号,主要注重学术,特色是技术综述以及报告等,不定期推送。
2018年8月28日

【模型解读】resnet中的残差连接,你确定真的看懂了?

在该文章中,研究者没有使用特殊的初始化方法等,也能够训练上千层的网络。但为什么这篇文章没有resnet火呢?原因自然有很多了,何的文章做了更多的实验论证,简化了上面的式子,得了cvpr
2018年8月24日

【模型解读】pooling去哪儿了?

那pooling是必要的吗?答案已经很明了了,不需要。文【2】做了详细的实验,在cifar,imagenet等多个数据集上实验结果表明,完全没有必要。因为我们可以用步长大于1的卷积来替代。
2018年8月21日

【行业进展】谷歌4大AI黑科技部门,你可知

在商业化实践上,Waymo计划于2018年底推出首个商业化打车服务,目前已在美国凤凰城启动了无人驾驶服务,大约有400名当地居民获得了测试的资格,通过手机端应用来获得Waymo无人驾驶服务。
2018年8月18日

【模型解读】说说移动端基准模型MobileNets

从图中可以看出,经过3*3深度卷积,每个通道的输出信息只和之前的对应通道信息相关,而普通3*3卷积每个通道输出信息和之前所有通道信息相关,这是它们的本质区别。
2018年8月16日

如何降低遮挡对人脸识别的影响

框架。尽管并没有对光照变化和遮挡做任何先验性假设和显式处理,甚至没有用到大规模的训练数据,PCANet的神经元响应却对光照变化和遮挡等表现出了很强的鲁棒性,关于更具体的细节请参考文献【2】。
2018年8月11日

【模型解读】GoogLeNet中的inception结构,你看懂了吗

图b是对图a的改进,即在3*3卷积,5*5卷积前加1*1卷积,目的是为了先进行降维,相比较于原来结构减少了较多参数。而把1*1卷积放在3*3最大池化之后,相比较放在前面,也是为了参数量的减少。
2018年8月9日

【模型解读】network in network中的1*1卷积,你懂了吗

network"基本组成单元是1*1卷积网路,说到这,就要解释一下1*1卷积了,该篇论文是首次提出1*1卷积,具有划时代的意义,之后的Googlenet借鉴了1*1卷积,还专门致谢过这篇论文。
2018年8月6日

【行业进展】国内自动驾驶发展的怎么样了?

不过“阿波龙”距离真正L4级别的自动驾驶量产还存在一定距离,因为以目前所公开的信息来看,百度量产的“阿波龙”只是在封闭道路上做低速行驶,并不是传统意义上在公开道路上做高速行驶的自动驾驶汽车。
2018年7月30日

【模型解读】从LeNet到VGG,看卷积+池化串联的网络结构

5.使用裁剪翻转等操作做数据增强,增强了模型的泛化能力。预测时使用提取图片四个角加中间五个位置并进行左右翻转一共十幅图片的方法求取平均值,这也是后面刷比赛的基本使用技巧。
2018年7月28日

【技术综述】人脸表情识别研究

与传统方法特征提取不同,之所以采用深度学习的方法,是因为深度学习中的网络(尤其是CNN)对图像具有较好的提取特征的能力,从而避免了人工提取特征的繁琐,人脸的人工特征包括常用的68个Facial
2018年7月24日

【技术综述】人脸脸型分类研究现状

研究人员使用的是CAS-PEAL数据集,使用了其中1200张温和光照、中性表情的正面人脸,由20人投票将人脸库分为了三角脸、椭圆脸、圆脸、方脸、尖下巴长脸和方圆下巴长脸6类,分类精确率统计如下表:
2018年7月23日

【行业进展】AI:新药研发的新纪元

AI技术可应用于药物研发的各个层面(这里特指靶点筛选,小分子筛选、设计、合成,成药性评估等实验验证前阶段。大分子药物设计较为复杂,不在此次讨论范畴),各个大型制药公司也是积极使用AI应用于新药研发。
2018年7月21日

【技术综述】有三说GANs(上)

在这样的基础上,有一些很有意义的应用。比如苹果simGAN【12】用于优化仿真数据的方案,此时生成器G的输入是合成图像,而不是随机向量,它完美学习到了人工合成图片(synthetic
2018年7月19日

【开源框架】从Google百度到微博,优酷腾讯到抖音,这些爬虫你用过了吗?

(1)将项目下载到本地,目录如下图所示,修改其中的amemv-video-ripper.py,找到第131行的内置函数generateSignature,将所有调用该函数的语句注释后就可以使用。
2018年7月13日

【行业进展】哪些公司在搞“新零售”了

未来的改进方向为1)补足设计缺陷,改进算法,增强准确性与稳定性,保障食品安全。2)尊重消费习惯,在为用户提供便利的同时培育消费群体,纳入社会信用体系,保障无人超市长远运营。
2018年7月12日

【技术综述】人脸颜值研究综述

数据集共5500个正面人脸,年龄分布为15-60,全部都是自然表情。包含不同的性别分布和种族分布(2000亚洲女性,2000亚洲男性,750高加索男性,750高加索女性),数据分别来自于数据堂,US
2018年7月7日

【技术综述】人脸年龄估计研究现状

市场主流年龄估计软件包括商汤科技,face++,百度云AI体验中心,腾讯云AI体验中心,年龄检测仪。我们随机拿了一些名人照片做测试,总体说来face++在测试集上表现最好。
2018年7月4日

【开源框架】一文道尽主流开源框架中的数据增强

Mxnet小巧且功能强大。与Caffe相比,Caffe训练过程中会保存每一层的参数,而Mxnet只保留当前正在前向或者反向传播的参数。Mxnet更适合分布式训练,一般比赛刷榜用的多。
2018年7月1日

【技术综述】深度学习自动构图研究报告

这类方法的目标就是研究如何用最小的剪裁窗口使得注意力(图像显著特性)总和最大化,它缺少对图像构图准则以及美学质量的考量,可能会导致剪裁出来的图像不美观。因为已经不是主流研究方法,就不细细说明了。
2018年6月28日

【技术综述】深度学习中的数据增强(下)

depth等方法,是专门设计来限制模型的有效容量的,用于减少过拟合,它们是显式的规整化方法。研究表明这一类方法可以提高泛化能力,但并非必要,且能力有限,而且参数高度依赖于网络结构等因素。
2018年6月24日

[综述类] 一文道尽深度学习中的数据增强方法(上)

SamplePairing方法的处理流程如下图所示,从训练集中随机抽取两张图片分别经过基础数据增强操作(如随机翻转等)处理后经像素取平均值的形式叠加合成一个新的样本,标签为原样本标签中的一种。
2018年6月18日

【干货·课程】言有三的深度学习从入门到上线课程

http://gitbook.cn/gitchat/column/5b1f709a472e0a7085638f9b
2018年6月16日

【技术综述】计算机审美,学的怎么样了?

CNN用作第三个输入列,形成具有style/semantic信息(SDCNN)的三路CNN。其双路CNN如下图所示,全局视图包括:中心裁剪,变形和填充。局部视图通过随机裁剪原始高分辨率图像得到。
2018年6月9日

【学员分享】深度学习计算机视觉,两个星期从入门到上线

好了,进入正题。本人所解决的是人脸识别登录的业务,最后抽象为一个深度学习的三分类问题。接下来会以解决问题的顺序进行展开描述。用的深度学习框架是caffe,网络结构是mobilenet。
2018年5月25日

【深度学习图像项目实战-从入门到上线1】怎样学会科学的调研并启动一个项目

总结:针对大公司技术实力强但是不敢轻易尝试非成熟技术,而小公司技术实力弱但是产品可以快速迭代的特点,我们可以以短小精美的前端界面+最新技术探索的方式,甚至尝试非主流擦边球的形态来突然推出爆款。
2018年5月21日

【技术综述】如何Finetune一个小网络到移动端(时空性能分析篇)

接下来我们再返回第1部分,conv5_1到conv5_5的计算量和时间代价都是不小的,且这一部分featuremap大小不再发生变化。这意味着什么?这意味着这一部分,纯粹是为了增加网络的非线性性。
2018年3月13日

【技术综述】一文道尽softmax loss及其变种

当类别数n=10,p=0.45;n=1000,p=0.007。当类别数增加到1000类时,正样本最大的概率还不足0.01,而反向求导的时候,梯度=1-p,会导致一直传回去很大的loss。
2018年2月27日

【从caffe到Tensorflow 1】io 操作

TextLineDataset:这个函数的输入是一个文件的列表,输出是一个dataset。dataset中的每一个元素就对应了文件中的一行。可以使用这个函数来读入CSV文件,跟上面例子类似。
2018年2月7日

[caffe解读] caffe从数学公式到代码实现5-caffe中的卷积

它在setup函数里面要做一些事情,其中最重要的就是设定weights的尺寸,下面就是关键代码。num_output是一个输出标量数,比如imagenet1000类,最终输出一个1000维的向量。
2018年2月6日

[caffe解读] caffe从数学公式到代码实现4-认识caffe自带的7大loss

当y=1,loss就是欧氏距离,说明匹配的样本距离越大,loss越大。当y=0,就是与阈值margin的欧式距离,说明不匹配的样本,欧氏距离应该越大越好,超过阈值最好,loss就等于0.
2018年2月4日

[caffe解读] caffe从数学公式到代码实现3-shape相关类

(c*h*w)的向量输出,虽然在我们看来不一样,但是在blob看来,输入和输出的数据存储是没有差异的,只是记录的shape信息不同。所以forward和backward只是数据拷贝
2018年2月3日

[caffe解读] caffe从数学公式到代码实现2-基础函数类

先定义了个tanh_naïve函数,然后利用GaussianFille初始化一个bottom,将其通过forward函数,把出来的结果和tanh_naïve的结果进行比对,完整代码如下,感受一下:
2018年2月2日

[caffe解读] caffe从数学公式到代码实现1-导论

这是很重要的一个文件,当我们自定义数据层的时候会用到,它的作用就是从磁盘中读取数据塞进caffe定义的变量内存中。从它的头文件就可以看出,它依赖于blob,common,以及caffe.pb.h
2018年2月1日

如何步入深度学习刷榜第一重境界

而到了第二三境界,至少得有个集群,得有一群人来尝试各种方案,而顶尖的团队对网络结构肯定是需要调优设计的,历年夺冠的那些网络alexnet,googlenet,resnet,senet无一例外。
2018年1月18日

【GAN的应用】基于对抗学习的图像美学增强方法

enhancement)模型。而作者提出的EnhanceGAN只需要弱监督(一个表示美学质量的二进制标签即可),并且可以对尺寸修改与色彩增强的模型参数实现自适应调整。
2017年12月22日

一文说说这十多年来计算机玩摄影的历史

那么,直接对所有的图片,采用同样的方法学习,是不通,所以就有方法,或利用图像style,semantic信息进行弱监督,或直接将style和score,semantic一起学习【10】。
2017年12月4日

为了压榨CNN模型,这几年大家都干了什么

笔者没有能力去完整回答这个问题,但是我们可以从很多embedding技术,比如PCA等中得到思考,降低一定的维度可以去除冗余数据,损失的精度其实很多情况下都不会对我们解决问题有很大影响。
2017年3月12日

2016自动驾驶外行装逼攻略(超长文推荐)

车行驶过程中要通过这个信息,来判断前面能否直行拐弯,是否限速,那一定需要高精度的定位,每到一个位置,能够查询周围地图。而这个地图的精度,绝对不能是米级!差一米,可能开到其他车道,可能拐弯拐不过。
2016年12月3日

VR来了,3D人脸重建跟上->《三维人脸重建-3DMM》

初始化一个3维的模型(需要初始化内部参数α,β),初始化外部参数,包括相机的位置,图像平面的旋转角度,直射光和环境光的各个分量,图像对比度等等,共20多个位置参数,当然初始化需要有一定的技巧。
2016年1月16日

三维人脸重建入门

手工建模作为最早的三维建模手段,现在仍然是最广泛地应用中。顶顶大名的3DMax就是典型代表,当然了,它需要专业人士来完成。(此刻由于上不了Google很是郁闷,上不了无水印的美图)。
2015年12月11日