深度学习这件小事

其他

阿里达摩院开源DAMO-YOLO:兼顾速度与精度的新目标检测框架

Flops,作为目标预算。搜索后,我们将空间金字塔池化和焦点模块应用到最后的骨干。下表1中列出了不同的主干的性能对比结果。可以看到MAE-NAS骨干网络的效果要明显优于DarkNet网络结构。表1
2022年11月28日
其他

人脑给AI打工?给保安带上脑机接口,眼睛识别违禁品,0.3秒自动标记结果

来自|大数据文摘假如你是一名地铁安检,你的眼前以每秒三次的频率闪现这样的图像,你能发现其中一个行李里面携带了枪支吗?不是很难,对吧?不过,现实中的工作不是这么简单,一眼看到还不够,后续还要进行一些操作,比如按下暂停按钮或者人工上报,这些往往更耽误时间。这时候你可能会想,能不能用AI呢?的确,AI识别危险物品现在也能做到又快又准,不过,哪怕是最先进的AI,准确率也不能达到100%,对于一些不是很重要的任务,AI或许可以独立完成,但是对于安检这样的重要任务,往往只能依靠人工检测。人脑本身处理图像的速度就非常快,稍加培训的安检员,0.3秒内就能做出判断,真正耽误时间的反而是判断之后的操作。既然这样,那么把这部分工作交给AI怎么样?比如,把安检员的大脑作为一台机器,用脑机设备识别大脑信号,当安检员看到危险物品时,脑机设备识别到信号,迅速将图像自动标记出来。这种非典型的AI,似乎是更实用的AI。利用大脑信号提升工作效率,走神也没关系在
2022年11月23日
其他

全网最详细!油管1小时视频详解AlphaTensor矩阵乘法算法

Strassen「用加法换乘法」思路和算法的基础上,构建了一个基于AlphaZero的强化学习模型,更高效地探索进一步提高矩阵乘法速度的通用方法。最近,Youtube播主Yannic
2022年10月14日
其他

特斯拉又「翻车」了?全自动驾驶3次撞上儿童假人,撞后没停重新加速

Project」的活动,旨在禁止安全系统中使用不安全软件,其中就包括对特斯拉自动驾驶软件的测试。为了模拟自动驾驶汽车在现实中遇到小朋友过马路时的反应,The
2022年8月12日
其他

我在MIT人工智能研究实验室工作一年学到的 5 件事

10-20%,在接下来的几周内他都在怀疑人生:难道智商太低不配进入麻省理工学院吗?为什么看起来只有自己不懂的样子?Mike注意到,实验室最聪明的人总是不断地提出问题,仅在第一周,他遇到了
2022年5月16日
其他

ViT的复仇:Meta AI提出ViT训练的全新baseline

这样的自监督方法的性能是否该归因于网络的训练过程,例如数据增强、正则化、优化,或能够学习更一般的隐式表示的底层机制。在本文中,研究者们没有强行回答这个难题,而是通过更新常规
2022年5月10日
其他

把大核卷积拆成三步,清华胡事民团队新视觉Backbone刷榜了,集CNN与ViT优点于一身

新Backbone刷榜三大任务根据LKA方法设计的新Backbone网络VAN,延续了经典的四阶段设计,具体配置如下。每个阶段的结构如图所示,其中下采样率由步长控制,CFF代表卷积前馈网络(
其他

Github大盘点!2021年最惊艳的38篇AI论文

https://arxiv.org/pdf/2012.09855.pdf视图合成的下一步,就是永久视图生成,目标是创造出一张能够飞入其中的图片,还能在图像内的美景进行探索!13、Portable,
2022年1月28日
其他

人工智能领域有哪些曾被拒稿的优秀工作?

最惊艳的论文是哪篇?思考丨到底什么叫算法工程师的落地能力?Transformer模型有多少种变体?看看这篇全面综述从SGD到NadaMax,十种优化算法原理及实现各种注意力机制的PyTorch实现
2022年1月21日
其他

深度学习领域,你心目中 idea 最惊艳的论文是哪篇?

map作者:Ferenas那就从我的研究领域中挑一个出来吧,我的研究方向是基于image-level的弱监督语义分割,(貌似这个点近两年趋势渐淡),而其中令我最惊艳的就是CAM,class
2021年10月12日
其他

37岁前女雇员揭露Facebook滔天罪行:用放大仇恨言论算法赚钱

Minutes采访上揭露Facebook用放大仇恨言论的算法谋利。为了提高用户参与度,Facebook发现最好的方式便是向用户灌输恐惧和憎恨。Facebook
2021年10月7日
其他

你写的ML代码占多少内存?这件事很重要,但很多人还不懂

Keras、PyTorch、Scikitlearn)。如果内存优化是主要目标,那么即使在功能或性能上不是最佳,也必须寻找一种占用最小内存且可以满意完成工作的实现方式;如果数据
2021年6月18日
其他

Transformer模型有多少种变体?复旦邱锡鹏教授团队做了全面综述

是一种灵活的架构,并且对输入数据的结构偏差几乎没有假设,因此很难在小规模数据上进行训练。改进方法包括引入结构偏差或正则化,对大规模未标记数据进行预训练等;模型适配。这一系列工作旨在使
2021年6月14日
自由知乎 自由微博
其他

各种注意力机制,MLP,Re-Parameter系列的PyTorch实现

CBAMBlock(channel=512,reduction=16,kernel_size=kernel_size)output=cbam(input)print(output.shape)7.
其他

那些年,我们一起追过的Backbone

通过这种方式可以缓解梯度消失,同时作者也表示有正则化的作用。其实这个思想有点类似于传统机器学习中的投票机制,最终的结果由多个决策器共同投票决定,这个在传统机器学习中往往能提升大概2%的精度。3.4
2021年3月27日
其他

思考丨到底什么叫算法工程师的落地能力?

作者丨桔了个仔报道丨极市平台https://www.zhihu.com/question/304695682/answer/1720475610前言
2021年2月20日
其他

我在哥大读博的五年,万字总结

baseline的时候也容易被人认可能不能有大的impact?这里我指的是博士期间的大方向,由一系列单项的工作或者paper构成。单篇paper通常有三种类型:(1)First
其他

知乎 | 一个算法工程师的日常是怎样的?

Tricks吴恩达上新:生成对抗网络(GAN)专项课程从SGD到NadaMax,十种优化算法原理及实现
2020年12月31日
其他

彻底搞懂机器学习中的正则化

目录LP范数L1范数L2范数L1范数和L2范数的区别DropoutBatch
2020年12月28日
其他

深度学习框架简史:TF和PyTorch双头垄断,未来十年迎来黄金时期

OneFlow,从设计的第一天起就将这一观点纳入设计考虑,并将数据通信视为模型训练的整体计算图的一部分。这为性能优化打开了更多的机会,而且由于它不需要像以前的深度学习框架那样维护多种训练策略(单设备
2020年12月17日
其他

吃透空洞卷积(Dilated Convolutions)

Convolution)(https://zhuanlan.zhihu.com/p/50369448)—完—为您推荐一文了解深度推荐算法的演进13个算法工程师必须掌握的PyTorch
2020年12月14日
其他

图像算法可以稳定处理视频了!港科大开源通用算法,解决视频处理时域不稳定问题|NeurIPS 2020

arxiv链接:https://arxiv.org/abs/2010.11838project主页:https://chenyanglei.github.io/DVP/index.htmlvideo:许多图像处理算法已在单个图像处理任务中表现了出色的性能,但是将它们直接应用于视频上通常会有时域不一致问题(例如闪烁问题),如图1所示。为了提高时域一致性,大多数研究人员针对不同的视频处理任务设计了专用算法,例如视频上色,视频去噪和视频超分辨率。尽管特定任务的视频处理算法可以改善时域一致性,但是能否将类似的策略应用于其他任务尚不清楚或具有挑战性。不同于前者,作者提出了一种新颖且通用的框架,该框架可以将图像处理算法转换为对应的具有高度时域一致性的视频处理算法。输入视频帧应用图像上色算法的预处理视频图1.
2020年11月30日
其他

从SGD到NadaMax,十种优化算法原理及实现

Momentum更多关于AdaDelta的信息,可以参考这篇文章:自适应学习率调整:AdaDelta(https://www.cnblogs.com/neopenx/p/4768388.html)
2020年11月28日
其他

一文了解深度推荐算法的演进

的网络,发展到特征组合的网络,再到基于用户行为序列的网络,到当前的推荐+知识图谱,算法的信息处理能力不断的变强,能够处理的数据也越来越丰富,未来也将持续沿着这个趋势发展。参考文献[1]《Wide
2020年10月23日
其他

13个算法工程师必须掌握的PyTorch Tricks

对于一些更加灵活的初始化方法,可以借助numpy。对于自定义的初始化方法,有时tensor的功能不如numpy强大灵活,故可以借助numpy实现初始化方法,再转换到tensor上使用。for
2020年10月17日
其他

拿到2021年灰飞烟灭的算法岗offer的大佬们,都是啥样的?

高质量回答SleepyBag小明小明快快显灵https://www.zhihu.com/question/420313215/answer/1476054156著作权归作者所有。末流
2020年10月8日
其他

Github上10个超好看 可视化面板,后台管理页面有着落了

深度学习这件小事公众号项目开发中几乎所有平台都需要一个后台管理,但是从零开发一套后台控制面板并不容易,幸运的是有很多开源免费的后台控制面板可以给开发者使用,那么有哪些优秀的开源免费的控制面板呢?我在
2020年10月7日
其他

吴恩达Deeplearning.ai国庆节上新:生成对抗网络(GAN)专项课程

的应用十分广泛,比如防御对抗攻击和数据匿名化来保护隐私,以提升网络安全性,再比如生成新图像,为黑白图像着色、提高图像分辨率、2D
2020年10月1日
其他

思考 | 一滴水从高处落下来,会不会砸死人?

张图总结深度学习全部知识周博磊自述:一个神经元的价值和一个神经病的坚持你一定从未看过如此通俗易懂的YOLO系列解读
2020年9月29日
其他

干货 | 算法工程师超实用技术路线图

作为主要工作语言的话,其中很大部分的设计模式可能并不需要。入门可以浏览一下这个网站掌握一些基本概念:https://refactoringguru.cn/design-patterns/python
2020年9月20日
其他

周博磊自述5年研究经历:一个神经元的价值和一个神经病的坚持

的损害。另一方面,如右下角所示,去掉这个神经元对整体的分类准确度影响却很微弱,原因是有些类别(最右边)会受益于去掉这个神经元,这也是比较有意思的一个现象,难道是
2020年9月19日
其他

导师神总结:读博失败的10个作死大法

Dissertator)。当然,三篇发表论文远不足以获得教职——哪怕是在一个烂学校。不过,对拿到博士学位来说,够了!Most
2020年9月13日
其他

那些轻轻拍了拍Attention的后浪们

attention滑动窗口attention就是围绕每一个token采用固定大小的窗口计算局部注意力。假设窗口大小是w,序列长度是n,那么计算复杂度就是O(n*w),其中w远小于n。Dilated
其他

吴恩达推荐笔记:22 张图总结深度学习全部知识

循环神经网络基础如上所示,命名实体识别等序列问题在现实生活中占了很大的比例,而隐马尔可夫链等传统机器学习算法只能作出很强的假设而处理部分序列问题。但近来循环神经网络在这些问题上有非常大的突破,RNN
2020年8月29日
其他

一张公示刷爆朋友圈:街道办招8人,全是清华北大博士硕士!

聘期满因表现一般未能续聘或提拔的,一般参照所在单位同等事业编制工作人员办理聘用手续,并根据个人实际任职职务,执行国家统一的事业单位工资福利制度。(二)政府部门高级雇员、国企高级职员4.
2020年8月28日
其他

深度学习准「研究僧」预习资料:图灵奖得主Yann LeCun《深度学习(Pytorch)》春季课程

春季课程。课程网站:https://atcold.github.io/pytorch-Deep-Learning/这门课程由图灵奖得主、纽约大学
2020年8月18日
其他

你一定从未看过如此通俗易懂的YOLO系列(从v1到v5)模型解读 (下)

map的分辨率画出来。分辨率A变化到分辨率B的所有卷积画在了一起。因为写代码时经常会这么做,所以问这个问题的意图是看看你是否经常写代码。然后我们看下检测类网络的结构,如下图3所示,这个图是YOLO
2020年8月18日
其他

你一定从未看过如此通俗易懂的YOLO系列(从v1到v5)模型解读 (中)

的计算公式改为:这里的1.1就是一个示例,你也可以是1.05,1.2等等,反正要乘上一个略大于1的数,作者发现经过这样的改动以后效果会再次提升。3.CIoU-loss之前的YOLO
2020年8月16日
其他

你一定从未看过如此通俗易懂的YOLO系列(从v1到v5)模型解读 (上)

不得不谈的分类模型在进入目标检测任务之前首先得学会图像分类任务,这个任务的特点是输入一张图片,输出是它的类别。对于输入图片,我们一般用一个矩阵表示。对于输出结果,我们一般用一个one-hot
2020年8月15日
其他

22课时、19大主题,CS 231n进阶版课程视频上线

Vision」课程中,学生可以学习到实现、训练和调试自己的神经网络,并能够详细了解计算机视觉前沿研究的知识。课程中介绍了学习算法、神经网络架构以及用于训练和微调视觉识别任务网络的实用工程技巧。22
2020年8月11日
其他

又搞事情,美国宣布“清洁网络”五大行动,点名限制百度、阿里巴巴在内的7家中国科技公司

Network)的五大措施,并点名包括华为、中国移动、百度、阿里巴巴在内的7家中国科技公司,以禁止更多来自中国的应用程序,进一步限制中国公司进入美国的云端系统。“清洁网络”(Clean
其他

这21张深度学习速查表让你代码能力突飞猛进(内附下载链接)

2021神经网络先驱奖!特朗普拿H1B签证开刀,LeCun吴恩达等实名谴责!数据分析入门常用的23个牛逼Pandas代码如何在科研论文中画出漂亮的插图?
其他

LSTM终获「正名」,IEEE 2021神经网络先驱奖授予LSTM提出者Sepp Hochreiter

共同获得了当年的神经网络先驱奖,以表彰其在神经动力优化方面做出的突出成就。图源:https://www.erg.cuhk.edu.hk/erg/node/81接下来,我们具体来看本年度
2020年7月29日
其他

长尾(不均衡)分布下图像分类问题最新研究综述(2019-2020)

一个全连接分类器)。第二步,将第一步学习的模型中的特征提取backbone的参数固定(不再学习),然后单独接上一个分类器(可以是不同于第一步的分类器),对分类器进行class-balanced
2020年7月17日
其他

如何在科研论文中画出漂亮的插图?

Colormaps.—完—为您推荐MIT校长评中美科技竞赛:胜利不是期盼对手的失利GitHub重大更新:在线开发上线,是时候卸载IDE了美国官宣117000名
2020年7月16日
其他

特朗普拿H1B签证开刀,皮猜LeCun吴恩达等移民实名谴责!库克:苹果因移民而生

皮猜哥表示:移民为美国的经济做出了巨大的贡献,使其成为全球科技领域的领导者,也成就了今天的谷歌。(我)对今天的宣言表示失望,我们将继续与移民站在一起,努力扩大所有人的机会。苹果公司
2020年6月25日
其他

MIT校长评中美科技竞赛:胜利源于自身的成长,而不是期盼对手的失利

的主要使命,但我相信这将有机地融合。美国有着世界一流的大学,因为我们曾在应对挑战时,将先前的最佳策略和新型挑战的灵活性相结合,这项法案旨在保护科学领域中好奇心驱动的基础研究,这是
2020年6月10日
其他

直观理解!你一定要读一下的“矩阵和线性代数入门”

是一个上三角矩阵那么,线性方程组就可以变成:这样,就可以拆解为:好吧,一个方程变成了两个。正像你看到的,矩阵分解就是这么无聊,似乎没啥用处。可是,事实并非如此——我们来看看矩阵
其他

IoU、GIoU、DIoU、CIoU损失函数的那点事儿

dious四、CIoU(Complete-IoU)论文考虑到bbox回归三要素中的长宽比还没被考虑到计算中,因此,进一步在DIoU的基础上提出了CIoU。其惩罚项如下面公式:其中