CVer

其他

NeurIPS 2023 | Backbone之战:计算机视觉任务模型大比较

在BoB的一系列全面评估中,涵盖了任务、数据集和设置(包括ID和OOD),在监督学习下,ConvNeXt-Base、SwinV2-Base(使用ImageNet-21k进行训练)和CLIP
2023年11月13日
其他

75岁Hinton中国大会最新演讲「通往智能的两种道路」,最后感慨:我已经老了,未来交给年轻人

便宣称,超级智能(superintelligence)诞生的时间可能会比他曾经想象的早得多。这一观察引出了两大问题:(1)人工神经网络的智能水平将会很快超越真实神经网络吗?(2)人类是否能保证对超级
2023年6月13日
其他

Stable Diffusion公司重磅开源大语言模型StableLM,又爆火了!

AI,正式推出类ChatGPT产品——StableLM。https://github.com/Stability-AI/StableLM△由Stable
2023年4月22日
其他

Stable Diffusion公司新作Gen-1:基于扩散模型的视频合成新模型,加特效杠杠的!

就能生成详细的图像。潜在扩散模型提供了有效的方法,通过在感知压缩的空间中进行合成来生成图像。在本论文中,研究者提出了一个可控的结构和内容感知的视频扩散模型,该模型是在未加字幕的视频和配对的文本
2023年3月18日
其他

CVPR 2023 | 大脑视觉信号被Stable Diffusion复现成图像!"AI读脑术"来了!

Takagi,他主要从事计算神经科学和人工智能的交叉研究。最近,他同时在牛津大学人脑活动中心和东京大学心理学系利用机器学习技术,来研究复杂决策任务中的动态计算。另一位是大阪大学教授Shinji
2023年3月4日
其他

CVer微信技术交流群和求职群—入群方式

鲁迅先生曾曰:做一个有思想、有干货的公众号,必须要有高质量的社群CVer-微信技术交流群截止2023-03-01日,已有超过50000多人加入CVer
2023年2月28日
其他

备战2024秋招和暑期实习!

点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达距离2023年暑期实习不到2个月!距离2024届校招提前批不到4个月!距离2024届秋招正式批不到6个月!这里分享最新的求职公式3.0:刷题(LeetCode/剑指Offer)
2023年2月23日
其他

深圳,再添985!

点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达点击进入—>【计算机视觉】微信技术交流群本文转载自:募格学术
2023年2月21日
其他

NeurIPS 2022 | 重振PointNet++雄风!PointNeXt:改进模型训练和缩放策略审视PointNet++

schedulers),和超参数(hyperparmeters)。随着机器学习理论的发展,现代化的神经网络可以被理论上更好的优化器(如AdamW)和更好的损失函数(CrossEntropy
2022年12月28日
其他

港大&腾讯提出DiffusionDet:第一个用于目标检测的扩散模型

DiffusionDet,将扩散模型应用于目标检测。据了解,还没有研究可以成功地将扩散模型应用于目标检测,可以说这是第一个采用扩散模型进行目标检测的工作。DiffusionDet
2022年11月21日
其他

NeurIPS 2022 | 香港理工提出OGC:首个无监督3D点云物体实例分割算法

Flow(KITTI-SF)数据集上进行评估。KITTI-SF包含200对点云用于训练,200单帧点云用于测试。实验结果如下表所示:我们的方法达到了与全监督方法接近的优异性能。Figure
2022年11月8日
其他

顶刊TIP 2022!阿里提出:从分布视角出发理解和提升对抗样本的迁移性

不同模型结构比如有跳连的模型ResNet,DenseNet;没有跳连的模型VGG;基于Transformer的模型ViT等等产生的对抗样本在迁移性上存在差异。模型的准确性影响迁移性:
2022年10月28日
其他

谷歌新作Imagic:扩散模型只用文字就能PS照片了!网友:效果太震撼...

一个点赞手势。」扩散模型:没问题,包在我身上。从论文中的图像可以看出,修改后的图像依然非常自然,对需要修改的内容之外的信息也没有明显的破坏。类似的研究还有谷歌研究院和以色列特拉维夫大学之前合作完成的
2022年10月20日
自由知乎 自由微博
其他

CVer微信学术群和求职群—入群方式

鲁迅先生曾曰:做一个有思想、有干货的公众号,必须要有社群微信群CVer-学术交流微信群截止2022-08-31日,已有超过40000多人加入CVer
2022年9月23日
其他

美国CS PhD Research Scientist找工作经验总结

(1-2场):Leetcode类型的coding题,其实没有我想的考的那么多,平均每个公司不到一题。我没有被考超过Leetcode中等难度的题;就算是中等,也是其中比较简单的。所谓的AI
2022年8月25日
其他

抄袭!这篇CVPR Oral论文被指大量抄袭!一篇抄十篇!合著者忙甩锅...

可以在任意时间步长上快速重建图像,并对看不见的数据做出实际预测。此外,该研究声称成功地采用了多种图像合成技术来提高图像清晰度和时间一致性。通过对模拟和真实场景数据集进行广泛的实验,研究者验证了
2022年6月25日
其他

ICML 2022 | 即插即用!英伟达开源FAN:提升ViT和CNN的鲁棒性和准确性

Transformers论文:https://arxiv.org/abs/2204.12451代码(刚刚开源):https://github.com/NVlabs/FAN最近的研究表明,Vision
2022年5月16日
其他

CVPR 2022 | SwinTextSpotter:基于文本检测与识别更好协同的场景文本识别

Swin-Transformer由两个空洞卷积、一个普通卷积组成,它把卷积和Transofmer结合起来,将卷积的特性引入到Swin-Transformer中。
2022年5月13日
其他

2022年计算机领域EI检索国际学术会议参考列表(AI/CV/机器人等领域)

鉴于一些小伙伴正在为找不到投稿渠道而苦恼本期小编为大家推荐三则国际会议信息了解领域前沿,分享研究成果启发科研思路,尽在学术会议近期EI收录的国际会议汇总,相信总有一个适合你!01第二届图像、视觉与智能系统国际学术会议The
2022年5月13日
其他

线下面基 AI 顶会,“中招”新冠阳性!CHI 2022主席:继续测试,检查症状...

Wang的博士生说:在两天的阴性结果后,今天检测呈阳性,如果您参加了CHI,请继续检测和隔离您自己。即使有些没有患新冠的参会者,也每天心心念念的生活在担心中。例如Amy
2022年5月12日
其他

中国人民大学退出国际大学排名?校方:从未参加过!

点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达来源:央广网、双一流高校此前消息、人民网领导留言板、教育部评估中心
2022年5月12日
其他

CVPR 2022 | 网易&华科提出特征采样与分组:基于Transformer的场景文字检测方法

在不同情况下的定性结果,包括多面向文本、长文本、多语言文本、低分辨率文本、弯曲文本、密集文本。对于曲线文本检测,贝塞尔曲线的控制点用红色表示。表1
2022年5月12日
其他

500道AI算法高频面试题(附答案详解)

职友集统计,算法工程师每月平均薪资可达28K,其中拿30k-50k工资的占比最多,达44.7%。但高薪可不是这么好拿的,特别是在面试临门一脚的时候,很容易碰到一系列的问题。比如:①学校一般怎么办?②项目经历单薄怎么办?③没有科研成果怎么办?④技能掌握不熟练怎么办?⑤一想到面试就紧张怎么办?⑥不知道如何回答面试官问题怎么办?5月12日(周四)20:00SunnyJ老师在直播间教你如何快速攻克
2022年5月12日
其他

CVPR 2022 | 微软提出MiniViT:极致压缩视觉Transformer

Transformer受到大量参数的影响,限制了它们在内存有限的设备上的适用性。为了缓解这一问题,本文提出了一种新的压缩框架MiniViT,MiniViT能够在保持相同性能的同时实现了Vision
2022年5月11日
其他

一键瘦脸!浙大提出:人脸视频编辑新技术

与基线方法比较。给定一帧人像视频的框架(a),人像重塑方法会在鼻尖附近产生伪影(b),因为鼻子遮挡了侧面,而作者的方法(c)可以使用相同的整形参数产生令人满意的结果。
2022年5月11日
其他

一个迅速崛起的国产开源OCR项目

CPU,预测时开启MKLDNN加速。01SVTR_LCNet:轻量级文本识别网络SVTR_LCNet是针对文本识别任务,将Transformer网络和轻量级CNN网络PP-LCNet
2022年5月11日
其他

我在MIT人工智能研究实验室工作一年学到的 5 件事!

10-20%,在接下来的几周内他都在怀疑人生:难道智商太低不配进入麻省理工学院吗?为什么看起来只有自己不懂的样子?Mike注意到,实验室最聪明的人总是不断地提出问题,仅在第一周,他遇到了
2022年5月10日
其他

323篇论文被ACM全部撤稿!放眼望去都是中国作者,原因令人无语...

Xplore上也出版了相同的会议纪录?这是被冒充了吗?“你们知不知道这事儿?”ACM被告知这一消息后,很迷茫,立刻和ICIMTech
2022年5月10日
其他

火爆的NeRF!旷视大咖导师带你搞定基于神经网络的 3D 重建!

点击下方卡片,关注“旷视研究院”公众号▲点击上方卡片,关注旷视研究院公众号整理不易,请点赞和在看
2022年5月10日
其他

GAN之父Ian Goodfellow离职苹果:不想重返办公室工作

在图像生成领域取得了重大突破,现在可以生成动物、风景以及人脸等高度逼真的合成图像。例如可以合成人脸的网站:thispersondoesnotexist.com
2022年5月9日
其他

厦大通报4篇学位论文“存在问题”,2篇硕士论文来自电子通信专业,院长导师已被约谈

2021论文和代码开源的论文合集后台回复:ICCV2021,即可下载ICCV
2022年5月9日
其他

CVPR 2022 | 涨点显著!AMD提出:动态Sparse R-CNN

features)在训练过程中是可学习的,但在推理过程中对不同的图像保持固定。在动态卷积的驱动下提出了动态proposal生成(DPG),以在第一个迭代阶段提供更好的初始proposal
2022年5月9日
其他

目标检测与分割领域的经典算法解读

计算机视觉是人工智能的关键领域之一,是一门研究如何使机器“看”的科学。图像目标检测又是计算机视觉的关键任务,主要对图像或视频中的物体进行识别和定位,是AI后续应用的基础。因此,检测性能的好坏直接影响到后续目标
2022年5月9日
其他

2023 校招提前批倒计时!

AI算法岗的校招/社招准备攻略、面试题库、面试经验、Offer选择、内推机会、学习路线、求职答疑和海量学习资料等内容。CVer
2022年5月8日
其他

郑州大学5名学生确诊阳性!其中一人因违规出校导致感染

点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达本文转载自:募格学术
2022年5月8日
其他

三星电子中国研究院招聘CV、NLP、语音/音频工程师和实习生

点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达三星电子中国研究院招聘信息公司介绍:三星电子中国研究院是三星电子在华投资设立的具有独立法人资格的研发机构,具备博士后工作站运营资质,专注于人工智能、5G/6G通信技术研究和标准化等前沿技术,也积极进行商用化的开发、推动先进技术在三星产品中的商用化落地,提升三星电子产品的竞争力。真诚欢迎您的加入!※
2022年5月8日
其他

英伟达的这款GPU太强了!

在针对一些大型计算工作负载任务,比如需要在多个GPU加速节点上进行模型并行化时,能够通过互联调整负载,可以再次提高性能。图18
2022年5月6日
其他

该市官宣:高校有序解除封闭管理!

点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达本文转载自:募格学术
2022年5月6日
其他

MICCAI 2022 多模态腹部分割国际挑战赛来了(AMOS22)

点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达国际顶级医学图像和计算机辅助介入大会MICCAI2022将于9月在新加坡召开。深圳市大数据研究院、香港中文大学(深圳)、香港大学、中山大学等多家研究机构将联合深圳市龙岗区人民医院、深圳市龙岗中心医院共同举办MICCAI2022多模态腹部分割国际挑战赛(AMOS22),旨在通过开放数据集和挑战赛促进相应医疗分割算法的发展。挑战赛背景腹部多器官分割一直是医学图像分析领域最活跃的研究领域之一,其作为一项基础技术,在支持疾病诊断,治疗规划等计算机辅助技术发挥着重要作用。近年来,基于深度学习的方法在该领域中获得了巨大成功,却也暴露出了一个迫切问题:
2022年5月6日
其他

视觉Transformer的复仇!Meta AI提出DeiT III:ViT训练的全新baseline

这样的自监督方法的性能是否该归因于网络的训练过程,例如数据增强、正则化、优化,或能够学习更一般的隐式表示的底层机制。在本文中,研究者们没有强行回答这个难题,而是通过更新常规
2022年5月6日
其他

CV全新范式!LSTM在CV领域杀出一条血路!Sequencer:超越Swin、ConvNeXt等网络

LSTM有一个输入门,它控制存储输入,一个控制前单元状态的遗忘的遗忘门,以及一个输出门,它控制当前单元状态的单元输出。普通LSTM的公式如下:其中σ是logistic
2022年5月5日
其他

2022,博士们,又开始晒工资了!

点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达来源:青塔人才2022年了,已经工作的博士们,在知乎和小红书开始了新一轮的工资接龙。我们将部分有价值的信息摘选给各位,希望对您有所帮助。@雷荷波计算机专业教师鄙人2015年博士毕业,2017年入职普通985高校,现在为正高职称、有编制。主要科研为主,项目也跟科研相关,项目在学院里面算是比较少的吧。2017年年薪(税前20万),2021年查了一下税前收入,刚好到100万。在大厂的几个同学工作五年,年薪过300万的已经有好几个了。从事金融行业的,年终奖加起来基本在1000万上不封顶。美国在startup的两个博士同学公司都已经上市了,身价过亿。一方面这几年大放水货币贬值很厉害,另一方面博士毕业五年纷纷开始发力了,收入开始稳定了,并且仍有较大上行空间。我几个认识的刚毕业的计算机博士同学,起薪年薪相差至少10倍以上。计算机相关博士找工业界或者金融业工资碾压学术界。A:坐标香港。对冲基,高频交易,年薪100万。两年后涨至400万。早上7点上班晚上7点下班。B:坐标美国。独角兽startup。原始股200万刀。package一年15万。早上9点上班晚上6点下班。一年后公司上市。C:坐标美国。FLAG之一。起薪package25万刀。D:坐标大陆。某985。博后一年后国内入职直接正高,有编制。月工资到手2万以下。安家费20多万。F:坐标大陆。深圳某高校。Tenure
2022年5月4日
其他

CVPR 2022 Oral|OGM-GE:基于动态梯度调节的平衡化多模态学习

和VGGSound上进行了分类和识别任务的验证,OGM-GE应用于几种常用融合方法:Concatenation和Summation,以及专门设计的融合方法:Gated
2022年5月3日
其他

即插即用!英伟达提出FAN:提升视觉Transformer和CNN的鲁棒性和准确性

Transformer。这也引出了一个关于Self-Attention在鲁棒泛化中的实际作用问题。在本文中,作者旨在找到上述问题的答案。本文的研究始于一个有趣的观察,即在图像分类过程中,Vision
2022年5月2日
其他

好家伙!MIT博士生凭借「扭动奥利奥饼干」发了篇论文!

Fluids“扭一扭”和科学机制有什么联系呢?原来,当我们扭转饼干时,这背后的原理与流变学的标准测试类似。也就是说,当非牛顿流体在压力的作用下产生扭曲、挤压时以怎样的方式流动。MIT
2022年5月2日
其他

CVPR 2022 Oral | 即插即用!语义感知的域泛化语义分割模型:SAN-SAW

Whitening,IW)对不同样本的特征分布进行标准化。IN分别对单个图像的每个通道的特征进行标准化归一化,以减轻由于样式变化引起的特征不匹配。IN的具体过程可以由以下公式来表示:
2022年5月1日
其他

CVer微信学术群和求职群—入群方式

鲁迅先生曾曰:做一个有思想、有干货的公众号,必须要有社群微信群CVer-学术交流微信群截止2022-03-01日,已有超过40000多人加入CVer
2022年3月21日
其他

与吴恩达一起参会!赢取RTX 3090黄仁勋签名版!英伟达GTC 2022 AI大会来了!

↑我已经在畅享元宇宙的生活了!数字孪生原来是这样的,记笔记!AI真的改变了我的生活虚拟制造感觉好有趣AI真的能让3D以假乱真吗!元宇宙快来吧!我想住进虚拟世界!
2022年3月14日
其他

谨以此文悼念毛星云(浅墨)老师

我(Amusi)是12月13日在知乎上得知"毛星云于12月11日上午身故"的消息,听闻震惊,不敢相信,直至数小时进行搜索、查阅,才相信他走了,心里倍感惋惜。
2021年12月14日