赵薇被控七宗罪 主因疑是……

扑朔迷离!赵薇发帖“没跑”,随后又删帖…

鄂州幸福的一家三口疑似乱L事件

成都MC浴室最新照片和截图流出,最全事件梳理来了!

和田地区万名教师集体发声亮剑宣讲宣誓大会在于田举行

Facebook Twitter RSS

分享到微信朋友圈

点击图标下载本文截图到手机
即可分享到朋友圈。如何使用?

我爱计算机视觉

百万奖金!天池发起广东工业制造创新大赛

专业计算机视觉技术分享平台,“有价值有深度”,分享开源技术与最新论文解读,传播视觉技术的业内最佳实践。知乎/微博:我爱计算机视觉,官网
2019年8月13日

登顶Github趋势榜,非监督GAN算法U-GAT-IT大幅改进图像转换效果

为了让系统在生成和判别时更具针对性对特定区域进行转换和鉴别,作者加入CAM(意即类激活图模块)。它能找出对于判断一张图的真假最重要的区域,这样生成器和判别器就可对此区域更具针对性生成和判别。
2019年8月5日

数据不够,用GAN来凑!

说到标注这件事,打个标签其实还好,如果是针对图像分割任务,要对图像进行像素级标注,那标注的成本就太高了。跟专业的标注公司打过交道的朋友都知道,打标签、标关键点和标像素区域,所要付出的成本可大不同。
2019年7月10日

视频编辑利器,不喜欢就框除!开源视频物体移除软件video object removal

Inpainting[1]介绍了一种视频的处理方法,生成效果时序上更加一致,但此方法同样需要视频中每帧的物体的mask,如果想使用此方法那我们就需要想办法获取物体的mask。
2019年7月4日

CVPR 2019 论文大盘点-目标跟踪篇

为了实现多目标跟踪的无标签和端到端学习,提出了一种用动画来跟踪的框架,其中可微分神经模型首先跟踪输入帧中的对象,然后将这些对象动画化为重建帧。然后通过反向传播通过重建误差来驱动学习。
2019年7月3日

CVPR 2019 论文大盘点—目标检测篇

https://github.com/CaitinZhao/cvpr2019_Pyramid-Feature-Attention-Network-for-Saliency-detection
2019年6月30日

Cascade R-CNN升级!目标检测制霸COCO,实例分割超越Mask R-CNN

关注最新最前沿的目标检测技术,欢迎加入52CV-目标检测专业交流群,扫码添加CV君拉你入群(如已为CV君好友,请直接私信,不必重复添加),
2019年6月27日

CVPR 2019 论文大盘点—人体姿态篇

https://github.com/yuanyuanli85/Fast_Human_Pose_Estimation_Pytorch(非官方)
2019年6月25日

图鸭科技包揽 CVPR 2019 图像压缩大赛四项指标全部冠军!

“中国智造”,图鸭科技以自身独特的创意以及匠心独运的一流团队切实地做到了这四个字,本次CVPR上夺得四项桂冠足以证明图鸭科技的技术硬实力。5G前夜,图鸭科技将抓住机遇走向更为广阔的天地,未来可期。
2019年6月22日

CVPR 2019 论文大盘点—文本图像相关篇

提出场景文本检测结果度量的新协议,更加以有利于进一步识别为导向,更加注重检测结果的完整性(Completeness)、紧凑性(Compactness)、细腻度(Tightness-aware)
2019年6月20日

CVPR 2019 | 亮风台发布全球最大单目标跟踪数据集LaSOT

虽然上述策略在大多数情况下都很有效,但也存在例外情况。有些物体,例如老鼠,可能有细长和高度变形的部分,例如尾巴,这不仅会在物体的外观和形状上产生严重的噪声,而且对目标物体的定位提供很少的信息。
2019年6月18日

CVPR 2019 论文大盘点-超分辨率篇

所有超分辨率相关论文,总计16篇,其中多篇论文已经吸引了大量关注,比如旷视的Meta-SR、能够应对模糊降质的DPSR、Adobe的纹理迁移SR、国防科大的双目SR。
2019年6月17日

CVPR 2019 论文大盘点-人脸技术篇

关注最新最前沿的人脸识别、检测、对齐、编辑等技术,欢迎加入52CV人脸专业交流群,扫码添加CV君拉你入群(如你已为CV君好友,请直接私信,不必重复添加),
2019年6月14日

PyTorch语义分割开源库semseg

关注最新语义分割、实例分割等技术,欢迎加入52CV-图像分割专业交流群,扫码添加CV君拉你入群(如果你已经加CV君为好友,请直接私信就好了,不必重复添加),
2019年6月2日

CVPR 2019 | 国防科大提出双目超分辨算法,效果优异代码已开源

如图2所示,与自注意力机制在图像全局范围内进行搜索不同,视差注意力机制只沿着极线方向进行搜索。对于左图中任意一点(i,j),视差注意力机制将其与右图极线上任意一点进行相似性计算,得到视差注意力图。
2019年5月28日

快了!CVPR 2019 所有录用论文题目列表刊出,即将开放下载!

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2019年5月27日

CVPR 2019 Oral 亮风台提出端到端投影光学补偿算法,代码已开源

根据我们的数学推导,发现可以用一张相机拍到的屏幕照片来表示投影屏幕本身的光学特性,然后将这张照片作为CompenNet的第二个输入,指导CompenNet学习相机拍摄的失真图和屏幕光学特性的关系,
2019年5月18日

继往开来!目标检测二十年技术综述

可见,深度学习在检测领域的开山之作RCNN取得了大幅度精度提高,开辟了检测的新时代。而今年新出的TridentNet是目前在COCO数据集上取得最高精度的算法。
2019年5月16日

精度高、模型小、速度快!梯形DenseNets结构实现语义分割新高度!

但由于语义分割的计算量和参数量往往都很大,在现有硬件使用这些新出的网络结构进行新算法训练时,显存的大小限制了更好地发挥其潜力,尤其是对那些大图像比如百万像素图像的语义分割。
2019年5月15日

重磅!MobileNetV3 来了!

作者使用上述网络在分类、目标检测、语义分割三个任务中验证了MobileNetV3的优势:在计算量小、参数少的前提下,相比其他轻量级网络,依然在在三个任务重取得了最好的成绩。
2019年5月8日

目标检测:Segmentation is All You Need ?

首先是生成弱监督标注数据,然后使用这些数据训练语义分割(不是实例分割),推断的时候,语义分割的结果转化为二值图像,最后使用轮廓提取算法找到不同的目标个体。
2019年5月6日

CVPR 2019 Oral 目标跟踪最强算法SiamRPN++开源实现

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2019年5月1日

CVPR 2019 Oral | 华科开源效果超群的人体姿态迁移算法

简单点说,就是给定一幅含有人物的图片和一个目标姿态,将图片内人物转换成目标姿态的样子。当然目标姿态可以是从其他图片人物中计算得来的。(所以也可以将一幅图片的人物转成另一图片内人物的姿态)
2019年4月25日

CVPR 2019 | 旷视提出新型目标检测损失函数:定位更精准

大规模目标检测数据集中的不确定性可能有碍当前最佳目标检测器的表现。分类置信度并不总是与定位置信度强烈相关。这篇论文提出了一种全新的带有不确定性的边界框回归损失,可用于学习更准确的目标定位。使用
2019年4月20日

Google CVPR 2019最新成果!用神经架构搜索实现更好的目标检测

在一个覆盖所有交叉尺度连接的可扩展搜索空间中,采用神经网络架构搜索,发现了一种新的特征金字塔架构。这个被发现的架构名为NAS-FPN,由自顶向下和自下而上的连接组合而成,可以跨范围地融合特性。
2019年4月19日

CVPR 2019 神奇的超分辨率算法DPSR:应对图像模糊降质

上两幅图像中上面为低分辨率模糊图像,下面大图来自几天前刚出来的超分辨率算法DPSR的结果。在我们的印象中,往往超分辨率后的图像会看起来轻微模糊,但该算法能够将模糊的低分辨率图像放大,而且更清晰。
2019年4月13日

FoveaBox:目标检测新纪元,无Anchor时代来临!

下面表格展示了,FoveaBox与目前两阶段和一阶段state-of-the-art目标检测算法在COCO数据集上检测结果比较,FoveaBox取得了几乎最好的结果,仅三个指标略低于Cascade
2019年4月10日

CVPR 2019 行人检测新思路:高级语义特征检测取得精度新突破

特征检测是计算机视觉中常用算法,比如我们所熟知的边缘检测、Blob检测,简单点说就是检测图像中的感兴趣部分。在传统的计算机视觉视觉中,这往往被认为是low-level的操作。
2019年4月9日

CVPR 2019 | 旷视提出超分辨率新方法Meta-SR:单一模型实现任意缩放因子

)的研究由来已久,但近两年来随着深度学习在该领域的成功应用,工业界的研究突然火了起来,互联网行业各个大厂和CV创业公司都有团队在做。在移动端图像视频的消费需求不断暴涨的当下,超分辨率显得尤为重要。
2019年3月29日

CVPR 2019 | Adobe提出新型超分辨率方法:用神经网络迁移参照图像纹理

摘要:由于低分辨率(LR)图像存在显著的信息损失,所以进一步推动当前最佳的单图像超分辨率(SISR)技术实现进一步的提升已经变得极其困难。另一方面,基于参照的超分辨率(RefSR)已被证明在给了与
2019年3月16日

CVPR 2019 | 惊艳的SiamMask:开源快速同时进行目标跟踪与分割算法

这种视频里目标的像素级标注,很有用,比如给视频叠加特效可以不覆盖目标人物,或者视频编辑中扣掉特定目标。想想前段时间浙江卫视和北京卫视如果有了这套软件,让某吴姓演员从节目中消失就简单多了,是不是?
2019年3月7日

CVPR2019 | 微软、中科大开源基于深度高分辨表示学习的姿态估计算法

作者在官网指出,深度高分辨率网络不仅对姿态估计有效,也可以应用到计算机视觉的其他任务,诸如语义分割、人脸对齐、目标检测、图像分类中,期待更多具有说服力的结果公布。
2019年2月27日

"我爱计算机视觉"干货集锦分类汇总(2019年1月20日)

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2019年1月20日

是时候学习生成对抗网络了,李宏毅老师GAN视频教程下载

http://v.qq.com/vplus/040a8a6c1f7b048cea1d320834d87bff/foldervideos/zjd00160103dxwr
2019年1月18日

MORAN文本识别算法开源,刷新多个OCR数据集state-of-the-art

该文作者基于分解的思想,提出了一种像素级预测的纠正模型,首先将文本图像分解为多块小图像,然后对每块小图像回归偏移量,并对偏移量进行平滑操作,再在原图像上进行采样,得到新的形状更加规则的水平文本。
2019年1月17日

FaceBoxes—官方开源CPU实时高精度人脸检测器

FaceBoxes是中科院自动化所在IJCB2017上提出的面向CPU实时的高精度人脸检测算法,论文中指出其比大家所熟知的MTCNN在速度和精度上都更优秀。
2019年1月16日

实用教程!使用YOLOv3训练自己数据的目标检测

调用splitTrainAndTest.py脚本会自动把数据集按照训练集比测试集合9:1的比例切分,并生成snowman_train.txt和snowman_test.txt两个文件。
2019年1月15日

Kaggle Human Protein Atlas 比赛总结—如何闯入Top1%拿到金牌

leaderboard,那些不会依据客观事实变通只知道Arm,虽最后一刻被bestfitting反超,但在private榜却shake到第12,这就是overfit的后果。
2019年1月13日

Kaggle新上比赛预测地震-总奖池5万美金

在本次比赛中,参赛选手将参与预测地震发生的时间。具体地说,就是根据实时地震数据预测实验地震发生前的剩余时间。(这里的地震并不是实际发生的地震,而是实验室模拟的地震和相应采集的信号)
2019年1月12日

开源极速的人脸跟踪-基于OpenTLD与RNet

使用RNet对每次跟踪的结果做一个判断,当结果小于阈值的时候重新detection。这么做的意义是为了防止tracking到别的东西(比如gif中的手)。
2019年1月11日

DataFountain新上计算机视觉比赛-20万巨奖数钢筋

上述过程繁琐、消耗人力且速度很慢(一般一车钢筋需要半小时,一次进场盘点需数个小时)。针对上述问题,希望通过手机拍照->目标检测计数->人工修改少量误检的方式(如图1-2)智能、高效的完成此任务:
2019年1月10日

人脸识别损失函数综述(附开源地址)

由于L-softmax有一个更加难的实现目标,所以说它更能避免过拟合。同时L-softmax不仅在分类问题上有优势,同样在识别问题上也有优势,因为它使得类内的距离更加的紧凑。
2019年1月8日

中科院&地平线开源state-of-the-art行人重识别算法EANet:增强跨域行人重识别中的部件对齐

从图5中,我们也可以看出目标域图片部件分割约束的直观效果。PAP-S-PS模型没有见过目标域图片,因此在目标域预测的分割结果有很多噪声、残缺,而PAP-ST-PS见过目标域图片,明显改善了这个问题。
2019年1月7日

树莓派扑克牌检测与识别-基于Python-OpenCV

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2019年1月6日

从光学成像到计算光学成像

所以首先我们把透镜去掉。去掉后,这个无透镜系统里发生就是纯衍射,属于destructiveinterference。就是说我们得到的图像里物体信息被打乱,原有的秩序被破坏殆尽。
2019年1月3日

OpenCV矩形检测

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2019年1月2日

t-SNE:最好的降维方法之一

classification(链接:http://www.visiondummy.com/2014/04/curse-dimensionality-affect-classification/),
2019年1月1日

新年快乐!"我爱计算机视觉"干货集锦与新年展望

2018年即将成为过去,这一年对我来说最大的改变是写了“我爱计算机视觉”公众号,专注于介绍计算机视觉最前沿,我的哲学是:不走捷径,力求深度,关注价值。
2018年12月31日

OpenCV多目标跟踪与视频分析

在视频监控与分析中,视频前后景分析、多目标检测、目标跟踪等算法需要协同工作,今天跟大家分享的开源库,给出了一个基于OpenCV的开源实现。供大家学习参考。
2018年12月30日

[CUDA OpenCV]GPU加速的计算机视觉学习资源下载

https://github.com/PacktPublishing/Hands-On-GPU-Accelerated-Computer-Vision-with-OpenCV-and-CUDA
2018年12月24日

何恺明等最新突破:视频识别快慢结合,取得人体动作AVA数据集最佳水平

网络在视频动作分类及检测任务上展现了强大的性能,同时这种快慢结合思想的提出也为视频目标识别和检测领域做出了重要贡献。实验结果表明,在没有使用任何预训练模型的情况下,SlowFast
2018年12月23日

「实践出真知」如何打造一流的视觉AI技术

·理解粒度更细:从理解图像中包含什么物体的分类任务,到理解物体在图中的具体位置和数目的检测任务,进一步到理解物体的部件以及关键点位置的关键点定位技术,更进一步到理解每个像素所属类别的语义分割任务。
2018年12月21日

Grid R-CNN解读:商汤最新目标检测算法

在目前的R-CNN目标检测算法中,目标的2个点(比如左上和右下)就能表征其位置,将目标的定位看为回归问题,即将ROI特征flatten成向量,后接几个全连接层回归目标的坐标偏移量和宽高。
2018年12月19日

五个很厉害的 CNN 架构

第五层:这次的卷积层使用的是120个5*5的卷积核。由于输入尺寸恰好是5*5*16,所以我们甚至都不用考虑步长就可以得到输出尺寸为1*1*120.本层共有5*5*120=3000个参数
2018年12月15日

惊呆了!速度高达15000fps的人脸检测算法!

作者最后通过设置不同的分类阈值研究了IOU图,发现影响该算法检测精度的主要因素是定位不够精确,亦即很多时候分类器已经分类出人脸了,但定位不准。(这意味着如果能够提高定位精度,这个算法就更逆天了)
2018年12月14日

"我爱计算机视觉"精华文章分类汇总(2018年12月13日)

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2018年12月13日

中国西北大学和北京大学的研究结果是否将终结CAPTCHA验证码时代?

尽管已经提出了几种攻击,基于文本的CAPTCHAs1仍被广泛用作安全机制。其中一个普遍使用文本验证码的原因是很多以前的攻击是针对特定方案的,需要劳动密集型的建设耗时的过程。
2018年12月12日

如何提升深度学习性能?数据、算法、模型一个都不能少

每次训练网络模型时,都以不同的方式初始化,最后的权重也收敛到不同的值。多次重复这个过程生成多个网络模型,然后集成这些模型的预测结果。它们的预测结果会高度相关,但对于比较难预测的样本也许会有一点提升。
2018年12月11日

Kaggle新手银牌:Airbus Ship Detection 卫星图像分割检测

我的方法是这样子的,首先通过置信度降序排列候选目标,然后通过一个先【异或】后【与】的运算来解决重叠冲突,也就是(mask^bg)&mask,具体的原因大家可以自行体会一下,我就不多做解释了。
2018年12月10日

深度重建:基于深度学习的图像重建

在今后的工作中,我们也会致力于推进深度学习和CT图像领域的结合,引入深度学习发展的最新技术,将基于深度学习的方法引入临床应用上,并且尝试解决其他的医学图像问题,加快医学图像领域的发展进程。
2018年12月9日

近期计算机视觉算法竞赛汇总—总奖池超300万人民币

10月底曾经写了一篇博文,近期计算机视觉竞赛汇总—总奖池高达344万人民币,时间很快,其中很多竞赛已经停止报名甚至发完奖金了,但同时又有一些新上的比赛,所以有必要更新下。
2018年12月8日

【大师分享】人工智能始发力,医学影像更清晰

http://everydaymatters.rpi.edu/artificial-intelligence-makes-medical-images-clearer/#.XAFYW-hKhEY
2018年12月7日

疟疾检测-Keras深度学习医学图像分析

https://www.pyimagesearch.com/2018/12/03/deep-learning-and-medical-image-analysis-with-keras/
2018年12月5日

【资源下载】DeepMind&UCL深度学习与强化学习进阶课程

课程由两部分组成,一是包含深度神经网络的机器学习,二是利用强化学习进行预测和控制,两个部分相互穿插。在探讨深度学习的过程中,这两条线交汇在一起,其中的深度神经网络被训练为强化学习背景下的函数逼近器。
2018年12月3日

52CV精华文章分类汇总(2018年12月1日)

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2018年12月1日

Kaggle新上比赛-鲸鱼图像识别-总奖池17.4万人民币

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2018年12月1日

NIHCC发布迄今世界最大的CT医学影像数据集(附下载)

该数据库非常大,总计220G,完全下载需要花费很长时间,“我爱计算视觉”已经把它传到百度云分享给大家,请在“我爱计算机视觉”公众号对话界面回复“deeplesion”,即可获得下载地址。
2018年11月29日

人群计数(Crowd Counting)研究综述

HR)密度图,网络结构比较清晰,这是个可扩展到模型,即根据需要,网络可以随分辨率到提高而扩展。笔者认为,本方法的灵感来自于图像生成领域,这种由低分辨率到高分辨率的逐步生成,在图像生成领域相当常见。
2018年11月29日

复旦提出GaitSet算法,步态识别的重大突破!

步态是指人们行走时的方式,这是一种复杂的行为特征。尤其在刑事侦查中,具有反侦察意识的罪犯或许会给自己化装,不让自己身上的哪怕一根毛发掉在作案现场,但有样东西他们是很难控制的,这就是走路的姿势。
2018年11月28日

今日重磅!恺明大神又一力作!重新思考万能的ImageNet预训练模型

深度卷积神经网络方法为计算机视觉领域带来了新的活力,换言之,是因为发现使用预训练任务中学到的特征表示,能够将其中有用的信息传递给另一目标任务。近年来,一个通用的方法(模式)是使用大规模数据(例如
2018年11月23日

千呼万唤始出来,OpenCV 4.0正式发布!

请注意,DNN_TARGET_OPENCL_FP16仅在英特尔GPU上进行测试,因此仍需要额外的flags。(这个善意的提醒也就意味着你最好不要用那两家的显卡玩OpenCV(^
2018年11月20日

【赛事】京东百万巨奖寻多传感器融合定位算法英雄

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2018年11月20日

【CV竞赛】百度车道线检测,正在报名中,8.9万元奖金

在无人驾驶汽车研究领域,带有车道线属性的高精地图是商业无人驾驶的一个非常关键的环节。截止目前,大多数的高精地图都是靠人工标注来完成的。人工标注不仅效率低,而且成本高不适宜大规模的商业应用。
2018年11月19日

YOLO-LITE:专门面向CPU的实时目标检测

现在的实时目标检测算法,比如YOLO、SSD在GPU上已经可以跑的很快了,比如YOLOv2可以在GPU上跑到224fps,但在便携式笔记本甚至手机终端,这些算法还不能达到实时。
2018年11月16日

电子科大提出“姿态蒸馏”算法-实现快速人体姿态估计

姿态估计对于人体行为分析具有重要价值,目前该问题已经成为学术界研究热点,但大部分著述往往关注在设计网络学习更加适合的特征使得定位精度更高,较少研究模型实际部署时面临的模型较大和计算复杂度高的问题。
2018年11月15日

开源、高质量QR码多语言生成库

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2018年11月12日

AI医疗 | 新开源计算机视觉技术用于新生儿胎龄估计

作者在收集的124个新生儿数据上进行了实验,为便于比较,使用比较费时的手动选视频中的帧和手动标示定位ALCV位置的方法,并设计不同的分类器/回归器进行了对照实验。
2018年11月11日

DeepMind&VGG提出基于集合的人脸识别算法GhostVLAD,精度远超IJB-B数据集state-of-the-art

由上述公式得知,NetVLAD中所有聚类中心ck都参与了聚合,GhostVLAD的改进则是增加聚类中心的个数到K+G,但是增加的聚类中心在构建聚合特征矩阵的时候不参与贡献权重。
2018年11月8日

人脸识别的前世今生:从人工特征的百花齐放到深度学习的一统江湖

由于此处文献很多,基本涉及到使用不同的分块方法、使用不同的局部特征(Gabor、LBP、SIFT、LTP、LPQ等)、使用不同的子空间方法(PCA、LDA、MFDA、Laplacian
2018年11月5日

优秀!腾讯AI Lab开源模型压缩与加速框架PocketFlow!

但超参数取值对最终结果往往有着巨大的影。PocketFlow的超参数优化部分正是帮助开发者解决了这一大痛点,并且通过实验我们发现,其优化结果也要好于专业的模型压缩工程师手工调参的结果。其结构如下图:
2018年11月3日

谷歌大脑提出DropBlock卷积正则化方法,显著改进CNN精度

(b)为使用DropOut的示意图,即在整幅特征图中随机丢弃一些元素的结果,虽然绿色区域有元素被丢弃,但因为特征元素之间空间上的语义信息相关性,这种操作并不能有效激励网络学习剩下的区域的语义特征。
2018年11月1日

谷歌发布AdaNet,快速灵活的AutoML工具,帮助开发者构筑强大集成学习模型

https://github.com/tensorflow/adanet/tree/v0.1.0/adanet/examples/tutorials/adanet_objective.ipynb
2018年10月31日

PyImageSearch新出教程:Dlib多目标跟踪(附下载地址)

https://www.pyimagesearch.com/2018/10/29/multi-object-tracking-with-dlib/
2018年10月30日

Intel刚刚收购的Vertex.AI,到底有什么黑科技?

Word天!这速度,是不是吹的太过了。。。。除了支持Nvidia还支持AMD、Intel、ARM的GPU,都能做的很好吗?还不使用任何第三方库,连cuDNN也不用。
2018年10月28日

ACM MM2018 Best Paper 被华人包揽

该文研究的问题是拥挤场景下的多个体的人体部件解析,这对于视频场景群体行为分析非常重要。作者团队也很强大,主要来自颜水成老师的新加坡国立大学LV组(颜老师目前为360
2018年10月24日

OpenCV vs Dlib 人脸检测比较分析

https://www.learnopencv.com/face-detection-opencv-dlib-and-deep-learning-c-python/
2018年10月23日

近期计算机视觉竞赛汇总—总奖池高达344万人民币

7.DataFountain:基于视频的可移动物体实例分割-100万人民币https://www.datafountain.cn/competitions/324/details
2018年10月22日

重磅!清华&商汤开源CVPR2018超高精度人脸对齐算法LAB

(WFLW),包含10,000张带有98个关键点和6个人脸属性标注的人脸图像数据,包括姿势,表情,照明,化妆,遮挡和模糊的变换,旨在帮助学界更有针对性的评估关键点算法在各种条件下的鲁棒性。
2018年10月21日

英特尔重磅开源OpenVINO™ !附送的预训练模型是最大亮点

各种AI技术落地,不仅要依赖强大的GPU训练模型,也需要在各种边缘设备上部署的加速。目前,AI模型的训练基本被NVIDIA的芯片所垄断,但显然模型推断是更大的市场。
2018年10月20日

研究做得好,贡献也要大!腾讯AI Lab正式开源业内最大规模多标签图像数据集

人工智能的能源是什么?是数据!要问这个世界上谁拥有图片数据最多?谷歌?亚马逊?Flicker?腾讯?阿里巴巴?52CV君不知道,但我每天几乎都在微信和QQ给腾讯上传数据,帮助他们做研究。。。
2018年10月18日

开源、快速、高精度的椭圆检测—你值得拥有!

Segments(请注意它们是直线),(c)通过连接得到的20个arc-support组,(d)13个初始生成的椭圆,(e)通过聚类后得到的10个候选椭圆,(f)经过椭圆质量验证最后得到的2个椭圆。
2018年10月17日

最强开源OCR!印刷体古籍文字识别超越著名商业软件ABBYY

作者将训练得到的模型和主流的开源软件Tesseracts、OCRopus和商业软件ABBYY进行了比较,作者使用的评估数据集不再赘述,直接看看这漂亮的结果:
2018年10月14日

重磅!2018人脸识别研究报告(附全文下载)

10月10日专注于学术社区搜索和挖掘的AMiner重磅发布了《2018人脸识别研究报告》,从人脸识别概述、技术、人才、应用、趋势各维度分析了该领域的发展,值得学术和产业界的朋友参考。
2018年10月13日

双目立体放大!谷歌刚刚开源的这篇论文可能会成为手机双摄的新玩法

interpolating),即基线距D的立体双目相机拍摄的图像只能合成基线距小于D的图像,论文中提到的视图外差值则是要通过深度神经网络分解立体图像成多平面图像,再合成外差值后的新立体视图。
2018年10月11日

OpenCV手部关键点检测(手势识别)代码示例

DNN函数readNetFromCaffe函数加载模型权重。3)推断预测blobFromImage将图像转为blob,forward函数实现网络推断。4)获取关键点精确位置并显示
2018年10月10日

新开源!实时语义分割算法Light-Weight RefineNet

pooling),由一系列的池化层与卷积层构成,以残差的形式排列。RCU与CRP中使用3*3卷积和5*5池化。FUSION部分则是对两路数据分别执行3*3卷积并上采样后求和SUM。
2018年10月9日

OpenCV4.0 Mask RCNN 实例分割示例 C++/Python实现

RCNN目标检测与实例分割流程:1)下载模型。地址:http://download.tensorflow.org/models/object_detection/现有的四个模型:
2018年10月2日

17毫秒每帧!实时语义分割与深度估计

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2018年9月30日

OpenCV4.0 快速QR二维码检测测试示例

在官方示例程序中,调用的核心函数只有detectQRCode,其参数src是输入图像,transform是检测结果,是包含QR码四个顶点坐标的vector结构。
2018年9月29日

姿态估计 | OpenPose Plus值得期待

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2018年9月28日

Softer-NMS:CMU&旷视最新论文提出定位更加精确的目标检测算法

NMS后进一步改进,将大于一定重叠度阈值Nt的候选包围框根据置信度加权平均。(因为在训练的时候寻求包围框预测的方差小,所以这一步加权平均后不会出现框出来“四不像”的情况)
2018年9月27日

快速精准的人头检测,代码已开源

在检测网络中,anchors是很重要的概念,是一组预定义的包围框,在对象检测系统中预测尺度和位移。作者认为普通目标识别中anchors的尺度定义过大,应该根据“有效感受野”(effective
2018年9月26日

OpenCV深度学习人脸识别示例——看大佬如何秀恩爱

为什么要在使用SVM分类器而不是end-to-end训练?因为数据库太小没法训练,通常的做法就是使用在大库上训练的人脸模型提取特征,使用传统的分类算法识别人脸。
2018年9月25日

尺度不变网络提升人群计数性能(附Github地址)

来自同一幅图像和不同的图像经过resize,子图内的人物大小、人群密度、层叠关系视觉上很相似。由于神经网络中池化层直接关系到网络的尺度变化,所以本文作者希望改进池化层,提高人群计数的算法性能。
2018年9月23日

OpenCV4.0-alpha发布!新增多个深度学习特性

本定于2018年7月发布的OpenCV4.0再次跳票,昨天官方发布了OpenCV4.0-alpha,作为4.0正式版发布前的尝鲜,让我们一睹芳容!
2018年9月22日

利用边缘监督信息加速Mask R-CNN实例分割训练

(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)今天跟大家分享一篇有意思的arXiv上新出的论文,作者来自德国宝马汽车公司(BMW
2018年9月21日

TensorFlow语义分割套件开源了ECCV18旷视科技BiSeNet实时分割算法

Connections模型与DenseASPP模型,和ECCV2018旷视科技新提出的实时语义分割算法BiSeNet!这种紧跟前沿的开源库,正是52CV君要大力推广的!
2018年9月20日

美国防部DARPA发起地下空间挑战赛提供3百万美元巨奖

这项比赛中,任务是在地下环境中“快速构建地图,导航和搜索地下环境”,与其最相关的就是计算机视觉中的SLAM了,52CV君搜索了下,在地下环境中做SLAM的研究有一些但很少。
2018年9月19日

计算机视觉研究入门全指南

Lens:基于增强现实相机的语言翻译应用程序。手机摄像头可以识别一种语言的文本,并显示用另一种语言翻译的文字。我发现关于这个应用程序的最好的东西是翻译是在没有连接到互联网的情况下实时执行的!
2018年9月18日

重磅!商汤&港中文等将开源ECCV2018MS COCO检测比赛冠军代码库

(2)开发了一种特征引导的anchoring机制,替代传统的密集均匀的anchors。这种机制可以预测任意形状的稀疏anchors,其大幅改进了RPN的性能。(AR上升了大约10%!)
2018年9月17日

新思路!商汤开源利用无标注数据大幅提高精度的人脸识别算法

一个很简单的想法,是提取特征然后聚类,将聚类后的标签作为伪样本标签,但是普通的聚类难以提供高质量可信赖的标签,一个直观的例子,比如不同人侧脸的图像相似程度比同一个人正脸和侧脸图像相似程度要高。
2018年9月16日

基于YOLOv3 与CRNN的中文自然场景文字检测与识别

点击上面链接购买(如果不是在微信阅读本文,需要进入微信阅读本文才能看到链接及介绍),52CV君会获得一点佣金,也是对52CV君的一点小支持^_^,谢谢大家。
2018年9月15日

ECCV18 | 如何正确使用样本扩充改进目标检测性能(附Github地址)

假设目标检测的类别是K类,加上负样本类,则该分类问题是K+1类图像的分类问题,训练时作者使用在ImageNet预训练的ResNet50网络微调权重。下面是一些blend合成后的样本示例:
2018年9月14日

iPhone Xs发布会其实是苹果计算机视觉技术发布会!

Xs的大部分时间是苹果新的A12仿生处理器和各种炫酷的计算机视觉技术!而很显然A12强大的计算能力和神经推理能力也是为了更好的使用人工智能、计算机视觉技术!
2018年9月13日

近期计算机视觉机器学习竞赛汇总

6.DataFountain:自动驾驶三维点云分割-100万人民币https://www.datafountain.cn/competitions/314/details
2018年9月11日

ECCV18|这篇论文开源的车牌识别系统打败了目前最先进的商业软件(附Github地址)

Rekognition。在整个数据集上取得了远超过其他系统的性能,在OpenALPR数据集上取得了与最好系统相匹敌的性能,尤其在具有挑战的CD-HARD数据集上取得了异常明显的性能优势。
2018年9月10日

Kaggle新上比赛:Google AI发起地域包容性图像识别竞赛

值得一提的是,该比赛不允许使用外部数据,比如ImageNet,所以不允许使用预训练模型,因为这有可能改变训练数据源的地域分布。但可以使用维基百科的文本描述,但官方认为这也许并不必要。
2018年9月10日

ECCV18|人脸对齐与跟踪如何克服遮挡、姿态变化带来的特征点跳变?

Trees,ERT)方法提精位置。通过深度学习+几何重投影方法初始化,结合传统特征点定位的回归模型ERT,在各个数据集上几乎都达到了最好的性能。请看官方视频,在突然有遮挡的时候,特征点跳变明显减小。
2018年9月7日

揭秘阿里巴巴神奇的人物抠图算法内幕

mate与groundtruth相比较的具体评价标准不再赘述,感兴趣的读者请阅读原论文参考文献21)1.将T-Net生成的三色图作为传统算法的三色图输入,比较算法生成的alpha
2018年9月6日

ECCV18 | 无监督难分样本挖掘改进目标检测

R-CNN,在Caltech行人检测库和WIDER人脸检测库上,作者验证了使用该无监督难分样本挖掘对再训练后提高精度的有效性。Caltech行人检测的改进结果:
2018年9月5日

开源目标检测算法用于交通标志检测全方位评估

GTSDB含有900幅图像,共计1206个交通标志,其中600幅训练图像含有846个交通标志,300幅测试图像含有360个交通标志。交通标志类别分为mandatory,
2018年9月4日

力荐!计算机视觉开源工具中的瑞士军刀—Dlib最新高级特性教程

OpenCV是计算机视觉开源工具中妇孺皆知的,但Dlib绝对是这几年快速上升的一颗新星,它并不追求大而全,但它实现的每一个模块和特性,都几乎是高质量开源算法的典范。
2018年8月31日

这可能是目前最好的图像超分辨率算法,刚刚开源了

https://github.com/JiahuiYu/wdsr_ntire2018论文:https://arxiv.org/abs/1808.08718v1
2018年8月30日

Kaggle新上比赛:胸部X光片肺炎检测

比赛数据第1阶段的比赛数据已经公开,训练集包含28989幅图像,每幅图像被标注为有肺炎或者没有肺炎,对于有肺炎的图像标注出了肺炎位置(坐标及宽高)。第1阶段测试集包含1000幅图像。图像示例:
2018年8月28日

ECCV18 | UC伯克利提出基于自适应相似场的语义分割

值得一提的事,该方法实则是一种新的深度学习结构建模的方法,不仅仅可以用于语义分割,理论上可以推广到图像深度估计、光流计算等对图像进行像素级理解的任何场景。期待各位读者此基础上探索更加有趣的应用。
2018年8月27日

ECCV18 Oral | MVSNet: 非结构化多视点三维重建网络(高精度高效率,代码已开源)

dataset:相较于传统的MVS算法,我们的方法在保持了重建准确度的同时,极大地提高了模型的重建完整度。MVSNet在DTU数据集上获得了远超其他方法的结果;
2018年8月26日

BMVC18|无监督深度关联学习大幅提高行人重识别性能(附Github地址)

DAL通过以端到端方式联合优化两个基于间隔的关联损失来学习深度重新匹配模型,这有效地限制了每个帧与最佳匹配的同一摄像机表示和跨摄像机表示的关联。实验结果表明,DAL算法在三个基准测试(PRID
2018年8月24日

NVIDIA ECCV18论文:超像素采样网络助力语义分割与光流估计(代码将开源)

来自NVIDIA的研究人员开发了一种新的可微的超像素采样模型,可以直接使用深度神经网络学习超像素分割。文章已被ECCV2018录用。文中提出的超像素采样网络(Superpixel
2018年8月22日

OpenCV深度学习文本检测示例程序(EAST text detector)

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2018年8月21日

AdvancedEAST高效场景文本检测(附Github地址)

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2018年8月21日

阿里巴巴提出Auto-Context R-CNN算法,刷出Faster RCNN目标检测新高度

工作的启发下,提出了一个通用的上下文挖掘的RoI操作——RoICtxMining,它可以很方便的集成进R-CNNs系列算法的框架,并可以端到端训练。RoICtxMining是在RoIPooling
2018年8月20日

MaskFusion:惊艳的结合实例感知、语义分割、动态追踪的SLAM系统

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2018年8月20日

MultiPoseNet:人体检测、姿态估计、语义分割一“网”打尽

先检测图像中人体部件,然后将图像中多人人体的部件分别分配到不同的人体实例上,因此这类方法在测试推断的时候往往更快速,模型Size更小,但因为没能更细致的对人脸关键点建模,所以往往准确度稍低。
2018年8月15日

ECCV18 Oral | MIT&谷歌视频运动放大让计算机辅助人眼“明察秋毫”

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2018年8月15日

基于OpenCV与Dlib的行人计数开源实现

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2018年8月14日

美国IARPA发起公共安全预测机器学习挑战赛(总奖池10万美金)

挑战参与者可以通过十三个不同类别获得最高分从而获得奖品。每个得分期后的最高得分者将获得该特定时期的最高奖。定期参与和一开始就参与将会有更多的获胜机会!
2018年8月14日

高精度人脸表情识别(附GitHub地址)

目前FER2013数据集下,就我们所知,我们的模型是单模型(非集成方法)中效果最好的一个,我们猜想这源于深度卷积网络对于特征提取的有效性。数据增强的方法也能提升表情分类效果。
2018年8月13日

KDD2018 阿里巴巴论文揭示自家大规模视觉搜索算法

视觉搜索方向工业界的最佳实践,极具参考价值。使用手机一键拍照网上购物具有独特的商业价值,是一种更加直观和方便的购物体验,也是移动互联网时代连接线上线下的重要渠道。请看该文在KDD2018的视频:
2018年8月13日

重磅推荐!日立开源语义分割数据集标注工具Semantic Segmentation Editor

项目地址:https://github.com/Hitachi-Automotive-And-Industry-Lab/semantic-segmentation-editor
2018年8月10日

Kaggle新上比赛:地震图像的盐体分割

沉积物界面处产生了明显的反射。通常盐是无定形岩石,没有太多的内部结构。这意味着盐中通常没有太大的反射率,除非其中有其他沉积物。盐的异常高的地震速度可能带来产生地震成像的问题。
2018年8月10日

ECCV18 Oral | CornerNet目标检测开启预测“边界框”到预测“点对”的新思路

Network,骨干网的后端是两个预测模块,一个用来预测左上角点,一个用来预测右下角点,使用这两个模块的预测结果,将角点成对的分组到不同目标上(分组使用associative
2018年8月10日

SIGGRAPH2018黑科技:开源语义软分割改进图像编辑

添加了像素间大范围间的相互作用关系,但仍是低层特征.这里构建高层语义仿射关系项,以使得属于同一场景物体的像素尽可能的接近,不同场景物体的像素间的关系远离.
2018年8月9日

重磅!清华&商汤开源CVPR2018超高精度人脸对齐算法LAB

(WFLW),包含10,000张带有98个关键点和6个人脸属性标注的人脸图像数据,包括姿势,表情,照明,化妆,遮挡和模糊的变换,旨在帮助学界更有针对性的评估关键点算法在各种条件下的鲁棒性。
2018年8月8日

彭博社“机器学习基础”视频教程已经全部搬到腾讯视频

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2018年8月7日

OpenCV开发团队开源计算机视觉标注工具CVAT

标注模式,它可以进行图像中目标包围盒的标注,请看下面视频演示,其标注了图像中的人和车,其不仅可以标注包围盒,同时可以标注目标质量和干扰目标应被忽略的区域。
2018年8月7日

高效大规模图像搜索开源实现

搜索和识别图像中的对象已成为图像处理和计算机视觉领域的重要研究课题。给定输入查询图像,尽可能快地在大数据集中寻找类似图像,是非常具有挑战性的任务。在本文中,研究了Bag
2018年8月6日

BMVC2018图像检索论文—使用区域注意力网络改进R-MAC方法

)来解决这些问题,该网络根据全局注意力来衡量一个区域的注意力得分。我们在广泛应用的的图像检索数据集上进行了各种实验,证明我们的方法不仅显着改善了R-MAC基线方法,而且还在“pre-trained
2018年8月6日

杂乱环境下的显著性物体: 将显著性物体检测推向新高度

本研究得到了国家自然科学基金(NO.61620106008,61572264),国家青年人才支持计划,天津市杰出青年学者自然科学基金(NO.17JCJQJC43700),华为创新研究计划的支持。
2018年8月3日

TensorFlow深度自动编码器入门实践

编码器不会为了获得更好的表示而省略某些参数,它会将参数融合在一起(压缩后的变量时综合变量)以创建压缩版本,使得参数更少(比如从5个压缩到3个)。自动编码器有两个部分,即编码器和解码器。
2018年8月1日

Kaggle新上比赛:空客公司卫星图像船体分割

比赛数据总计26.4G,已经被下载下来,正在上传百度云,可以在“我爱计算机视觉”公众号后台回复:ship,即可收到下载链接。如果打开链接没找到数据,因为数据还没上传完,请过一两个小时后再打开。
2018年7月31日

重磅推荐!日立开源语义分割数据集标注工具Semantic Segmentation Editor

项目地址:https://github.com/Hitachi-Automotive-And-Industry-Lab/semantic-segmentation-editor
2018年7月30日

Facobook开源视觉问答VQA框架:Pythia

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2018年7月28日

华科新开源文本识别算法:ASTER与DeepLesion数据集百度云下载

考虑到该库超级大(226G),国内网络又无法下载,所以我准备下载下来共享到百度云(官方论文中称该库是面向所有人可获得的),经过1天多的下载一天多的上传,终于完成了。
2018年7月27日

华科白翔老师团队ECCV2018 OCR论文:Mask TextSpotter

ICDAR2013、ICDAR2015和Total-Text数据库上的实验表明,所提出的方法在场景文本检测和端到端文本识别任务中都达到了state-of-the-art的水平。
2018年7月26日

NIHCC发布迄今世界最大的CT医学影像数据集

来自图像档案的医学图像中具有临床意义的发现。在分析了这些书签的特征(包括箭头,线条,椭圆,分段和文本等不同形式)后,团队收集并整理这些书签创建了DeepLesion数据库。
2018年7月24日

ImageNet2012数据集完整版百度云下载

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2018年7月23日

Kaggle新上比赛:地震图像的盐体分割

沉积物界面处产生了明显的反射。通常盐是无定形岩石,没有太多的内部结构。这意味着盐中通常没有太大的反射率,除非其中有其他沉积物。盐的异常高的地震速度可能带来产生地震成像的问题。
2018年7月21日

快准狠!Intel论文揭示自家车牌识别算法:LPRNet

该文没有开源代码,论文地址:https://arxiv.org/abs/1806.10447v1在“我爱计算机视觉”公众号后台回复“lprnet”可以直接获取论文的百度网盘下载地址。
2018年7月20日

北大开源ECCV2018深度去雨算法:RESCAN

图像中雨水条纹会严重降低能见度,导致许多当前的计算机视觉算法无法工作,比如在自动驾驶场景下图像去雨就变得非常重要。该文提出了一种基于深度卷积和递归神经网络的新型深度网络体系结构,用于单图像去雨。
2018年7月19日

TextTopicNet:CMU开源无标注高精度自监督模型

Model生成监督信息使用LDA(Blei等,2003)Topic概率作为图像和文本的共同表示。使用文本的Topic级的表示来监督卷积神经网络的视觉特征学习。
2018年7月18日

终于!商汤科技开源DAVIS2017视频目标分割冠军代码

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2018年7月17日

谷歌更新TensorFlow目标检测API

Lite原生支持。模型量化遵循Jacob(2018)[5]的论文和Krishnamoorthi(2018)[6]的白皮书中提出的策略,使得运行速度更快,模型更小。
2018年7月16日

重磅!彭博社“机器学习基础”教程视频及讲义下载

Learning)课程的时候,52CV第一时间分享了这个消息,并下载了视频,准备分享给大家,现在视频和讲义终于上传完成,对此课程感兴趣的童鞋,赶紧下载吧。
2018年7月15日

美国IARPA发起人脸识别算法融合大奖赛

竞赛目的:人脸识别的错误率,尤其是在不可控的环境中,还远不能满足实际的需要。一种更好的算法的开发往往需要不菲的投资,如果存在一种机制可以在已有算法基础上提高识别精度,就变得非常有价值了。
2018年7月14日

彭博社推出“机器学习基础”课程

机器学习基础”在线课程。目标是提供给具有较好数学背景的人员更有价值的机器学习技能,包括经验丰富的软件开发人员,实验室科学家,工程师和金融专业人士。
2018年7月13日

MultiPoseNet:人体检测、姿态估计、语义分割一“网”打尽

先检测图像中人体部件,然后将图像中多人人体的部件分别分配到不同的人体实例上,因此这类方法在测试推断的时候往往更快速,模型Size更小,但因为没能更细致的对人体关键点建模,所以往往准确度稍低。
2018年7月12日

PRNet:人脸3D重建与密集对齐

随着直播视频的兴起,人脸动画贴纸成为一项必备的视频技术,而其后的核心技术人脸对齐和人脸跟踪在学术界也越来越火,本文介绍的PRNet就可以使你快速开发有趣的人脸应用。
2018年7月11日

阿里巴巴提出Auto-Context R-CNN算法,刷出Faster RCNN目标检测新高度

工作的启发下,提出了一个通用的上下文挖掘的RoI操作——RoICtxMining,它可以很方便的集成进R-CNNs系列算法的框架,并可以端到端训练。RoICtxMining是在RoIPooling
2018年7月10日

视频语义显著实例分割数据集SESIV

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net
2018年7月8日

开源OCR文字识别软件Calamari

OCR引擎,使用Python3编写,基于OCRopy和Kraken构建,它的设计使你既可以方便的使用命令行运行,也可以把它模块化嵌入到其他python脚本中。
2018年7月6日

美国高级情报研究计划局(IARPA)发起公共安全问题预测机器学习挑战赛(总奖池10万美金)

挑战参与者可以通过十三个不同类别获得最高分从而获得奖品。每个得分期后的最高得分者将获得该特定时期的最高奖。定期参与和一开始就参与将会有更多的获胜机会!
2018年7月5日

计算机视觉研究入门全指南

Lens:基于增强现实相机的语言翻译应用程序。手机摄像头可以识别一种语言的文本,并显示用另一种语言翻译的文字。我发现关于这个应用程序的最好的东西是翻译是在没有连接到互联网的情况下实时执行的!
2018年7月2日

Keras与PyTorch全方位比较 哪一个深度学习框架更适合初学者?

PyTorch于2016年10月发布,是一款专注于直接处理数组表达式的低级API。它在去年获得了巨大的兴趣,成为学术研究的首选解决方案,以及需要优化定制表达的深度学习应用。它受Facebook支持。
2018年6月29日