新闻 | 北京大学前沿计算研究中心3篇论文获ICCV 2019录用
关键词:ICCV 2019
导读
2019年10月27日至11月2日,国际计算机视觉顶级学术会议 ICCV (International Conference on Computer Vision) 在韩国首尔举行,参会人数创历史新高,达到了7500人。会议共收到4303篇投稿,录取1077篇,录稿率约25%。北京大学数字视频编解码技术国家工程实验室教授、前沿计算研究中心副主任王亦洲课题组共有3篇论文被录用。王亦洲教授和学生吴博烔、兹海、马霄璇参加会议并展示了相关工作。
1
Learning with Unsure Data for Medical Image Diagnosis
基于医疗影像的早期诊断中不确定样本的检出
在疾病发展的早期阶段,由于缺乏足够的信息,可能难以给予某些病例确定性的“疾病/正常”标签,我们将此类样本称为“不确定”的数据。将这些数据标记为不确定后建议患者进行后续检查,以避免因为不谨慎预测而造成的不可逆转的医疗事故或损失,这也是临床诊断实际的常见做法。然而,当前的机器学习方法大多忽略了“不确定”数据,主要针对“疾病和正常”两类样本数据进行建模,导致对“不确定”数据不能进行更好的识别和确定。为了解决上述问题,本文提出了“学习不确定数据”问题,并将其作为序数回归问题进行建模,同时提出统一的端到端深度学习框架,该框架还考虑了下述两个问题:1)结合代价敏感参数来减轻数据不平衡问题,以及2)通过在训练程序中引入两个参数来执行保守和积极的策略。我们进而通过对阿尔茨海默病(AD)早期诊断和肺结节的疾病预测证明了使用不确定数据进行学习的优势和我们模型的有效性。
论文地址
←扫描二维码获取
2
Optimizing Network Structure for 3D Human Pose Estimation
针对三维人体姿态估计的网络结构优化
人体姿态可以表示为一张图,其中人体的关节点和骨骼可以分别表示为图的结点和边,所以使用图卷积神经网络(GCN)去解决人体的三维姿态估计问题是一个很自然的想法。本文提出了一个通用的框架来表示图卷积神经网络和全连接神经网络,从这个统一的框架出发,我们发现使用GCN来估计人体三维姿态会出现表征能力不足的情况。本文通过引入局部连接网络(LCN)来克服GCN表征能力不足的限制,极大的提高了网络的表征能力。同时在LCN中,每一个结点都只和它周围的几个邻居结点相连,这使得LCN拥有很强的泛化能力。在公开数据集上的实验表明LCN的性能超过当前其他SOTA方法,同时可以很好的泛化至之前没有见过的动作和数据上。
论文地址
←扫描二维码获取
3
Align, Attend and Locate: Chest X-ray Diagnosis via Contrast Induced Attention Network with Limited Supervision
基于差异注意力机制网络的有限监督胸片诊断
众所周知,由于胸部X光片在医院的门诊/急诊检查以及体检筛查中非常普遍,所以基于胸片异常征象的自动检测识别方法对胸腔疾病的早期诊断具有重要的临床意义。而且对于医疗场景异常征象的分类以及定位相对于单纯的征象分类具有更强的临床价值和可解释性,但是受限于数据标注成本过高的原因,目前可公开获取的高质量标注数据集数量严重不足,使得征象定位的准确率目前还比较低。本文正是主要聚焦在征象分类+定位这一问题上,利用胸片结构高度相似的特点,将阳性样本和阴性样本配对,在高层语义空间利用二者差异产生的注意力机制对病灶的潜在位置给予引导。同时,针对胸片尤其是床旁片拍摄角度、距离等不同造成的成像差异,借鉴风格迁移算法中常用的感知损失函数,训练了一个输出校正参数的对齐模块,能够将所有胸片对齐校正到统计意义上的标准结构胸片。在位置标注非常有限的Chest X-ray 14数据集上,将征象分类和定位准确率带来了显著提升,超过当前最优算法。
论文地址
←扫描二维码获取
ICCV
IEEE International Conference on Computer Vision(IEEE ICCV),即国际计算机视觉大会,是计算机视觉领域国际顶级会议(CCF A类),与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会议。ICCV在世界范围内每两年召开一次,ICCV 2019于 2019 年 10 月 27日-11 月 2 日在韩国首尔举行。
图文 | 吴博烔、兹海、马霄璇
Computer Vision and Digital Arts (CVDA)
About CVDA
The Computer Vision and Digital Art (CVDA) research group was founded in 2007 within the Institute of Digital Media at Peking University led by Prof. Yizhou Wang. The group focuses on developing computational theories and models to solve challenging computer vision problems in light of biologically plausible evidences of visual perception and cognition. The primary goal of CVDA is to establish a mathematical foundation of understanding the computational aspect of the robust and efficient mechanisms of human visual perception, cognition, learning and even more. We also believe that the marriage of science and art will stimulate exciting inspirations on producing creative expressions of visual patterns.
CVDA 课 题 组 其 他 论 文 解 读
— 版权声明 —
本微信公众号所有内容,由北京大学前沿计算研究中心微信自身创作、收集的文字、图片和音视频资料,版权属北京大学前沿计算研究中心微信所有;从公开渠道收集、整理及授权转载的文字、图片和音视频资料,版权属原作者。本公众号内容原作者如不愿意在本号刊登内容,请及时通知本号,予以删除。