科研速递 | 理工学院李镇教授团队在NeurIPS上发表文章
近日,香港中文大学(深圳)理工学院李镇教授领导的深度比特实验室(Deep Bit Lab)团队的论文"Let Images Give You More: Point Cloud Cross-Modal Training for Shape Analysis"被NeurIPS收录。
NeurIPS全称为神经信息处理系统大会(Conference on Neural Information Processing Systems),是机器学习领域的顶级会议,在中国计算机学会的国际学术会议排名中,为人工智能领域的A类会议,在2022谷歌最新学术指标出中排名前十,NeurIPS是全球人工智能和机器学习领域最重要、最顶级的盛会,预计今年将吸引着超过近万名来自世界各地的顶尖人工智能研究人员和从业人员参加。
论文地址:
https://128.84.4.34/pdf/2210.04208
Github:
https://github.com/ZhanHeshen/PointCMT
研究介绍
点云作为一种基本的三维表征方法,活跃在自动驾驶、机器人感知等多种任务上。尽管三维点云分析在进年来取得了良好的发展,但基于单模态的点云表示学习正逐渐走向瓶颈 —— 点云虽具有丰富的几何信息,但本身是无序、无纹理以及稀疏的存在。为了获得具备更强辨识能力的表征,过去的工作常常引入额外的二维图像信息(例如纹理、颜色和阴影等),然而这类的方法严重增加模型的复杂性和计算量,且在应用场景中额外的二维信息往往是不存在的。为了解决上述问题,该工作提出了基于点云分析的跨模态知识蒸馏框架PointCMT,作为点云多模态表征学习的新范式。PointCMT仅需要在训练阶段使用额外的图像数据,并能有效提升模型的表征能力,在测试阶段中被强化的模型可以单模态部署。在PointCMT的训练范式下,仅使用非常早期的基线模型PointNet++便可以在ModelNet40数据集上达到最先进的水平(94.4%)。不仅如此,最近的最优方法(例如PointMLP等)依然可以被PointCMT有效提升。
作为全新的多模态学习范式,PointCMT具有具有以下的优势:
通用性:PointCMT可以应用于任意的点云分析模型,不需要对模型结构进行修改;
有效性:PointCMT有效地提升数个基线方法的表现;
高效性:PointCMT只在训练阶段使用了额外的图像数据,在测试阶段被强化后的模型可以独立部署;
灵活性:PointCMT可以通过简单的投影点云生成额外图片数据,不依赖于自然图像。
同时,李镇教授的论文"Divide and Contrast: Source-free Domain Adaptation via Adaptive Contrastive Learning, AMOS: A Large-Scale Abdominal Multi-Organ Benchmark for Versatile Medical Image Segmentation"均被NeurIPS 2022和NeurIPS 2022 Track Datasets and Benchmarks收录。
论文学生
本文章的共同第一作者是香港中文大学(深圳)在读博士生颜旭和占贺深,指导老师为李镇和崔曙光教授,第一单位为香港中文大学(深圳)。
颜旭是香港中文大学(深圳)理工学院/未来智联网络研究院的在读博士生。本科毕业于中山大学数学学院,研究生毕业于香港中文大学(深圳)数据科学学院。他的主要研究方向是3D点云处理。颜旭个人主页请参阅:https://yanx27.github.io/
占贺深是香港中文大学(深圳)理工学院/未来智联网络研究院的在读博士生。本科毕业于吉林大学数学学院,他的主要研究方向是非欧数据表示学习与优化。
指导老师
该文章指导老师是香港中文大学(深圳)理工学院助理教授/未来智联网络研究院助理教授李镇以及理工学院校长学勤讲座教授、未来智联网络研究院院长崔曙光。
李镇教授
理工学院助理教授
未来智联网络研究院助理教授
校长青年学者
李镇博士目前是香港中文大学(深圳)理工学院助理教授/未来智联网络研究院助理教授,同时兼任深圳市大数据研究院研究科学家。他获得香港大学计算机科学博士学位(2014-2018年),中山大学通信与信息系统硕士学位(2011年至2014年)以及中山大学自动化学士学位(2007-2011)。他还于2018年在芝加哥大学担任访问学者,并于2016年在芝加哥丰田技术学院(TTIC)担任访问学生。他的研究兴趣包括人工智能跨学科研究,计算机视觉以及深度学习辅助的通知感知计算一体化的未来智联网络。同时,李镇博士还获得了来自于国家、省市级以及工业界的科研经费,有关更多详细信息请参阅他的主页:
https://mypage.cuhk.edu.cn/academics/lizhen/
欢迎对于室外大场景自动驾驶、无人机(尤其是工业级无人机操控和数据采集),室内场景解析中利用多模态数据进行融合解析感兴趣的同学加入课题组研究。Depp Bit Lab主要的研究方向是3D视觉解析及应用(包括但不限于点云解析,多模态联合解析),深度学习等基础理论算法研究,并致力于将2D/3D人工智能算法推广应用于蛋白/RNA结构预测,自动驾驶,工业视觉,许可Web3.0等场景中。
李镇教授个人主页及Deep Bit Lab
崔曙光教授
理工学院校长学勤讲座教授
未来智联网络研究院院长
深圳市大数据研究院常务副院长
崔曙光教授,国家重点研发计划首席科学家,全球高被引学者,IEEE Fellow,深圳市杰出人才培养计划首批入选人。崔教授于2005年在美国斯坦福大学获得博士学位,先后在UC Davis等多所美国大学任教至讲座教授。现任香港中文大学(深圳)理工学院校长学勤讲座教授、未来智联网络研究院院长、港中深-京东集团人工智能联合实验室主任,深圳市大数据研究院常务副院长。
崔教授的科研成果主要集中在数据驱动、AI赋能的大规模系统控制和资源管理。他已在国际一流期刊和会议上发表了280多篇论文,是IEEE 信号处理协会2012年最佳论文奖获得者,并曾担任多个IEEE国际会议的主席和程序委员会主席,两个IEEE国际期刊的指导委员会成员、主席,多个IEEE国际期刊的编委和领域主编,IEEE无线技术委员会的主席。他在2013年当选IEEE Fellow(博士毕业8年内入选,IEEE历史上最快之一),在2014年入选IEEE通信协会杰出讲师,汤森路透全球高被引科学家名单,和ScienceWatch的全球最具影响力科学家名单。在2017年10月,基于其在物联网和数据分析领域的学术声誉,他应阿里巴巴集团的邀请到杭州,作为13名科学家之一为阿里巴巴达摩院的成立提供了战略性意见。崔教授在2020年获得IEEE ICC最佳论文奖,IEEE ICIP最佳论文列表,IEEE GLOBECOM最佳论文奖,中国ICT2020创新应用奖,Chinagraph首个图形开源数据集奖,中国电子学会自然科学一等奖,中国通信学会技术发明一等奖。
- END -
点击以下链接,进入理工时刻:
喜讯 | 理工学院本科生姚南君与林泽昕两篇一作论文被《IEEE计算社会系统汇刊》和IEEE多媒体信号处理国际研讨会接收
活动回顾 | 偏微分方程:分析、几何与拓扑的相互作用研讨会圆满落幕
科研速递 | 香港中文大学(深圳)理工学院解碧野教授团队在国际物理学期刊《Physical Review A》上发表文章
科研速递 | 林天麟教授团队在IEEE Transactions on Image Processing 上发表文章
相遇在未来・访谈录|理工校友在加利福尼亚大学圣地亚哥分校(下)
科研速递 | 香港中文大学(深圳)唐本忠院士团队发布首个聚集体科学通用数据库ASBase
科研速递 | 理工学院郑庆彬教授团队在国际碳材料顶级期刊Carbon上发表文章