其他
上海AI实验室联合多所高校推出PonderV2预训练方法与模型,推进AI深度理解三维世界
近日,上海人工智能实验室(上海AI实验室)联合香港大学、浙江大学和中国科学技术大学共同推出PonderV2通用3D预训练方法与模型。
Ponder系列在通用3D方面实现三个“首次”:首次同时支持室内外使用场景;首次同时支持点云、体素和多视角图像输入;首次在不同语义层级的下游任务上达成最佳性能。在通用人工智能的研究领域,教导计算机深度理解三维世界是当前重要研究目标之一,并将为各种AI实际应用奠定坚实基础。PonderV2代码同时开源。
论文标题:
PonderV2: Pave the Way for 3D Foundation Model with A Universal Pre-training Paradigm
论文链接:
arxiv.org/abs/2310.08586
开源链接:
github.com/OpenGVLab/PonderV2
PonderV2具有深度理解和感知三维真实世界的能力,并为广泛的三维应用提供强大支持。在预训练方面,该预训练与模型具备以下四项核心优势。
统一的预训练方式
同时支持室内外场景3D任务
灵活支持多种输入模态
同时支持高层级语义和底层重建下游任务