来源:知乎—JeffWang地址:https://zhuanlan.zhihu.com/p/480829222做Multi-View Stereo (MVS) 以及 Structure-from-Motion (SfM) 的同学对COLMAP这个词应该不陌生, COLMAP[1] is a general-purpose SfM and MVS pipeline with a graphical and command-line interface. It offers a wide range of features for the reconstruction of ordered and unordered image collections. 说白了, COLMAP是用来做SfM或者MVS的软件,该软件内的算法主要从两篇文章中提炼出来:(1)Structure-from-Motion Revisited[2](2) Pixelwise View Selection for Unstructured Multi-View Stereo[3]. 本文主要针对COLMAP在MVS中的算法原理进行paper解读,即解读第二篇文章。Pixelwise View Selection for Unstructured Multi-View Stereo发表在2016年的ECCV,由ETH的Marc Pollefeys大佬组发表。本篇知乎blog首先给出该篇文章想要解决的问题 (Problem to be addressed),然后分析其解决方案 (Methods),更多的细节可以参考原文。
01
Problem to be addressed"This work presents a Multi-View Stereo system for robust and efficient dense modeling from the unstructured image collection." 这句话是摘要的第一句话,作者想要提出一个的MVS模型,使它能够从unstructured图像输入中稠密重建出3D场景。这并不是说在这篇文章之前没有相关的方案,只不过之前的方案存在一些问题 (1) 重建的accuracy, completness, robustness, efficiency都不令人满意。(2)尤其是在uncontrolled场景(unstructured图像输入,输入图像尺寸不一样,光照不一样等),重建结果更令人堪忧。为了解决这些方案,作者提出了以下解决方案。
其中 选取的是 比较大的source images。至此位置,说完了baselinede做法,下面开始说本篇paper的几点改进:(1) Pixelwise normal estimation. (2) Pixelwise view selection . (3) Integration of a “temporal” view selection smoothness term. (4) Adaptive window support through bilateral photometric consistency. (5) Introduction of a multi-view geometric consistency term for simultaneous depth/normal estimation and image-based fusion.
Pixelwise Normal Estimation
上面提到的baseline在做homography-warping的时候使用了fronto-parallel 假设,这会导致artifacts for oblique structure。所以我们在估计深度的同时估计surface normals。做法比较简单,只是在之前的基础上多估计了一个 :