详细解读
Sharp Monocular View Synthesis 关注单张图像的快速视图合成。和传统 3DGS 不同,它没有多视角 SfM 和长时间优化,而是前馈地从一张图预测具备度量尺度的 3D 高斯表示。
这类方法的难点在于单图深度和隐藏面都是不确定的。论文利用学习到的先验估计几何、尺度和外观,使模型能从一个输入视角生成邻近新视角,而不是重建完整真实场景。
它的重要算法意义是把 3DGS 作为神经网络输出格式。高斯的快速渲染让前馈预测可以立即被查看和监督,同时比纯 2D 视图插值更具有空间结构。
这对移动端预览、照片立体化和快速内容生成有吸引力。局限也很自然:单图无法知道背面和遮挡区域,视角移动过大时会依赖先验猜测,不能替代真实多视角捕获。