Sharp Monocular View Synthesis in Less Than a Second

一篇关于单图快速视图合成的 3DGS 论文，核心思路是Apple 的前馈方法从单张图像预测具备度量尺度的 3D 高斯表示。

December 2025单图重建arXiv:2512.10685

详细解读

Sharp Monocular View Synthesis 关注单张图像的快速视图合成。和传统 3DGS 不同，它没有多视角 SfM 和长时间优化，而是前馈地从一张图预测具备度量尺度的 3D 高斯表示。

这类方法的难点在于单图深度和隐藏面都是不确定的。论文利用学习到的先验估计几何、尺度和外观，使模型能从一个输入视角生成邻近新视角，而不是重建完整真实场景。

它的重要算法意义是把 3DGS 作为神经网络输出格式。高斯的快速渲染让前馈预测可以立即被查看和监督，同时比纯 2D 视图插值更具有空间结构。

这对移动端预览、照片立体化和快速内容生成有吸引力。局限也很自然：单图无法知道背面和遮挡区域，视角移动过大时会依赖先验猜测，不能替代真实多视角捕获。

这篇 Apple 单图视图合成工作用前馈网络从单张图像预测具备度量尺度的 3D 高斯表示。

它面向快速 view synthesis，而不是传统多视角重建或逐场景长时间优化。