详细解读
CylinderSplat 关注全景新视角合成。360 度图像不是普通广角图多一些像素:它围绕观察者闭合,具有明显的径向结构,室内场景还常常符合墙面垂直、地面水平的布局。笛卡尔三平面在稀疏视角和大遮挡下容易扭曲这种几何。
核心表示是圆柱三平面。它不再沿普通 xyz 平面分解体积,而是使用更贴合半径、角度和高度的坐标,让特征沿着全景场景的自然结构传播,减少把房间硬塞进笛卡尔网格造成的失真。
模型包含两个互补分支:像素分支处理输入全景中已经清楚观测到的区域,体积分支利用圆柱三平面推断被遮挡或观测稀疏的区域。这种设计让模型既能利用可见证据,又能有结构地补全缺失空间。
输出是前馈 3DGS 表示,不需要像经典 3DGS 那样为每个场景长时间优化。它可以处理单张或多张全景输入,适合 VR、房产和室内采集;但圆柱先验比较依赖场景域,对任意物体扫描或非 Manhattan 户外场景不一定泛化。