详细解读
Segment Any 3D Gaussians,也就是 SAGA,关注可提示 3D 分割。用户希望像使用 SAM 一样点选或框选对象,但原始 3DGS 没有尺度感知的语义特征,也无法直接回答“这个提示对应哪些高斯”。
论文为高斯学习尺度感知亲和特征,使 2D prompt 能映射到 3D 高斯集合。这样交互式选择可以在 3D 表示中完成,而不是每次都只在某个渲染视角里重新分割。
关键在尺度:同一个点或框在 2D 里可能指小物体、部件或大区域。SAGA 通过多尺度特征让分割结果更符合用户意图,也更容易跨视角保持一致。
它对 splat 编辑器非常实用,因为选择是删除、移动、换色和局部处理的入口。局限是 promptable segmentation 仍依赖训练数据和视觉歧义,透明、细小和遮挡对象仍可能分错。