详细解读
Street Gaussians 面向自动驾驶街景:世界尺度大、相机运动明显,而且包含静态背景、移动车辆、行人、天空、道路和重复纹理。把整段序列当作一个静态 splat cloud 会直接失败。
论文把背景和前景 actor 分开建模。静态区域可以在场景坐标系中表示,动态对象则需要对象中心的运动和时间相关放置;语义线索帮助判断哪些高斯属于哪个实体,以及它们应该如何移动。
算法上它是一种 factorization。如果每个移动物体都被当作整场景形变的一部分,优化会高度纠缠且低效;给对象自己的高斯集合或变换后,模型能保持 actor 身份,并渲染新的视角和时间。
它对大规模捕获和仿真很有价值,把 3DGS 和驾驶数据的结构对齐。局限是依赖检测、跟踪和标定较好的多相机数据;长距离一致性、稀有动态和复杂遮挡仍然难。