详细解读
动态 3DGS 的核心问题是:什么应该跨时间共享,什么应该随时间变化。论文没有为每一帧训练一套独立高斯,而是维护一个 canonical 高斯集合,再通过时间条件形变场把它们移动到目标时刻。
形变场是算法中心。给定时间后,网络预测高斯的位置、旋转、尺度等偏移;渲染时先变换高斯,再投影、排序和合成。这样渲染管线仍然接近静态 3DGS,但时间变化被压缩进较小的函数。
训练同时要匹配每一帧画面,并避免模型用任意颜色或透明度变化来伪造运动。相机覆盖和初始化很重要,因为错误 canonical 对应关系会让运动表面被错误基元解释。
它的重要性在于证明 Gaussian Splatting 可以处理静态格式之外的时变内容。局限是 canonical 形变难处理拓扑变化、长序列和快速遮挡,但“持久场景元素 + 时间条件运动”的思路成为许多 4DGS 系统的参照。