研究论文

Speedy-Splat: Fast 3D Gaussian Splatting with Sparse Pixels and Sparse Primitives

一篇关于稀疏像素和稀疏基元加速的 3DGS 论文,核心思路是同时减少像素工作量和基元数量,让 3DGS 更快、更小并更快训练。

June 2025加速arXiv:2412.00578

详细解读

Speedy-Splat 是一篇系统加速论文,关注 3DGS 仍然浪费计算的地方。原始渲染已比 NeRF ray marching 快很多,但每帧仍要投影、分桶、排序和混合大量高斯;如果屏幕足迹过于保守或冗余基元没有删掉,渲染器就会做很多无效工作。

方法第一部分改进 rasterization 中的高斯定位,让每个投影高斯触达的像素集合更贴近真实贡献。splatting 成本既和基元数有关,也和屏幕覆盖面积有关,因此更紧的定位即使不改变视觉结果,也能提升速度。

第二部分是在训练中引入 sparse-primitives 策略,而不是等场景训练完再后处理裁剪。这样模型在较小预算下学习,减少大模型先学出脆弱依赖、再被压缩破坏的风险。

论文同时改善帧时间、模型大小和训练时间,对查看器开发比单纯 PSNR 提升更直接。局限是激进裁剪仍可能伤害稀有视角细节,所以需要视觉检查而不只是平均指标。

论文解决了什么

Speedy-Splat 发现原始 3DGS 有两类低效:屏幕空间 splat 定位不够精确导致像素工作过多,以及视觉贡献很小的基元在训练后仍然保留。

论文结合更紧的渲染定位和训练中裁剪,在减少模型大小和训练时间的同时获得显著渲染加速。

核心思路

  • 优化 rasterization 管线,减少不必要的稀疏像素工作。
  • 在训练中引入裁剪,使高斯集合保持紧凑。
  • 同时面向渲染速度、文件大小和训练时间。
  • 在多个基准上报告较大平均加速。

为什么重要

  • Web 和应用查看器中,数百万基元代价很高。
  • 它补充了压缩论文,因为它直接减少渲染工作量。
  • 它提供了让高质量场景在受限硬件上可用的实践路线。

适合阅读的人

  • 你在优化 3DGS viewer 或 renderer。
  • 你更关心部署大小和 FPS,而不只是重建质量。
  • 你想理解基础 3DGS 哪些部分仍在浪费计算。

局限与注意点

  • 裁剪决策可能伤害只在稀有视角重要的细节。
  • 方法主要面向静态 3DGS,动态管线还需要时间逻辑。
  • 渲染器集成细节会影响实际结果。