详细解读
文本到 3D 的难点在于,提示词只提供语义目标,没有真实多视角观测。GaussianDreamer 先引入点云先验,为高斯提供一个更合理的空间骨架,减少从空场景开始优化的不确定性。
随后,扩散模型根据文本提示对不同视角的渲染结果给出监督。高斯表示的快速渲染让这种多视角迭代更高效,也更容易观察生成过程。
这篇论文的重点是把“生成先验”和“显式 splat 表示”结合起来。点云负责结构初始化,扩散指导负责语义和外观,高斯负责可渲染、可优化的 3D 表示。
局限是生成式 3D 仍然依赖先验猜测。复杂拓扑、精确尺寸和隐藏区域不一定可靠,适合快速内容草稿和研究验证,而不是严格测量级重建。