BMCV 2024 | 跨视角不确定性，让无人机助力更鲁棒的道路场景合成

作者：3D视觉工坊发布时间：2024-10-16

本文旨在解决传统道路场景合成技术中仅用车辆视角导致新视角合成鲁棒性较差的问题。为此，清华大学智能产业研究院赵昊老师团队提出了巧妙结合航拍与地面信息的道路场景合成新方法，该方法首次将跨视角不确定性融入3D-GS的训练之中，有效利用了航拍信息，全面提升了道路合成效果。

论文名称：Drone-assisted Road Gaussian Splatting with Cross-view Uncertainty
论文链接：https://arxiv.org/pdf/2408.15242
项目网址：https://sainingzhang.github.io/project/uc-gs/
代码链接：https://github.com/SainingZhang/uc-gs/

一．数据集&研究动机

3D-GS是近期备受瞩目的3D表示方法，因其高效和出色的质量在业内引起了广泛关注。然而，对于道路场景合成任务来说，受限于狭窄车辆视角数据集的影响，3D-GS很难实现鲁棒的新视角合成。因此，本文试图利用航拍图像丰富的视角信息辅助道路场景的合成。

为了更好地量化道路合成效果，本文基于虚幻引擎构建了真实城市道路场景的仿真数据集。为了模拟现实世界中的驾驶条件，我们在1.5米和1.8米的高度捕获前视图像，在20米的高度，向下60°采集航拍图像。在1.6米和1.9米高度的测试数据上评估视角变化。

图1. 地面数据视角示意图

本文首先进行了空地数据联合训练与仅地面数据训练的对比实验。从图2各个指标的虚实线对比可知，与仅使用地面图像训练相比，空地联合训练可以在道路视角平移与旋转时一定程度上减缓各指标的下降趋势。然而，联合训练在保留测试集上反而略有下降。这可能由于航拍图像中与道路场景不重叠的区域或对道路场景合成贡献很小的区域，不仅未能增强道路视角的合成，还对3D高斯的收敛也构成了更多挑战。这导致联合训练不能有效提升道路场景的合成效果。

本文采用跨视角不确定性的方法在训练过程中对航拍图像的像素进行加权，合理利用了航拍数据中对道路场景合成的有效信息，增强了仿真数据集上的测试效果。

图2. 不同方法在地面数据或地面和航拍数据训练的结果。（G）为仅用地面数据训练，（A+G）为空地数据联合训练。View(+0.1m)为上升0.1m测试，View(+0.1m 5°d)为上升0.1m向下倾斜5°测试。

二．方法

2.1 框架

本文首先采用基于集合渲染的方法来计算不确定性，量化3D高斯模型在地面图像上的学习结果。接下来，将地面不确定性投影到空中，构建跨视角不确定性。随后，我们将这种跨视角不确定性引入到3D高斯模型的训练中，作为损失函数中航拍图像的权重，同时保留地面图像的原始渲染损失。

图3.框架

2.1.1 不确定性计算

为了量化航拍图像各个像素对道路合成的贡献，本文从另一个角度出发，试图先量化地面数据单独训练的效果。因此，本文采用了一种基于集合渲染的不确定性计算方法，首先仅用地面数据训练了多个3D-GS，然后计算出地面视角上渲染结果的RGB方差作为地面不确定性。不确定性值越高，说明该区域的学习效果越不稳定，越需要对应航拍信息的补充。

2.1.2 跨视角不确定性的投影

为了将地面不确定性转换为航拍数据的权重，本文采用了最近在多个3D任务中创下了SOTA的端到端稠密立体模型——DUSt3R，作为航拍图像和地面图像之间的2D-2D像素匹配器。通过这种方式，地面不确定性通过地面图像与航拍图像之间的匹配对投影到空中，并对具有多个匹配的像素的不确定性进行平均，构建了用于训练的跨视角不确定性图。

图4. 跨视角不确定性可视化

2.1.3 基于跨视角不确定性的3D-GS训练范式

本文在Scaffold-GS研究的基础上展开，因此延用了Scaffold-GS的损失函数设置，包括RGB损失和SSIM损失。针对地面数据，本文采用了与3D-GS传统方法一致的训练策略，将所有像素的损失权重设置为1。对于航拍数据，本文首先对视角间的不确定性进行了归一化和平滑处理。随后，在训练过程中，利用这些处理后的不确定性值对航拍图像的每个像素损失的计算进行加权。

三．实验结果

为了验证本文方法的有效性，本文在两个城市道路场景的仿真数据集（NYC、SF）上进行了实验。

表1. 在NYC (a)和SF (b)上的实验结果。*为高清航拍数据。(G)、(A+G)分别为仅用地面数据训练与空地联合训练。

定量分析 由表1，本文方法在保留测试集与视角平移与旋转时，均优于所有仅在地面数据训练的方法。具体表现为在保留测试集上PSNR提高了0.68 (NYC)和0.41 (SF)，视角平移与旋转时PSNR提高了0.90 (NYC) 和0.80 (SF)，SSIM与LPIPS也均有进步。在Scaffold-GS的横向对比上，本文方法相比空地联合训练在保留测试集上PSNR提高了0.66 (NYC) 和0.59 (SF)，视角平移与旋转时PSNR提高了0.47 (NYC)和 0.57 (SF) ，并且逆转了空地联合训练对SSIM与LPIPS的负面影响，全部指标甚至优于用高清航拍数据辅助训练的效果。

图4.与仅用地面数据训练的方法的定性对比

图5.Scaffold-GS上不同训练方法的定性对比

定性分析定性上，无论是与仅用地面数据训练的方法还是在Scaffold-GS上的横向对比，本文方法在道路细节的渲染上明显优于其他方法。

四．结论

本文提出了一种创新的基于3D-GS的无人机辅助道路场景合成方法。为了利用无人机视角中的丰富信息来辅助地面数据的训练，我们首次将跨视角不确定性的概念融入3D-GS模型中，在训练过程中对航拍图像中的像素进行加权。这种方法减少了冗余信息的干扰，有效地利用航拍图像辅助道路场景合成。未来的工作将致力于可动态调节的不确定性权重，对于场景几何的讨论以及真实数据集上的应用。

本文仅做学术分享，如有侵权，请联系删文。

3D视觉工坊可提供顶会论文的课题如下：

最近有同学给我留言说化学成绩不是很好，现在复习到化学工艺流程的板块，不知道怎么分析问题，答不出来，该怎么办？这个专题主要考察的是物质之间的反应与推理，想要突破这个板块，首先我们要将工艺流程的基础知识点背熟，然后考试的时候，就能够用这些知识点，将陌生问题转化为我们熟悉的问题了！今天学姐把【高中三年化学工艺流程42个重要考点】整理出来，分享给你，如果这个板块薄弱的同学，家长赶紧给孩子打印。可以说背会考试直接用！由于篇幅限制完整版，见文末~关+留“111”，领完整版可打印高中生人手一份！！！先领先得！！！

晗晗老师_ 2024-10-13

EthanUncle 2024-10-13

重置的部分差不多就结束了，接下来的内容将不再是对之前已经介绍过的内容的重新讲述，而是在之前的内容的基础之上继续深入地研究有关常微分方程的内容。我们已经介绍过了有关常系数线性微分方程的解法（包括齐次方程以及右侧函数为拟多项式的情况），现在我们进一步要考虑的，实际上是上述情况的自然推及。既然对一般的方程已经有了介绍，我们自然就要想到去研究由这样的方程构成的方程组的解法。不过，单个方程和方程组之间的差别实际上并不算是很小。就形式上来说，方程组涉及到多个函数（关于同一变量的，不然就会是偏微分方程组），而这些函数可

不能吃的大鱼 2024-10-13

BMCV 2024 | 跨视角不确定性，让无人机助力更鲁棒的道路场景合成

推荐体验

相关资讯

面对2024年车市的不确定性，干就对了！

ChatGPT的技术“涌现”“不确定性”也成为“可确定”？ | 这可怎么说

i人事2023：在不确定性的年份做正确的事情

办公软件卷入混战大模型选择加大不确定性

王怀民：开源在不确定性的时代更有竞争力

近期资讯

如何提升写作能力

【高中化学】工艺流程42个重要考点！掌握它必上90+！

#12 使用示例3 - 假名罗马字转换（控制台输入）

爬壁机器人依靠汇四方磁吸轮，代替人工作业防腐除锈安全更高效

Windows和Office一键激活工具HEU KMS Activator离线版

告别纸张束缚，汉王N10 Pro电纸本的读写新体验

「高中物理」最全公式大全，背熟考试直接套用！！！

python版弹球游戏，仅需标准库

国家汉办的教师证书考试流程是怎么样的？

挺有用的常微分方程（七）

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响