126 / 2023-10-25 15:17:32
单目视觉图像深度估算模型(已参加吉林省赛区评审)
全文待审
梁佳鑫 / 长春建筑学院
刘泓岩 / 长春建筑学院
孙湘婷 / 长春建筑学院
张雨欣 / 长春建筑学院
刘畅 / 长春建筑学院
本项目是2021年「基于 Metashape 的无人机遥感测绘高精度实景建模方案」项目的衍生作品,当时的项目我们使用了国外的闭源软件 Agisoft Metashape 完成了疏密点云的计算及生成工作。

Metashape 的图像深度信息主要是由多维度、大批量的影像实景采集数据拼接后进行正交计算所得出,其数学计算量庞大且数据精度要求极为严苛,不适用于持有便携式手持摄像设备的场景建模作业,本项目的研究试图使用全新的 AI 方案来解决此问题。

我们项目的主体内容是使用 TensorFlow Keras 训练的一个使用 DenseNet201 主干网实现的 U-Net 架构 AI模型,该模型只需要给定单个 RGB 通道的图像作为输入,即可预测每个像素的深度信息并生成深度图,这是从 2D 图像推断场景几何体的关键基础步骤。

我们使用RGBD相机(我们使用的是 Microsoft Kinect)收集带有深度信息的图像和对应的标签数据集,使用制作的希区柯克效应视频作为空间几何粗粒度点云生成所用的模型,使用随机梯度下降算法来最小化损失函数,最终获得了可以在静态单目视觉图像下进行较为精确的比深度估算的模型。
重要日期
  • 会议日期

    11月17日

    2023

    11月19日

    2023

  • 11月30日 2023

    初稿截稿日期

主办单位
中国虚拟现实大赛组委会
中国虚拟现实大赛指导委员会
承办单位
VR中国
中国计算机学会(相城)元宇宙产业智库
协办单位
虚拟现实技术与系统全国重点实验室(北京航空航天大学)
计算机辅助设计与图形学国家重点实验室(浙江大学)
联系方式
历届会议
移动端
在手机上打开
小程序
打开微信小程序
客服
扫码或点此咨询