基于Openvino的3D目标跟踪
  PQk91bsPuHB5 2023年11月22日 19 0

1、模型介绍

Qt-3Dt是一种3d跟踪网络,可以将图像分成不同的语义区域。它由Cambridge大学的研究人员开发,旨在解决计算机视觉中的语义分割问题。具有轻量级、快速、准确的特点,广泛应用于自动驾驶、医学图像分析、遥感图像分析等领域。

模型结构如下所示:

基于Openvino的3D目标跟踪_数据集

2、工作概述

我在开发工程中,分别进行了:数据处理,模型构建,模型训练,模型微调,模型测试。在每一个步骤中我都获得了莫大的收获。

数据预处理:将Cityscapes数据集转换为qt-3dt所需的格式,包括图像和标注。

模型训练:使用qt-3dt框架对预处理后的数据集进行训练,以获得适合于Cityscapes数据集的语义分割模型。部分训练日志如下所示: 

UserWarning: downsample module has been moved to the pool module.

  warnings.warn("downsample module has been moved to the pool module.")

...............................................................................................................................................................................................................................................................................................................................................................................Epoch 1/100 

 14/367 [>.............................] - ETA: 889s - loss: 2.4858 - acc: 0.0782

一开始效果不好,关键是池化层,最终添加核心池化层之后效果变好。池化层定义在这里贴一下:

基于Openvino的3D目标跟踪_池化_02

基于Openvino的3D目标跟踪_池化_03

基于Openvino的3D目标跟踪_3d_04

模型评估:使用评估指标(如IoU)对模型进行评估,以确定其在Cityscapes数据集上的性能。

模型应用:使用训练好的模型对Cityscapes数据集中的新图像进行语义分割,以获得图像中不同区域的语义信息。

3、模型测试

在Jupyter中测试效果如下:

基于Openvino的3D目标跟踪_池化_05

4、收获总结

在本次比赛中,我将qt-3dt用于了Cityscapes数据集进行测试,效果较好。我在本次学习中,掌握了qt-3dt的构建以及训练方法,对于相关的模型架构也有了更深的理解。

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月22日 0

暂无评论

推荐阅读
PQk91bsPuHB5