中文题名: |
智能汽车的多相机行人检测与跟踪方法研究 |
姓名: | |
学号: | 1049732004322 |
保密级别: | 公开 |
论文语种: | chi |
学科代码: | 085206 |
学科名称: | 工学 - 工程 - 动力工程 |
学生类型: | 硕士 |
学校: | 武汉理工大学 |
院系: | |
专业: | |
研究方向: | 智能网联汽车 |
第一导师姓名: | |
第一导师院系: | |
完成日期: | 2023-03-27 |
答辩日期: | 2023-05-21 |
中文关键词: | |
中文摘要: |
智能汽车的发展是主要趋势,其所处的交通运输环境很复杂,其中存在着多样性的参与者以及难以预计的突发状况,如何从容应对这样的环境是一项很有必要的研究课题。对于智能汽车来说,接触世界与理解世界是最为基础的能力,它的决策和行为都要依赖于此,而构建这样能力的基石是视觉感知技术,目标的检测与跟踪是该技术的关键环节。得益于硬件设备的堆料,智能汽车配备了多个相机,但是,如何协同多个相机处理复杂视角的场景成为一个新的问题。所以,本文将以多相机协同匹配的检测与跟踪作为研究目标,以交通环境中复杂多变的行人目标作为研究对象,从底层的检测与跟踪任务出发,逐步开展研究,主要的研究内容有: (1)针对目标检测与目标跟踪任务不一致的问题,本文构建特征深度聚合主干特征提取网络,在保证整体工作效率的情况下,提升网络模型的性能。首先,理论分析检测与跟踪任务各自的特性,检测需要多尺度的融合特征,跟踪则更需要低维的外观特征;其次,从主干网络深度与宽度的平衡出发,融合使用残差结构、深度聚合架构和特征分组注意结构来构建主干网络;最后,利用简单的检测模块在复杂人群数据集上进行测试,验证主干网络模型有效性,同时训练和推理可为后续检测与跟踪环节奠定模型基础。 (2)针对多任务学习中存在难以取得平衡的问题,通过多目标优化的方法,兼顾了本文所需多个特征的学习能力,保证了网络模型学习的有效进行。首先,分析现有的跟踪方法,联合多任务学习的跟踪在速度与精度两方面都表现良好;其次,考虑到后续跟踪所需要的重识别的特征表示与主流检测锚框的特征表示的差异,采用关键点的形式进行目标特征的表达,并在检测分支和特征分支后使用多目标优化的损失进行联合训练;最后,为学习到更为泛化性的特征,组合重识别、检测和跟踪三个领域的经典数据集,进行模型的训练与推理,目标id的分类指标表明网络模型学习到了有效的特征表达。 (3)针对多个相机存在视角差异、环境要素复杂的问题,构建动态图来链接多个相机的局部跟踪轨迹,使多相机能够更好地协调配合。首先,分析现有的关联匹配方法,采用图节点表示的方法效率表现较好;其次,考虑到每个节点的差异,引入动态图和注意力机制进行节点特征的建模,得到预测模型;最后,使用重识别领域的数据集,专门验证不同视角的目标id的识别能力,以此为后续环节中不同相机的交接打下基础。 (4)为验证实际的整体工作流程,在使用交通实景的数据集上进行验证。首先,针对本文多视角的2D图像数据需求,调用nuScenes 3D目标跟踪数据集中符合条件的部分数据;最后,测试验证的结果表明,本文方法能够较好地应对目标遮挡和目标交接等问题,成功地维护了目标的轨迹id等信息,在单相机的局部跟踪和多相机的全局跟踪都得到了较好性能提升。 |
参考文献: |
[19] Kiani H, Sim T, Lucey S. Multi-channel correlation filters[C]//ICCV. 2013, 4: 5. [30] Zhou X, Wang D, Krähenbühl P. Objects as points[J]. arXiv preprint arXiv:1904.07850, 2019. [32] 龚轩,乐孜纯,王慧,武玉坤.多目标跟踪中的数据关联技术综述[J].计算机科学,2020,47(10):136-144. [34] 赵才荣,齐鼎,窦曙光,涂远鹏,孙添力,柏松,蒋忻洋,白翔,苗夺谦.智能视频监控关键技术:行人再识别研究综述[J].中国科学:信息科学,2021,51(12):1979-2015. |
中图分类号: | TK05 |
条码号: | 002000070906 |
馆藏号: | TD10058241 |
馆藏位置: | 403 |
备注: | 403-西院分馆博硕论文库;203-余家头分馆博硕论文库 |