查看论文信息

中文题名：	基于多尺度与多分层架构图像特征提取与目标识别研究
姓名：	孙亚东
学号：	10497110261
保密级别：	公开
论文语种：	chi
学科代码：	081002
学科名称：	信号与信息处理
学生类型：	博士
学位：	工学博士
学校：	武汉理工大学
院系：	信息工程学院
专业：	信息与通信工程
研究方向：	多媒体信号处理与信息传输理论与技术
第一导师姓名：	杨杰
第一导师院系：	武汉理工大学
完成日期：	2014-10-10
答辩日期：	2014-12-15
中文关键词：	图像目标识别 ; 手工设计特征提取 ; 自然特征学习 ; 组件模型 ; 深度学习
中文摘要：	︿伴随着大数据时代的到来，图像与视频数据的快速增长，实现计算机自动理解图像或视频内容成为越来越迫切的需求，图像目标识别作为图像理解的重要研究内容得到了广泛关注，已成为当前图像处理、计算机视觉等领域一个重要研究方向。图像目标识别在模式识别的许多领域有着广泛应用，如基于内容的智能安全监控、目标图像检索、人机交互、及遥感图像分析等等。经过多年的发展，尽管图像目标识别研究已取得许多令人鼓舞的成绩，但由于目标识别问题自身的多样性和复杂性，它仍然是一个极具挑战性的课题。本文紧紧围绕图像目标识别及应用这一主题，重点研究了手工设计特征及自然特征的提取方法在图像目标识别中的相关关键技术、基于手工设计特征建模的多尺度混合高斯组件模型识别方法及应用、基于自然特征建模的多层去噪受限玻尔兹曼机模型及相关应用等内容。本文开展的主要研究工作和取得的成果有以下几方面：（1）针对单一利用手工特征在实际应用中存在类型单一、尺度受限等诸多不足，根据图像的类型、特征尺度及特征数量的多样性，提出了多种特征融合检测的方法，并对多种手工特征提取方法融合检测的互补性进行了分析和比较。多特征融合检测根据场景类型的特点，突出了特征匹配过程中所提取特征性能的相互补充的优势，该方法可以弥补目标匹配过程中，图像场景存在的视角变化、尺度变化、缩放、旋转、图像模糊、图像压缩及光线变化对特征匹配的影响。通过标准图像数据库验证了多特征融合检测方法对尺度、缩放、旋转变化具有较强的不变性，且对光线及模糊变化具有一定的鲁棒性。（2）针对传统的组件模型对目标各组件间的空间位置关系缺乏有效地估计的不足，提出了基于多尺度结构的混合高斯组件模型的目标识别方法。该方法利用多个混合高斯模型对能够反映目标形状和外观分布特征的组件在多尺度空间内，对目标的多个方向获取的图像进行建模。通过样本的训练及参数学习，获得混合组件模型参数，进而获取优化目标的分布特征。为了提高算法识别的鲁棒性，模型采用了融合特征高斯尺度金字塔方法，并将根滤波器（父节点）及组件滤波器（子节点）位置作为潜在的隐藏变量，运用混合高斯模型对模型组件最佳位置进行估计，最后利用潜变量支持向量机分类算法进行有监督训练，获取模型参数。通过标准数据库验证了所提方法能够提升图像目标识别的性能。（3）针对目前已有的跟踪识别技术存在的识别目标类别单一，鲁棒性不强、不能适应复杂背景的不足，本文基于混合高斯组件模型基础上，提出了一种多类运动目标跟踪与识别方法。该方法融合运动区域的自动提取机制实现前景运动区域自动提取功能，进而可以精确地定位感兴趣目标的位置。该方法特点是能够实现多类运动目标自动检测和识别，并对视频中相应类目标个数进行记数。检测实验结果证明了该方法能够适应各种不同的复杂的室外环境，是一种有效地的多类运动目标跟踪与识别方法。（4）针对现有特征提取方法难以实现从含有复杂背景的图像中提取有用目标特征的瓶颈问题，提出了一种基于弱监督学习的深度学习模型，去噪受限玻尔兹曼机模型。该模型利用多模交互机制，对输入图像的每个像素建立一个混合结构的二元受限玻尔兹曼机层次模型。为了获取具有鲁棒性和简洁性的目标特征，层次模型在输入层每个节点引入一个二值转换单元，通过该转换单元，使模型在样本训练的过程中以多模交互方式，控制隐藏层两组单元独立的获取各自的前景目标特征和背景干扰特征。通过标准图像数据库的实验证明了所提模型从复杂的背景干扰中提取的目标特征具有更佳的简洁性、良好的泛化性和优异的判别性能。﹀
中图分类号：	TP391.41
馆藏号：	TP391.41/B261/2014
备注：	403-西院分馆博硕论文库；203-余家头分馆博硕论文库

附件下载