摘 要:对地面车辆目标的视觉跟踪任务首要是满足实时性,其次是在复杂背景下对目标跟踪的鲁棒性。KCF算法作为经典的判别式跟踪算法,凭借其高效的跟踪器学习效率,一直作为主流的实时跟踪算法之一。其中,搜索区域的大小选取在很大程度上决定了能否生成稳定的跟踪器,然而对于不同尺寸的车辆目标,其最优的搜索区域大小通常是不同的。为此,本文以标准数据集OTB2015作为车辆目标视频源,通过分辨率降采样来模拟多组不同尺寸的目标运动场景,论证在不同距离下实现最优车辆跟踪的KCF算法参数配置,为长距离的车辆跟踪任务提供了参数依据。
关键词:KCF算法;目标跟踪;地面目标
《电子技术与软件工程》(半月刊)创刊于2012年,由中国电子学会主办。旨在全方位推广信息时代下电气、电力、电工科学意识;关注电子各专业技术以及最新科研成果和进展;介绍软件工程、科技、信息技术在社会各领域的应用,关注科技传播与公民科学文化素质的提升。
1 引言(Introduction)
目标跟踪主要应用于智能交通、路况监控、精确制导、机器人等领域[1],其任务是根据给定的初始目标位置,在接下来的视频帧中,标定出目标的位置。目标跟踪尤其是地面目标,通常处于复杂的背景环境,如光强变化、目标旋转、背景杂波、背景遮挡等,这些都给目标跟踪任务带来巨大的挑战性。对于地面车辆目标而言,考虑到目标通常处于快速运动的状态,算法的实时性更是选择跟踪算法的重要依据。
跟踪算法大致上分为生成式和判别式两类,其中生成式算法的主要思想是对目标进行建模,利用模型与下一帧的图像的搜索区域进行配准,配准度最高的即为目标区域。常用的模型有马尔可夫模型(MRF)和混合高斯模型(GMM)。不过单纯的模型构建思想并没有对目标与背景信息加以区分,所以模型精确度很受背景杂波的影响,并且算法的速度普遍没有判别式算法块。判别式算法的主要思想是将目标跟踪问题当成分类问题加以解决[2],通过构建仿射变换、循环位移、窗口平移等[3-7]方法来构建目标负样本,进而通过对正负样本的学习得到分类器(跟踪器)。分类器的学习策略决定了跟踪器的稳定与否,由于分类问题可以利用机器学习加以解决,所以基于判别式方法的跟踪算法普遍比生成式方法更加精确。
经典判别式方法MOSSE由Bolme等人[3]提出,由于利用相关运算的思想,使得分类器的学习过程可以在傅立叶域上快速地实现,从而实现300帧以上的运算速度。后续Henriques等人[5]在MOSSE的基础上提出KCF,用循环矩阵代替MOSSE的放射变换来实现训练样本的密集采样,其示意图如图1所示。目标特征也从单通道灰度特征转变为多通道的HOG特征,使得跟踪器在维持100帧以上的计算速度的同时,具有在复杂环境下更为稳定的跟踪性能。
搜索区域相对于目标尺寸的大小比例(padding),在很大程度上决定了所采取的样本的合理性。复杂环境下行驶的车辆目标通常具有大范围的尺度变换,如何对不同尺寸的车辆目标选取不同的搜索区域以获得性能优异的跟踪器,对于复杂环境下的地面车辆跟踪任务而言是很重要的。为此,本文以不同距离下的车辆作为目标,进行了KCF算法最优padding配置的实验验证。
2 KCF算法(KCF algorithm)
KCF算法是一種基于核相关滤波器的目标跟踪算法,通过对采集图像块构建循环矩阵来表征对目标及其背景进行密集采样的样本,以此构造大量训练集。KCF算法使用基于岭回归的非线性预测进行训练学习得到滤波器(分类器),利用核函数计算候选区域与目标的近似程度,选取相似度最大的区域为新的跟踪目标,并进行下一帧的检测。岭回归具有封闭解,并且KCF算法利用循环矩阵的性质通过快速傅立叶变换提高了运算速度[5]。
3 实验验证(Experimental verification)
本实验中,KCF算法使用的HOG特征包含16个bin,大小为3×3。模型学习率为0.02,正则化参数为,高斯核函数的设为0.5。针对不同距离下的目标,实验选取了不同的搜索窗口与目标尺寸的边长比值padding进行跟踪实验,以确定能稳定跟踪不同尺寸的最优padding值。实验平台为Matlab2016a,实验设备的性能参数:Intel I5 2.60GHz的CPU和8GB的RAM。