当前位置: 附加器 >> 附加器优势 >> 一文带你了解机器人是如何通过视觉实现目标
Abstract
视觉跟踪技术是计算机视觉领域(人工智能分支)的一个重要课题,有着重要的研究意义。在军事制导、视频监控、机器人视觉导航、人机交互、以及医疗诊断等许多方面有着广泛的应用前景。随着研究人员不断地深入研究,视觉目标跟踪在近十几年里有了突破性的进展,使得视觉跟踪算法不仅仅局限于传统的机器学习方法,更是结合了近些年人工智能热潮—深度学习(神经网络)和相关滤波器等方法。本文主要介绍以下几点:什么是视觉目标跟踪(单目标跟踪)、单目标跟踪的基本结构(框架),目标跟踪存在的挑战,目标跟踪经典相关方法及研究趋势等。
01单目标跟踪任务简介
目标跟踪是计算机视觉领域的一个重要问题,目前广泛应用在体育赛事转播、安防监控和无人机、无人车、机器人等领域。下面是一些应用的例子。
车辆跟踪
足球比赛
田径比赛
视觉目标(单目标)跟踪是指对图像序列中的运动目标进行检测、提取、识别和跟踪,获得运动目标的运动参数,如位置、速度、加速度和运动轨迹等,从而进行下一步的处理与分析,实现对运动目标的行为理解,以完成更高一级的检测任务。
其具体任务即根据所跟踪的视频序列给定初始帧(第一帧)的目标状态(位置、尺度),预测后续帧中该目标状态。基本结构(框架)如下:
基本流程:输入初始帧并指定期望跟踪的目标,通常用矩形框标定(InputFrame),在下一帧中产生众多候选框(MotionModel)并提取这些候选框的特征(FeatureExtractor),观测模型(ObservationModel)对这些候选框评分。最后在这些评分中找一个得分最高的候选框作为预测的目标(PredictionA),或者对多个预测值进行融合(Ensemble)得到更优的预测目标。至此算法完成了根据第一帧的信息对第二帧的预测,后续帧以此类推,同时根据指定规则更新模型(ModelUpdater)。
根据如上的框架,将目标跟踪划分为五项主要的研究内容,流程图下图所示:
流程图
运动模型(MotionModel):如何产生众多的候选样本。
特征提取(FeatureExtractor):利用何种特征表示目标。
观测模型(ObserveModel):如何对众多候选样本评分。
模型更新(ModelUpdater):如何更新观测模型使其适应目标的变化。
集成方法(Ensemble):如何融合多个决策获得一个更有的决策结构。
下图的总结可以帮助更好的理解目标跟踪算法是如何完成跟踪任务的。
跟踪任务流程
02目标跟踪算法分类
大多数的跟踪方法主要集中对观测模型的设计,根据观测模型的不同可分为两类:生成式模型(GenerativeModel)和判别式模型(DiscriminativeModel)。
生成式模型:通过提取目标特征来构建表观模型,然后在图像中搜索与模型最匹配的区域作为跟踪结果。不论采用全局特征还是局部特征,生成式模型的本质是在目标表示的高维空间中,找到与目标模型最相邻的候选目标作为当前估计。此类方法的缺陷在于只
转载请注明:http://www.aideyishus.com/lkgx/420.html