(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210812252.9
(22)申请日 2022.07.11
(71)申请人 影石创新科技股份有限公司
地址 518100 广东省深圳市宝安区新 安街
道海旺社区兴业路1100号金利通金融
中心大厦2栋1 101,1102,1103
(72)发明人 张伟俊
(74)专利代理 机构 北京汇思诚业知识产权代理
有限公司 1 1444
专利代理师 王莹辉
(51)Int.Cl.
G06V 10/74(2022.01)
G06V 10/764(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
目标跟踪方法、 装置、 设备以及存 储介质
(57)摘要
本发明实施例提出了一种目标跟踪 方法、 装
置、 设备以及存储介质, 涉及计算机视觉技术领
域; 能够准确追踪到特定视觉目标不受同类别视
觉目标干扰。 所述方法执行对当前图像进行目标
跟踪过程包括: 获得视频中待跟踪视觉目标的物
体类型; 对当前图像进行目标检测, 获得类别与
所述物体类型相同的多个候选视觉目标; 获得在
所述当前图像之前的至少一帧中确定为所述待
跟踪视觉目标的图像区域作为跟踪视觉目标样
本, 以及除所述跟踪视觉目标样 本之外类别与所
述物体类型相同的干扰视觉目标样 本; 根据所述
多个候选视觉目标分别与所述跟踪视觉目标样
本和所述干扰视觉目标样本的相似度, 在所述多
个候选视觉目标中确定所述待跟踪视 觉目标。
权利要求书3页 说明书14页 附图2页
CN 115393616 A
2022.11.25
CN 115393616 A
1.一种目标跟踪方法, 其特 征在于, 包括:
获得视频中待跟踪视 觉目标的物体 类型;
对当前图像进行目标检测, 获得类别与所述物体类型相同的多个候选视觉目标; 其中,
所述当前图像是按照播 放视频时不同帧图像显示的顺序每隔预设帧数提取的当前帧;
获得在所述当前图像之前的至少一帧图像中确定为所述待跟踪视觉目标的图像区域
作为跟踪视觉目标样本, 以及除所述跟踪视觉目标样本之外类别与所述物体类型相同的干
扰视觉目标样本;
根据所述多个候选视觉目标分别与所述跟踪视觉目标样本和所述干扰视觉目标样本
的相似度, 在所述多个候选 视觉目标中确定所述待跟踪视 觉目标。
2.根据权利要求1所述的方法, 其特征在于, 获得视频中待跟踪视觉目标的物体类型,
包括:
响应操作指令, 在所述视频的标准帧图像标注用户或系统选定的视觉目标作为所述待
跟踪视觉目标;
对携带标注的所述用户或系统选定的视觉目标进行分类计算, 获得所述待跟踪视觉目
标的物体 类型。
3.根据权利要求1所述的方法, 其特征在于, 获得视频中待跟踪视觉目标的物体类型,
包括:
在所述视频的标准图像帧中, 识别并显示类别与用户输入信息关联的多个视 觉目标;
接收到对所述类别与用户输入信 息关联的多个视觉目标中任意视觉目的触发信号 时,
确定触发信号对应视觉目标为所述待跟踪视觉目标, 确定触发信号对应视觉目标的类别为
所述物体 类型。
4.根据权利要求1所述的方法, 其特征在于, 在对当前图像进行目标检测, 获得类别与
所述物体 类型相同的多个候选 视觉目标之后, 所述方法还 包括:
获得在所述当前图像之前的至少一帧图像中确定的待跟踪视觉目标所占图像区域的
面积;
当所述多个候选视觉目标中任意候选视觉目标所占图像区域与所述待跟踪视觉目标
所占图像区域的面积相差大于预设阈值, 滤除该选 视觉目标;
将所述跟踪视觉目标样本和所述干扰视觉目标样本作为参考, 在所述多个候选视觉目
标中确定所述待跟踪视 觉目标, 包括:
将所述跟踪视觉目标样本和所述干扰视觉目标样本作为参考, 在经过滤除后的至少一
个所述候选视觉目标中确定所述待跟踪视 觉目标。
5.根据权利要求1所述的方法, 其特征在于, 根据 所述多个候选视觉目标分别与所述跟
踪视觉目标样本和所述干扰视觉目标样本的相似度, 在所述多个候选视觉目标中确定所述
待跟踪视 觉目标, 包括:
依次对所述多个候选视觉目标中每个候选视觉目标, 分别计算与跟踪视觉目标样本以
及与干扰视 觉目标样本的相似性, 得到第一相似性分数和第二相似性分数;
将对应第一相似性分数和对应第二相似性分数相差程度最大的候选视觉目标作为所
述待跟踪视 觉目标。
6.根据权利要求5所述的方法, 其特征在于, 所述跟踪视觉目标样本和所述干扰视觉目权 利 要 求 书 1/3 页
2
CN 115393616 A
2标样本的数量为多个, 依 次对所述多个候选视觉目标中每个候选视觉目标, 分别计算与跟
踪视觉目标样本以及与干扰视 觉目标样本的相似性, 包括:
依次从多个候选 视觉目标中获取当前候选 视觉目标;
计算所述当前候选视觉目标与每个跟踪视觉目标样本或与每个干扰视觉目标样本的
相似性;
获取与所述候选视觉目标具有最高相似性的跟踪视觉目标样本对应相似性分数, 作为
所述第一相似性分数;
获取与所述候选视觉目标具有最高相似性的干扰视觉目标样本对应相似性分数, 作为
所述第二相似性分数。
7.根据权利要求5所述的方法, 其特征在于, 所述跟踪视觉目标样本和所述干扰视觉目
标样本的数量为多个, 依 次对所述多个候选视觉目标中每个候选视觉目标, 分别计算与跟
踪视觉目标样本以及与干扰视 觉目标样本的相似性, 包括:
依次从多个候选 视觉目标中获取当前候选 视觉目标;
依次针对每个候选视觉目标计算与多个跟踪视觉目标样本或与多个干扰视觉目标样
本的相似性;
依次针对每个候选视觉目标计算与多个跟踪视觉目标样本的平均相似性, 以及与多个
干扰视觉目标样本的平均相似性;
获取与所述多个跟踪视觉目标样本具有最高平均相似性的候选视觉目标对应平均相
似性, 作为所述第一相似性分数;
获取与所述多个干扰视觉目标样本具有最高平均相似性的候选视觉目标对应平均相
似性, 作为所述第二相似性分数。
8.根据权利要求5所述的方法, 其特征在于, 第 一相似性分数和对应第 二相似性分数相
差程度包括第一相似性分数和对应第二相似性分数的差值或第一相似性分数和对应第二
相似性分数的比值。
9.根据权利要求1所述的方法, 其特征在于, 根据 所述多个候选视觉目标分别与所述跟
踪视觉目标样本和所述干扰视觉目标样本的相似度, 在所述多个候选视觉目标中确定所述
待跟踪视 觉目标, 包括:
将所述跟踪视觉目标样本作为正样本, 所述干扰视觉目标样本作为负样本, 对预先搭
建的神经网络模型进 行多次训练, 获得从类别与所述物体类型相同的多个视觉目标中区分
出特定物体的分类 器;
将所述多个候选 视觉目标输入所述分类 器, 获得所述待跟踪视 觉目标。
10.根据权利要求1所述的方法, 其特征在于, 在第 i次执行对当前图像进行目标跟踪过
程时, 在根据所述多个候选视觉目标分别与所述跟踪视觉目标样本和所述干扰视觉目标样
本的相似度, 在所述多个候选 视觉目标中确定所述待跟踪视 觉目标之后, 还 包括:
将基于第i 次获取的所述当前图像确定为所述待跟踪视觉目标对应图像区域添加到跟
踪视觉目标样本列 表, 将除所述待跟踪视觉目标外的候选视觉目标对应视觉目标添加到干
扰视觉目标样本列表;
在第i+1次执行对当前图像进行目标跟踪过程时, 获得在所述当前图像之前的至少一
帧中确定为所述待跟踪视觉目标的图像区域作为跟踪视觉目标样本, 以及除所述跟踪视觉权 利 要 求 书 2/3 页
3
CN 115393616 A
3
专利 目标跟踪方法、装置、设备以及存储介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:32:10上传分享