(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210580471.9
(22)申请日 2022.05.25
(71)申请人 商汤人工智能研究中心 (深圳) 有限
公司
地址 518057 广东省深圳市福田区福保街
道福保社区桃花路与 槟榔道交汇处西
北深九科技创业园3号楼702
(72)发明人 郑清源 何智群 朱烽
(74)专利代理 机构 北京派特恩知识产权代理有
限公司 1 1270
专利代理师 王花丽 徐川
(51)Int.Cl.
G06V 10/774(2022.01)
G06V 10/762(2022.01)
G06V 10/74(2022.01)G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
模型训练方法、 对象重识别方法、 装置、 设备
及介质
(57)摘要
本公开实施例公开了一种模 型训练方法、 对
象重识别方法、 装置、 设备及介质。 所述方法包
括: 对无标注的第一图像集中的图像进行目标检
测, 得到对应图像的检测结果; 基于所述第一图
像集中各图像的检测结果, 对各所述图像中的目
标对象进行聚类, 生成对应图像中目标对象 的伪
标签; 基于带有所述伪标签的第一图像集对第一
深度学习模型进行训练, 得到第二深度学习模
型; 利用有标注的第二图像集对 所述第二深度学
习模型进行训练, 得到第三深度学习模型。 通过
该方法, 能训练获得准确率更高的模型。
权利要求书3页 说明书14页 附图4页
CN 114821243 A
2022.07.29
CN 114821243 A
1.一种模型训练方法, 其特 征在于, 所述方法包括:
对无标注的第一图像集中的图像进行目标检测, 得到对应图像的检测结果;
基于所述第一图像集中各图像的检测结果, 对各所述图像中的目标对象进行聚类, 生
成对应图像中目标对象的伪标签;
基于带有所述伪标签的第 一图像集对第 一深度学习 模型进行训练, 得到第 二深度学习
模型;
利用有标注的第二图像集对所述第二深度学习模型进行训练, 得到第三深度学习模
型。
2.根据权利要求1所述的方法, 其特征在于, 所述对各所述图像中的目标对象进行聚
类, 生成对应图像中目标对象的伪标签, 包括:
针对每一所述图像, 提取 所述图像中目标对象的特 征;
对各所述图像 中目标对象的特征进行聚类, 得到聚类结果; 其中, 所述聚类结果中包括
用于标识所述图像中目标对象的类标识;
针对各所述图像, 确定所述图像中目标对象的朝向信息;
基于每一所述图像中目标对象的朝向信 息, 对每一所述图像中目标对象的类标识进行
修正, 生成对应所述图像中目标对象的伪标签。
3.根据权利要求2所述的方法, 其特征在于, 所述基于每一所述图像中目标对象的朝向
信息, 对每一所述图像中目标对 象的类标识进行修正, 生成对应所述图像中目标对 象的伪
标签, 包括:
针对每一所述类标识, 基于同一所述类标识所标识 的各图像中目标对象的朝向信息,
确定同一所述类标识所 标识的目标对象的目标朝向信息;
基于各所述类标识所标识的目标对象的目标朝向信 息, 对每一所述图像中目标对象的
类标识进行修 正, 生成对应所述图像中目标对象的伪标签。
4.根据权利要求3所述的方法, 其特征在于, 所述对各所述图像中目标对象的特征进行
聚类, 得到聚类结果, 包括:
对各所述图像 中目标对象的特征进行第一 聚类, 得到第 一聚类结果; 其中, 所述第一 聚
类结果中包括用于标识所述图像中目标对象的第一类标识;
针对每一所述第 一类标识, 对同一所述第 一类标识所标识的图像中目标对象的特征进
行第二聚类, 得到第二聚类结果; 其中, 所述第二聚类结果中包括用于标识所述第一类标识
所标识的图像中目标对象的第二类标识;
所述基于各所述类标识所标识的目标对象的目标朝向信 息, 对每一所述图像中目标对
象的类标识进行修 正, 生成对应所述图像中目标对象的伪标签, 包括:
针对每一所述第 一类标识, 基于所述第 一类标识对应的各所述第 二类标识所标识的目
标对象的目标朝向信息, 对所述第一类标识对应的图像中目标对象的第二类标识进行修
正, 得到所述第一类标识所 标识的图像中目标对象修 正后的第二类标识;
将每一所述第 一类标识所标识的图像中目标对象修正后的第 二类标识, 作为所述图像
中目标对象的伪标签。
5.根据权利要求3或4所述的方法, 其特征在于, 所述聚类结果中包括用于标识同一所
述目标对象的类特 征;权 利 要 求 书 1/3 页
2
CN 114821243 A
2所述基于各所述类标识所标识的目标对象的目标朝向信 息, 对每一所述图像中目标对
象的类标识进行修 正, 生成对应所述图像中目标对象的伪标签, 包括:
基于各所述类标识所标识的目标对象的目标朝向信 息, 确定任意两个类标识所标识的
目标对象的合并阈值;
确定所述任意两个 类标识所 标识的目标对象的类特 征之间的相似度;
在所述任意两个类标识所标识的目标对象的类特征之间的相似度大于所述合并阈值
的情况下, 将所述任意两个 类标识所 标识的目标对象的类标识修改为同一伪标签。
6.根据权利要求5所述的方法, 其特征在于, 所述基于各所述类标识所标识的目标对象
的目标朝向信息, 确定任意两个 类标识所 标识的目标对象的合并阈值, 包括:
在所述任意两个类标识所标识的目标对象的目标朝向信 息一致的情况下, 确定第 一合
并阈值;
在所述任意两个类标识所标识的目标对象的目标朝向信 息不一致的情况下, 确定第 二
合并阈值; 其中, 所述第二 合并阈值小于所述第一 合并阈值。
7.根据权利要求3至6 中任一项所述的方法, 其特征在于, 所述针对每一所述类标识, 基
于同一所述类标识所标识的各图像中目标对象的朝向信息, 确定同一所述类标识所标识的
目标对象的目标朝向信息, 包括:
对同一所述类标识所标识的所有图像中所述目标对象的朝向信 息进行统计, 得到每一
朝向信息的统计结果;
基于每一朝向信 息的统计结果, 确定同一所述类标识所标识的目标对象的所述目标朝
向信息。
8.根据权利要求1至7中任一项所述的方法, 其特征在于, 所述第一图像集中包括至少
两个视频;
所述基于所述第一图像集中图像的检测结果, 对各所述图像中的目标对象进行聚类,
生成对应图像中目标对象的伪标签, 包括:
针对所述第 一图像集中采集信 息一致的至少两个目标视频, 基于所述至少两个目标视
频中图像的检测结果, 对所述至少 两个目标视频的各图像中的目标对 象进行聚类, 生成所
述至少两个目标视频所包括的图像中目标对象的伪标签; 其中, 所述采集信息包括: 采集时
间信息和采集 点位信息;
针对所述至少两个目标视频之外的单个视频, 基于所述单个视频中图像的检测结果,
对所述单个视频的各图像中的目标对象进 行聚类, 生成所述单个视频所包括的图像中目标
对象的伪标签;
基于所述至少两个目标视频所包括的图像中目标对象的伪标签, 以及所述单个视频所
包括的图像中目标对象的伪标签, 生成所述第一图像集的每一所述图像中目标对象的伪标
签。
9.一种对象重识别方法, 其特 征在于, 所述方法包括:
获取第三图像集以及包括检索对象的待检索图像;
利用第三深度学习模型对所述待检索图像和所述第 三图像集进行处理, 确定出所述第
三图像集中包括所述检索 对象的目标图像; 其中, 所述第三深度学习模型为通过权利要求 1
至8中任一项所述的方法训练获得的。权 利 要 求 书 2/3 页
3
CN 114821243 A
3
专利 模型训练方法、对象重识别方法、装置、设备及介质
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:32:53上传分享