专利 模型训练方法、对象重识别方法、装置、设备及介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210580471.9 (22)申请日 2022.05.25 (71)申请人商汤人工智能研究中心（深圳）有限公司地址 518057 广东省深圳市福田区福保街道福保社区桃花路与槟榔道交汇处西北深九科技创业园3号楼702 (72)发明人郑清源　何智群　朱烽　 (74)专利代理机构北京派特恩知识产权代理有限公司 1 1270 专利代理师王花丽　徐川 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/762(2022.01) G06V 10/74(2022.01)G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称模型训练方法、对象重识别方法、装置、设备及介质 (57)摘要本公开实施例公开了一种模型训练方法、对象重识别方法、装置、设备及介质。所述方法包括：对无标注的第一图像集中的图像进行目标检测，得到对应图像的检测结果；基于所述第一图像集中各图像的检测结果，对各所述图像中的目标对象进行聚类，生成对应图像中目标对象的伪标签；基于带有所述伪标签的第一图像集对第一深度学习模型进行训练，得到第二深度学习模型；利用有标注的第二图像集对所述第二深度学习模型进行训练，得到第三深度学习模型。通过该方法，能训练获得准确率更高的模型。权利要求书3页说明书14页附图4页 CN 114821243 A 2022.07.29 CN 114821243 A 1.一种模型训练方法，其特征在于，所述方法包括：对无标注的第一图像集中的图像进行目标检测，得到对应图像的检测结果；基于所述第一图像集中各图像的检测结果，对各所述图像中的目标对象进行聚类，生成对应图像中目标对象的伪标签；基于带有所述伪标签的第一图像集对第一深度学习模型进行训练，得到第二深度学习模型；利用有标注的第二图像集对所述第二深度学习模型进行训练，得到第三深度学习模型。 2.根据权利要求1所述的方法，其特征在于，所述对各所述图像中的目标对象进行聚类，生成对应图像中目标对象的伪标签，包括：针对每一所述图像，提取所述图像中目标对象的特征；对各所述图像中目标对象的特征进行聚类，得到聚类结果；其中，所述聚类结果中包括用于标识所述图像中目标对象的类标识；针对各所述图像，确定所述图像中目标对象的朝向信息；基于每一所述图像中目标对象的朝向信息，对每一所述图像中目标对象的类标识进行修正，生成对应所述图像中目标对象的伪标签。 3.根据权利要求2所述的方法，其特征在于，所述基于每一所述图像中目标对象的朝向信息，对每一所述图像中目标对象的类标识进行修正，生成对应所述图像中目标对象的伪标签，包括：针对每一所述类标识，基于同一所述类标识所标识的各图像中目标对象的朝向信息，确定同一所述类标识所标识的目标对象的目标朝向信息；基于各所述类标识所标识的目标对象的目标朝向信息，对每一所述图像中目标对象的类标识进行修正，生成对应所述图像中目标对象的伪标签。 4.根据权利要求3所述的方法，其特征在于，所述对各所述图像中目标对象的特征进行聚类，得到聚类结果，包括：对各所述图像中目标对象的特征进行第一聚类，得到第一聚类结果；其中，所述第一聚类结果中包括用于标识所述图像中目标对象的第一类标识；针对每一所述第一类标识，对同一所述第一类标识所标识的图像中目标对象的特征进行第二聚类，得到第二聚类结果；其中，所述第二聚类结果中包括用于标识所述第一类标识所标识的图像中目标对象的第二类标识；所述基于各所述类标识所标识的目标对象的目标朝向信息，对每一所述图像中目标对象的类标识进行修正，生成对应所述图像中目标对象的伪标签，包括：针对每一所述第一类标识，基于所述第一类标识对应的各所述第二类标识所标识的目标对象的目标朝向信息，对所述第一类标识对应的图像中目标对象的第二类标识进行修正，得到所述第一类标识所标识的图像中目标对象修正后的第二类标识；将每一所述第一类标识所标识的图像中目标对象修正后的第二类标识，作为所述图像中目标对象的伪标签。 5.根据权利要求3或4所述的方法，其特征在于，所述聚类结果中包括用于标识同一所述目标对象的类特征；权　利　要　求　书 1/3 页 2 CN 114821243 A 2所述基于各所述类标识所标识的目标对象的目标朝向信息，对每一所述图像中目标对象的类标识进行修正，生成对应所述图像中目标对象的伪标签，包括：基于各所述类标识所标识的目标对象的目标朝向信息，确定任意两个类标识所标识的目标对象的合并阈值；确定所述任意两个类标识所标识的目标对象的类特征之间的相似度；在所述任意两个类标识所标识的目标对象的类特征之间的相似度大于所述合并阈值的情况下，将所述任意两个类标识所标识的目标对象的类标识修改为同一伪标签。 6.根据权利要求5所述的方法，其特征在于，所述基于各所述类标识所标识的目标对象的目标朝向信息，确定任意两个类标识所标识的目标对象的合并阈值，包括：在所述任意两个类标识所标识的目标对象的目标朝向信息一致的情况下，确定第一合并阈值；在所述任意两个类标识所标识的目标对象的目标朝向信息不一致的情况下，确定第二合并阈值；其中，所述第二合并阈值小于所述第一合并阈值。 7.根据权利要求3至6 中任一项所述的方法，其特征在于，所述针对每一所述类标识，基于同一所述类标识所标识的各图像中目标对象的朝向信息，确定同一所述类标识所标识的目标对象的目标朝向信息，包括：对同一所述类标识所标识的所有图像中所述目标对象的朝向信息进行统计，得到每一朝向信息的统计结果；基于每一朝向信息的统计结果，确定同一所述类标识所标识的目标对象的所述目标朝向信息。 8.根据权利要求1至7中任一项所述的方法，其特征在于，所述第一图像集中包括至少两个视频；所述基于所述第一图像集中图像的检测结果，对各所述图像中的目标对象进行聚类，生成对应图像中目标对象的伪标签，包括：针对所述第一图像集中采集信息一致的至少两个目标视频，基于所述至少两个目标视频中图像的检测结果，对所述至少两个目标视频的各图像中的目标对象进行聚类，生成所述至少两个目标视频所包括的图像中目标对象的伪标签；其中，所述采集信息包括：采集时间信息和采集点位信息；针对所述至少两个目标视频之外的单个视频，基于所述单个视频中图像的检测结果，对所述单个视频的各图像中的目标对象进行聚类，生成所述单个视频所包括的图像中目标对象的伪标签；基于所述至少两个目标视频所包括的图像中目标对象的伪标签，以及所述单个视频所包括的图像中目标对象的伪标签，生成所述第一图像集的每一所述图像中目标对象的伪标签。 9.一种对象重识别方法，其特征在于，所述方法包括：获取第三图像集以及包括检索对象的待检索图像；利用第三深度学习模型对所述待检索图像和所述第三图像集进行处理，确定出所述第三图像集中包括所述检索对象的目标图像；其中，所述第三深度学习模型为通过权利要求 1 至8中任一项所述的方法训练获得的。权　利　要　求　书 2/3 页 3 CN 114821243 A 3

专利 模型训练方法、对象重识别方法、装置、设备及介质

专利模型训练方法、对象重识别方法、装置、设备及介质