专利 确定相似图像的方法、训练方法、信息确定方法及设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210818051.X (22)申请日 2022.07.12 (71)申请人北京百度网讯科技有限公司地址 100085 北京市海淀区上地十街10号百度大厦2层 (72)发明人倪子涵　安容巧　孙逸鹏　姚锟　 (74)专利代理机构中科专利商标代理有限责任公司 11021 专利代理师杨静 (51)Int.Cl. G06V 10/74(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01) G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称确定相似图像的方法、训练方法、信息确定方法及设备 (57)摘要本公开提供了确定相似图像的方法、训练方法、信息确定方法及设备，涉及人工智能技术领域，尤其涉及大数据、深度学习技术领域。具体实现方案为：获取待比对图像，待比对图像包括：第一图像和第二图像；对待比对图像进行全局特征提取，得到待比对图像中目标区域对应的目标全局特征；以及根据第一图像中第一区域的第一全局特征和第二图像中第二区域的第二全局特征，确定第一图像和第二图像之间的相似性比较结果；其中，第一区域的类别与第二区域的类别相同，目标全局特征包括：第一全局特征和第二全局特征，目标区域包括：第一区域和第二区域。权利要求书5页说明书16页附图8页 CN 115205555 A 2022.10.18 CN 115205555 A 1.一种确定相似图像的方法，包括：获取待比对图像，所述待比对图像包括：第一图像和第二图像；对所述待比对图像进行全局特征提取，得到所述待比对图像中目标区域对应的目标全局特征；以及根据所述第一图像中第一区域的第一全局特征和所述第二图像中第二区域的第二全局特征，确定所述第一图像和所述第二图像之间的相似性比较结果；其中，所述第一区域的类别与所述第二区域的类别相同，所述目标全局特征包括：所述第一全局特征和所述第二全局特征，所述目标区域包括：所述第一区域和所述第二区域。 2.根据权利要求1所述的方法，其中，所述对所述待比对图像进行全局特征提取，得到所述待比对图像中目标区域对应的目标全局特征，包括：对所述待比对图像进行目标检测，得到所述目标区域对应的目标检测结果，所述目标检测结果包括：用于确定目标位置的检测框信息和用于确定目标分类的类别信息；对所述待比对图像进行特征提取，得到特征图信息；以及根据所述检测框信息、所述类别信息和所述特征图信息，确定所述目标全局特征。 3.根据权利要求2所述的方法，其中，所述根据所述检测框信息、所述类别信息和所述特征图信息，确定所述目标全局特征，包括：根据所述检测框信息，确定所述检测框信息表征的检测框对应的中心点信息；根据所述特征图信息和所述中心点信息，确定所述中心点信息表征的像素对应的特征向量；以及根据所述特征向量，确定所述目标全局特征。 4.根据权利要求1所述的方法，其中，所述根据所述第一图像中第一区域的第一全局特征和所述第二图像中第二区域的第二全局特征，确定所述第一图像和所述第二图像之间的相似性比较结果，包括：对所述第一图像和所述第二图像进行局部特征提取，分别得到第一局部特征集和第二局部特征集，所述第一局部特征集包括所述第一图像中像素对应的第一局部特征，所述第二局部特征集包括所述第二图像中像素对应的第二局部特征；对所述第一局部特征和所述第二局部特征进行特征匹配，得到特征匹配对；以及根据所述第一全局特征、所述第二全局特征和所述特征匹配对中的至少一个特征，确定所述相似性比较结果。 5.根据权利要求4所述的方法，其中，所述根据所述第一全局特征、所述第二全局特征和所述特征匹配对中的至少一个特征，确定所述相似性比较结果，包括：响应于确定所述特征匹配对的数量大于或等于第一预设阈值，确定所述第一图像和所述第二图像为相似图像。 6.根据权利要求5所述的方法，其中，所述根据所述第一全局特征、所述第二全局特征和所述特征匹配对中的至少一个特征，确定所述相似性比较结果，还包括：响应于确定所述数量小于所述第一预设阈值，确定所述第一区域和所述第二区域均对应的第二预设阈值；以及响应于确定所述第一全局特征和所述第二全局特征之间的相似度大于或等于所述第二预设阈值，确定所述第一图像和所述第二图像为相似图像。权　利　要　求　书 1/5 页 2 CN 115205555 A 27.根据权利要求1 ‑6中任一项所述的方法，其中，所述目标区域包括以下至少一项：与实体对象相关的区域、与背景相关的区域。 8.一种深度学习模型的训练方法，其中，所述深度学习模型包括目标检测模块和对比模块；所述方法包括：将样本图像输入所述目标检测模块，得到所述样本图像中预测目标区域对应的预测目标检测结果，其中，所述预测目标检测结果包括：预测检测框信息、预测区域类别信息和预测置信度信息，所述样本图像具有检测框标签、区域类别标签和置信度标签；将所述样本图像输入所述对比模块，得到所述预测目标区域对应的预测全局特征信息；以及根据所述检测框标签、所述区域类别标签、所述置信度标签、所述预测检测框信息、所述预测区域类别信息、所述预测置信度信息和所述预测全局特征信息，训练所述深度学习模型，得到经训练的深度学习模型。 9.根据权利要求8所述的方法，其中，所述根据所述检测框标签、所述区域类别标签、所述置信度标签、所述预测检测框信息、所述预测区域类别信息、所述预测置信度信息和所述预测全局特征信息，训练所述深度学习模型包括：根据所述检测框标签、所述区域类别标签、所述置信度标签、所述预测检测框信息、所述预测区域类别信息和所述预测置信度信息，得到第一损失值；根据所述检测框标签、所述区域类别标签和所述预测全局特征信息，确定正样本对信息和负样本对信息中的至少一个样本对信息；根据所述正样本对信息和所述负样本对信息中的至少一个样本对信息，得到第二损失值；以及根据所述第一损失值和所述第二损失值，对所述深度学习模型的参数进行调整。 10.根据权利要求9所述的方法，其中，所述样本图像包括第一样本子图像、第二样本子图像和第三样本子图像，其中第二样本子图像是通过对所述第一样本子图像进行数据增强得到的；所述根据所述检测框标签、所述区域类别标签和所述预测全局特征信息，确定正样本对信息和负样本对信息中的至少一个样本对信息包括以下至少一项：将所述第一样本子图像中第三区域对应的预测全局特征信息和所述第一样本子图像中第四区域对应的预测全局特征信息确定为所述负样本对信息，所述第三区域对应的区域类别标签与所述第四区域对应的区域类别标签不同；将所述第一样本子图像中第三区域对应的预测全局特征信息和所述第二样本子图像中第五区域对应的预测全局特征信息确定为所述正样本对信息，所述第三区域对应的区域类别标签与所述第五区域对应的区域类别标签相同；以及将所述第一样本子图像中第三区域对应的预测全局特征信息和所述第三样本子图像中第六区域对应的预测全局特征信息确定为所述负样本对信息。 11.一种对象信息确定方法，包括：获取针对目标对象采集到的多个目标图像；利用如权利要求1 ‑7中任一项所述的确定相似图像的方法，确定所述多个目标图像中的目标相似图像；以及根据所述目标相似图像，确定与所述目标相似图像相关的目标对象的对象信息。权　利　要　求　书 2/5 页 3 CN 115205555 A 3

专利 确定相似图像的方法、训练方法、信息确定方法及设备

专利确定相似图像的方法、训练方法、信息确定方法及设备