(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210818051.X
(22)申请日 2022.07.12
(71)申请人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号
百度大厦2层
(72)发明人 倪子涵 安容巧 孙逸鹏 姚锟
(74)专利代理 机构 中科专利商标代理有限责任
公司 11021
专利代理师 杨静
(51)Int.Cl.
G06V 10/74(2022.01)
G06V 10/774(2022.01)
G06V 10/82(2022.01)
G06N 3/08(2006.01)
G06N 3/04(2006.01)
(54)发明名称
确定相似图像的方法、 训练方法、 信息确定
方法及设备
(57)摘要
本公开提供了确定相似图像的方法、 训练方
法、 信息确定方法及设备, 涉及人工智 能技术领
域, 尤其涉及大数据、 深度学习技术领域。 具体实
现方案为: 获取待比对图像, 待比对图像包括: 第
一图像和第二图像; 对待比对图像进行全局特征
提取, 得到待比对图像中目标区域对应的目标全
局特征; 以及根据第一图像中第一区域的第一全
局特征和第二图像中第二区域的第二全局特征,
确定第一图像和第二图像之间的相似性比较结
果; 其中, 第一区域的类别与第二区域的类别相
同, 目标全局特征包括: 第一全局特征和第二全
局特征, 目标区域包括: 第一区域和第二区域。
权利要求书5页 说明书16页 附图8页
CN 115205555 A
2022.10.18
CN 115205555 A
1.一种确定相似图像的方法, 包括:
获取待比对图像, 所述待比对图像包括: 第一图像和第二图像;
对所述待比对图像进行全局特征提取, 得到所述待比对图像中目标区域对应的目标全
局特征; 以及
根据所述第一图像中第一区域的第一全局特征和所述第二图像中第二区域的第二全
局特征, 确定所述第一图像和所述第二图像之间的相似性比较结果;
其中, 所述第 一区域的类别与 所述第二区域的类别相同, 所述目标全局特征包括: 所述
第一全局特 征和所述第二全局特 征, 所述目标区域包括: 所述第一区域和所述第二区域。
2.根据权利要求1所述的方法, 其中, 所述对所述待比对图像进行全局特征提取, 得到
所述待比对图像中目标区域对应的目标全局特 征, 包括:
对所述待比对图像进行目标检测, 得到所述目标区域对应的目标检测结果, 所述目标
检测结果包括: 用于确定目标位置的检测框信息和用于确定目标分类的类别 信息;
对所述待比对图像进行 特征提取, 得到特 征图信息; 以及
根据所述检测框信息、 所述类别 信息和所述特 征图信息, 确定所述目标全局特 征。
3.根据权利要求2所述的方法, 其中, 所述根据所述检测框信息、 所述类别信息和所述
特征图信息, 确定所述目标全局特 征, 包括:
根据所述检测框信息, 确定所述检测框信息表征的检测框对应的中心点信息;
根据所述特征图信 息和所述中心点信 息, 确定所述中心点信 息表征的像素对应的特征
向量; 以及
根据所述特 征向量, 确定所述目标全局特 征。
4.根据权利要求1所述的方法, 其中, 所述根据所述第 一图像中第 一区域的第 一全局特
征和所述第二图像中第二区域的第二全局特征, 确定所述第一图像和所述第二图像之 间的
相似性比较结果, 包括:
对所述第一图像和所述第 二图像进行局部特征提取, 分别得到第 一局部特征集和第 二
局部特征集, 所述第一局部特征集包括所述第一图像中像素对应的第一局部特征, 所述第
二局部特 征集包括所述第二图像中像素对应的第二局部特 征;
对所述第一局部特 征和所述第二局部特 征进行特征匹配, 得到特 征匹配对; 以及
根据所述第一全局特征、 所述第二全局特征和所述特征匹配对中的至少一个特征, 确
定所述相似性比较结果。
5.根据权利要求4所述的方法, 其中, 所述根据所述第一全局特征、 所述第二全局特征
和所述特 征匹配对中的至少一个特 征, 确定所述相似性比较结果, 包括:
响应于确定所述特征匹配对的数量大于或等于第 一预设阈值, 确定所述第 一图像和所
述第二图像为相似图像。
6.根据权利要求5所述的方法, 其中, 所述根据所述第一全局特征、 所述第二全局特征
和所述特 征匹配对中的至少一个特 征, 确定所述相似性比较结果, 还 包括:
响应于确定所述数量小于所述第 一预设阈值, 确定所述第 一区域和所述第 二区域均对
应的第二预设阈值; 以及
响应于确定所述第一全局特征和所述第二全局特征之间的相似度大于或等于所述第
二预设阈值, 确定所述第一图像和所述第二图像为相似图像。权 利 要 求 书 1/5 页
2
CN 115205555 A
27.根据权利要求1 ‑6中任一项所述的方法, 其中, 所述目标区域包括以下至少一项: 与
实体对象相关的区域、 与背景相关的区域。
8.一种深度学习模型的训练方法, 其中, 所述深度学习模型包括目标检测模块和对比
模块; 所述方法包括:
将样本图像输入所述目标检测模块, 得到所述样本图像中预测目标区域对应的预测目
标检测结果, 其中, 所述预测目标检测结果包括: 预测检测框信息、 预测区域类别信息和预
测置信度信息, 所述样本图像具有检测框标签、 区域类别标签和置信度标签;
将所述样本图像输入所述对比模块, 得到所述预测目标区域对应的预测全局特征信
息; 以及
根据所述检测框标签、 所述区域类别标签、 所述置信度标签、 所述预测检测框信息、 所
述预测区域类别信息、 所述预测置信度信息和所述预测全局特征信息, 训练所述深度学习
模型, 得到经训练的深度学习模型。
9.根据权利要求8所述的方法, 其中, 所述根据 所述检测框标签、 所述区域类别标签、 所
述置信度标签、 所述预测检测框信息、 所述预测区域类别信息、 所述预测置信度信息和所述
预测全局特 征信息, 训练所述深度学习模型包括:
根据所述检测框标签、 所述区域类别标签、 所述置信度标签、 所述预测检测框信息、 所
述预测区域类别 信息和所述预测置信度信息, 得到第一损失值;
根据所述检测框标签、 所述区域类别标签和所述预测全局特征信息, 确定正样本对信
息和负样本对信息中的至少一个样本对信息;
根据所述正样本对信 息和所述负样本对信 息中的至少一个样本对信 息, 得到第 二损失
值; 以及
根据所述第一损失值和所述第二损失值, 对所述深度学习模型的参数进行调整。
10.根据权利要求9所述的方法, 其中, 所述样本图像包括第 一样本子图像、 第 二样本子
图像和第三样本子图像, 其中第二样本子图像是通过对所述第一样本子图像进行数据增强
得到的; 所述根据所述检测框标签、 所述区域类别标签和所述预测全局特征信息, 确定正样
本对信息和负 样本对信息中的至少一个样本对信息包括以下至少一项:
将所述第一样本子图像中第三区域对应的预测全局特征信息和所述第一样本子图像
中第四区域对应的预测全局特征信息确定为所述负样本对信息, 所述第三区域对应的区域
类别标签与所述第四区域对应的区域类别标签不同;
将所述第一样本子图像中第三区域对应的预测全局特征信息和所述第二样本子图像
中第五区域对应的预测全局特征信息确定为所述正样本对信息, 所述第三区域对应的区域
类别标签与所述第五区域对应的区域类别标签相同; 以及
将所述第一样本子图像中第三区域对应的预测全局特征信息和所述第三样本子图像
中第六区域对应的预测全局特 征信息确定为所述负 样本对信息 。
11.一种对象信息确定方法, 包括:
获取针对目标对象采集到的多个目标图像;
利用如权利要求1 ‑7中任一项所述的确定相似图像的方法, 确定所述多个目标图像中
的目标相似图像; 以及
根据所述目标相似图像, 确定与所述目标相似图像相关的目标对象的对象信息 。权 利 要 求 书 2/5 页
3
CN 115205555 A
3
专利 确定相似图像的方法、训练方法、信息确定方法及设备
文档预览
中文文档
30 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:32:08上传分享