(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210604744.9
(22)申请日 2022.05.30
(71)申请人 上海商汤智能科技有限公司
地址 200233 上海市徐汇区桂平路391号3
号楼1605A室
(72)发明人 秦昊煜 刘佳恒 吴一超
(74)专利代理 机构 北京派特恩知识产权代理有
限公司 1 1270
专利代理师 李江 蒋雅洁
(51)Int.Cl.
G06V 10/774(2022.01)
G06V 10/74(2022.01)
G06V 10/764(2022.01)
G06V 10/40(2022.01)
G06V 40/16(2022.01)G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
对象识别方法、 网络的训练方法、 装置、 设备
及介质
(57)摘要
本申请实施例提供一种对象识别方法、 网络
的训练方法、 装置、 设备及介质, 其中, 该方法包
括: 获取画面包括样本对象的至少两个图像域;
基于预设误识率, 确定评估所述至少两个图像域
中所述样本对象相似度的全局 阈值和评估每一
图像域中所述样本对象相似度的局部阈值; 基于
所述全局阈值和所述每一图像域的局部阈值, 对
所述每一图像域在待训练对象识别网络中的分
类损失进行调整, 得到第一损失; 基于所述第一
损失和所述至少两个图像域的第二损失, 对所述
待训练对象识别网络的网络参数进行调整, 使 得
调整后的对象识别网络输出的损失满足预设收
敛条件。
权利要求书3页 说明书22页 附图5页
CN 114882320 A
2022.08.09
CN 114882320 A
1.一种对象识别网络的训练方法, 其特 征在于, 所述方法包括:
获取画面包括样本对象的至少两个图像域;
基于预设误识率, 确定评估所述至少两个图像域中所述样本对象相似度的全局阈值和
评估每一图像域中所述样本对象相似度的局部阈值;
基于所述全局阈值和所述每一图像域的局部阈值, 对所述每一图像域在待训练对象识
别网络中的分类损失进行调整, 得到第一损失;
基于所述第 一损失和所述至少两个图像域的第 二损失, 对所述待训练对象识别网络的
网络参数进行调整, 使得调整后的对象识别网络 输出的损失满足预设收敛 条件。
2.根据权利要求1所述的方法, 其特征在于, 所述获取画面包括样本对象的至少两个图
像域, 包括:
获取已标记所述样本对象的属性信息的样本图像集 合;
在所述待训练对象识别网络中, 基于所述样本对象的属性信 息和已标注域标签的多个
预设图像域, 将所述样本图像集 合分割为所述至少两个图像域。
3.根据权利要求2所述的方法, 其特征在于, 所述在所述待训练对象识别网络中, 基于
所述样本对象的属性信息和已标注域标签的多个预设图像域, 将所述样本图像集合分割为
所述至少两个图像域, 包括:
在所述待训练对象识别网络中, 对所述样本 图像集合进行特征提取, 得到第一图像特
征集合;
对所述第一图像特 征集合中的特 征维度进行变换, 得到第二图像特 征集合;
基于所述第 二图像特征集合中第 二图像特征的所述属性信 息, 在所述多个预设图像域
中, 确定所述第二图像特 征匹配的图像域。
4.根据权利要求3所述的方法, 其特征在于, 所述基于所述第 二图像特征集合中第 二图
像特征的所述属性信息, 在所述多个预设图像域中, 确定所述第二图像特征匹配的图像域,
包括:
基于所述第 二图像特征的所述属性信 息, 预测所述第 二图像特征匹配每一预设图像域
的域标签的概 率;
基于所述 概率, 确定所述第二图像特 征所属的样本图像匹配的图像域。
5.根据权利要求2至4任一项所述的方法, 其特征在于, 所述获取已标记所述样本对象
的属性信息的样本图像集 合之后, 所述方法还 包括:
对所述样本图像集合中的样本图像属于每一预设图像域的概率进行归一化, 得到已更
新概率集合;
在所述已更新 概率集合中, 确定满足预设条件的目标已更新 概率;
将所述目标已更新概率和概率集合之间的交叉熵损失, 确定为将所述样本图像分割至
图像域的所述第二损失。
6.根据权利要求1至5任一项所述的方法, 其特征在于, 所述基于预设误识率, 确定评估
所述至少两个图像域中所述样本对 象相似度的全局阈值和评估每一图像域中所述样本对
象相似度的局部阈值, 包括:
基于所述预设误识率, 对所述至少两个图像域中样本图像的第 二图像特征集合和预设
特征队列进行匹配, 得到多个特 征对;权 利 要 求 书 1/3 页
2
CN 114882320 A
2基于所述多个特 征对, 确定所述全局阈值和所述每一图像域对应的局部阈值。
7.根据权利要求6所述的方法, 其特征在于, 所述多个特征对包括: 多个特征负对, 所述
基于所述预设误识 率, 对所述至少两个图像域中样本图像的第二图像特征集合和预设特征
队列进行匹配, 得到多个特 征对, 包括:
确定所述第二图像特征集合中的任一第二图像特征与所述预设特征队列中的任一预
设特征之间的相似度;
基于所述预设误识率, 确定表征所述任一图像特征和所述任一预设特征相似的相似度
阈值;
在所述第二图像特征集合和所述预设特征队列中, 将所述相似度小于所述相似度阈值
的所述任一第二图像特征和所述任一预设特征确定为一个特征负对, 以得到所述多个特征
负对。
8.根据权利要求6或7所述的方法, 其特征在于, 所述基于所述多个特征对, 确定所述全
局阈值和所述每一图像域对应的局部阈值, 包括:
基于所述多个特 征对中特 征负对的相似度, 确定所述全局阈值;
基于所述预设误识率和所述每一图像域中特征负对的相似度, 确定所述每一图像域对
应的局部阈值。
9.根据权利要求6或7所述的方法, 其特征在于, 所述基于所述预设误识率, 对所述至少
两个图像域中样本图像的第二图像特征集合和预设特征队列进行匹配, 得到多个特征对之
前, 所述方法还 包括:
获取用于存 储样本图像的图像特 征的初始特 征队列;
在所述初始特征队列中存储的图像特征的数量小于预设特征数的情况下, 确定所述初
始特征队列的可用存 储空间;
在所述可用存储空间大于或等于所述样本图像的第 一图像特征集合所需的存储空间,
将所述第一图像特征集合中的第一图像特征加入所述初始特征队列中, 得到所述预设特征
队列。
10.根据权利要求6或7所述的方法, 其特征在于, 所述基于所述预设误识率, 对所述图
像特征集合和预设特 征队列进行匹配, 得到多个特 征对之前, 所述方法还 包括:
在初始特征队列中存储的图像特征的数量达到预设特征数, 或所述初始特征队列中存
储的图像特征 的数量小于预设特征数且所述初始特征队列的可用存储空间小于所述样本
图像的第一图像特征集合的特征数的情况下, 将所述第一图像特征集合中的第一图像特征
加入所述初始特 征队列中, 得到待调整队列;
按照所述待调整队列的存储顺序, 输出所述待调整队列中匹配所述第 一图像特征集合
的特征数的初始特 征, 得到所述预设特 征队列。
11.根据权利要求1至10任一项所述的方法, 其特征在于, 所述基于所述全局阈值和所
述每一图像域的局部阈值, 对所述每一图像域在待训练对象识别网络中的分类损失进 行调
整, 得到第一损失, 包括:
确定所述每一图像域的局部阈值与所述全局阈值之间的差异信息;
将所述差异信息, 赋予所述每一图像域在所述待训练对象识别网络的分类损 失, 得到
加权分类损失;权 利 要 求 书 2/3 页
3
CN 114882320 A
3
专利 对象识别方法、网络的训练方法、装置、设备及介质
文档预览
中文文档
31 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:32:48上传分享