专利 对象识别方法、网络的训练方法、装置、设备及介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210604744.9 (22)申请日 2022.05.30 (71)申请人上海商汤智能科技有限公司地址 200233 上海市徐汇区桂平路391号3 号楼1605A室 (72)发明人秦昊煜　刘佳恒　吴一超　 (74)专利代理机构北京派特恩知识产权代理有限公司 1 1270 专利代理师李江　蒋雅洁 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/74(2022.01) G06V 10/764(2022.01) G06V 10/40(2022.01) G06V 40/16(2022.01)G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称对象识别方法、网络的训练方法、装置、设备及介质 (57)摘要本申请实施例提供一种对象识别方法、网络的训练方法、装置、设备及介质，其中，该方法包括：获取画面包括样本对象的至少两个图像域；基于预设误识率，确定评估所述至少两个图像域中所述样本对象相似度的全局阈值和评估每一图像域中所述样本对象相似度的局部阈值；基于所述全局阈值和所述每一图像域的局部阈值，对所述每一图像域在待训练对象识别网络中的分类损失进行调整，得到第一损失；基于所述第一损失和所述至少两个图像域的第二损失，对所述待训练对象识别网络的网络参数进行调整，使得调整后的对象识别网络输出的损失满足预设收敛条件。权利要求书3页说明书22页附图5页 CN 114882320 A 2022.08.09 CN 114882320 A 1.一种对象识别网络的训练方法，其特征在于，所述方法包括：获取画面包括样本对象的至少两个图像域；基于预设误识率，确定评估所述至少两个图像域中所述样本对象相似度的全局阈值和评估每一图像域中所述样本对象相似度的局部阈值；基于所述全局阈值和所述每一图像域的局部阈值，对所述每一图像域在待训练对象识别网络中的分类损失进行调整，得到第一损失；基于所述第一损失和所述至少两个图像域的第二损失，对所述待训练对象识别网络的网络参数进行调整，使得调整后的对象识别网络输出的损失满足预设收敛条件。 2.根据权利要求1所述的方法，其特征在于，所述获取画面包括样本对象的至少两个图像域，包括：获取已标记所述样本对象的属性信息的样本图像集合；在所述待训练对象识别网络中，基于所述样本对象的属性信息和已标注域标签的多个预设图像域，将所述样本图像集合分割为所述至少两个图像域。 3.根据权利要求2所述的方法，其特征在于，所述在所述待训练对象识别网络中，基于所述样本对象的属性信息和已标注域标签的多个预设图像域，将所述样本图像集合分割为所述至少两个图像域，包括：在所述待训练对象识别网络中，对所述样本图像集合进行特征提取，得到第一图像特征集合；对所述第一图像特征集合中的特征维度进行变换，得到第二图像特征集合；基于所述第二图像特征集合中第二图像特征的所述属性信息，在所述多个预设图像域中，确定所述第二图像特征匹配的图像域。 4.根据权利要求3所述的方法，其特征在于，所述基于所述第二图像特征集合中第二图像特征的所述属性信息，在所述多个预设图像域中，确定所述第二图像特征匹配的图像域，包括：基于所述第二图像特征的所述属性信息，预测所述第二图像特征匹配每一预设图像域的域标签的概率；基于所述概率，确定所述第二图像特征所属的样本图像匹配的图像域。 5.根据权利要求2至4任一项所述的方法，其特征在于，所述获取已标记所述样本对象的属性信息的样本图像集合之后，所述方法还包括：对所述样本图像集合中的样本图像属于每一预设图像域的概率进行归一化，得到已更新概率集合；在所述已更新概率集合中，确定满足预设条件的目标已更新概率；将所述目标已更新概率和概率集合之间的交叉熵损失，确定为将所述样本图像分割至图像域的所述第二损失。 6.根据权利要求1至5任一项所述的方法，其特征在于，所述基于预设误识率，确定评估所述至少两个图像域中所述样本对象相似度的全局阈值和评估每一图像域中所述样本对象相似度的局部阈值，包括：基于所述预设误识率，对所述至少两个图像域中样本图像的第二图像特征集合和预设特征队列进行匹配，得到多个特征对；权　利　要　求　书 1/3 页 2 CN 114882320 A 2基于所述多个特征对，确定所述全局阈值和所述每一图像域对应的局部阈值。 7.根据权利要求6所述的方法，其特征在于，所述多个特征对包括：多个特征负对，所述基于所述预设误识率，对所述至少两个图像域中样本图像的第二图像特征集合和预设特征队列进行匹配，得到多个特征对，包括：确定所述第二图像特征集合中的任一第二图像特征与所述预设特征队列中的任一预设特征之间的相似度；基于所述预设误识率，确定表征所述任一图像特征和所述任一预设特征相似的相似度阈值；在所述第二图像特征集合和所述预设特征队列中，将所述相似度小于所述相似度阈值的所述任一第二图像特征和所述任一预设特征确定为一个特征负对，以得到所述多个特征负对。 8.根据权利要求6或7所述的方法，其特征在于，所述基于所述多个特征对，确定所述全局阈值和所述每一图像域对应的局部阈值，包括：基于所述多个特征对中特征负对的相似度，确定所述全局阈值；基于所述预设误识率和所述每一图像域中特征负对的相似度，确定所述每一图像域对应的局部阈值。 9.根据权利要求6或7所述的方法，其特征在于，所述基于所述预设误识率，对所述至少两个图像域中样本图像的第二图像特征集合和预设特征队列进行匹配，得到多个特征对之前，所述方法还包括：获取用于存储样本图像的图像特征的初始特征队列；在所述初始特征队列中存储的图像特征的数量小于预设特征数的情况下，确定所述初始特征队列的可用存储空间；在所述可用存储空间大于或等于所述样本图像的第一图像特征集合所需的存储空间，将所述第一图像特征集合中的第一图像特征加入所述初始特征队列中，得到所述预设特征队列。 10.根据权利要求6或7所述的方法，其特征在于，所述基于所述预设误识率，对所述图像特征集合和预设特征队列进行匹配，得到多个特征对之前，所述方法还包括：在初始特征队列中存储的图像特征的数量达到预设特征数，或所述初始特征队列中存储的图像特征的数量小于预设特征数且所述初始特征队列的可用存储空间小于所述样本图像的第一图像特征集合的特征数的情况下，将所述第一图像特征集合中的第一图像特征加入所述初始特征队列中，得到待调整队列；按照所述待调整队列的存储顺序，输出所述待调整队列中匹配所述第一图像特征集合的特征数的初始特征，得到所述预设特征队列。 11.根据权利要求1至10任一项所述的方法，其特征在于，所述基于所述全局阈值和所述每一图像域的局部阈值，对所述每一图像域在待训练对象识别网络中的分类损失进行调整，得到第一损失，包括：确定所述每一图像域的局部阈值与所述全局阈值之间的差异信息；将所述差异信息，赋予所述每一图像域在所述待训练对象识别网络的分类损失，得到加权分类损失；权　利　要　求　书 2/3 页 3 CN 114882320 A 3

专利 对象识别方法、网络的训练方法、装置、设备及介质

专利对象识别方法、网络的训练方法、装置、设备及介质