说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210559553.5 (22)申请日 2022.05.23 (65)同一申请的已公布的文献号 申请公布号 CN 114724090 A (43)申请公布日 2022.07.08 (73)专利权人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 张欣彧 王之港 王健 孙昊  丁二锐  (74)专利代理 机构 北京同立钧成知识产权代理 有限公司 1 1205 专利代理师 董建姣 臧建明 (51)Int.Cl. G06V 20/52(2022.01)G06V 10/74(2022.01) G06V 10/762(2022.01) G06V 10/774(2022.01) G06K 9/62(2022.01) (56)对比文件 CN 112861825 A,2021.0 5.28 CN 113947693 A,202 2.01.18 朱福庆等.两路互补对称CN N结构的行 人再 识别. 《中国图象图形 学报》 .2018,(第07期), 审查员 姜玲玲 (54)发明名称 行人再识别模 型的训练方法、 行人再识别方 法及装置 (57)摘要 本公开提供了一种行人再识别模型的训练 方法、 行人再识别方法及装置, 涉及人工智 能技 术领域, 尤其涉及深度学习、 计算机视觉、 图像处 理技术, 可应用于智慧城市、 智能交通等场景。 该 方法包括: 将原始样本集中的原始样本图像分别 输入初始行人再识别模型, 得到原始样本图像的 第一样本特征; 对原始样本图像的第一样本特征 进行聚类, 得到多个聚类簇; 根据原始样本图像 的第一样本特征生成原始样本图像对应的难正 样本的第二样本特征; 基于第一样本特征、 第二 样本特征和聚类簇, 更新初始行人再识别模型。 该方法提高了行人再识别模型的识别结果的准 确性。 权利要求书3页 说明书10页 附图3页 CN 114724090 B 2022.08.30 CN 114724090 B 1.一种行 人再识别模型的训练方法, 包括: 将原始样本集中的原始样本图像分别输入初始行人再识别模型, 得到所述原始样本图 像的第一样本特 征; 对所述原 始样本图像的第一样本特 征进行聚类, 得到多个聚类簇; 根据所述原始样本图像的第一样本特征生成所述原始样本图像对应的难正样本的第 二样本特 征; 基于所述第一样本特征、 所述第二样本特征和所述聚类簇, 更新所述初始行人再识别 模型; 所述基于所述第一样本特征、 所述第二样本特征和所述聚类簇, 更新所述初始行人再 识别模型, 包括: 根据所述第一样本特征和所述聚类簇的聚类中心之间的第一损失函数, 确定第一损 失; 其中, 所述第一损失函数用于使得所述原始样本图像与所述原始样本图像所属的聚类 簇的聚类中心的距离减小, 且所述原 始样本图像与其 他聚类簇的聚类中心的距离增大; 根据所述第二样本特征和所述聚类簇的聚类中心之间的第二损失函数, 确定第二损 失; 其中, 所述第二损失函数用于使得所述难正样本与所述原始样本图像所属的聚类簇的 聚类中心的距离减小, 且所述难正样本与其 他聚类簇的聚类中心的距离增大; 根据所述第 一样本特征、 所述第 二样本特征和所述原始样本图像所属的聚类簇的聚类 中心之间的第三损失函数, 确定第三损失; 其中, 所述第三损失函数用于使得所述原始样本 图像距离所述原始样本图像所属的聚类簇的聚类中心的距离, 小于所述难正样本距离所述 原始样本图像所属的聚类簇的聚类中心的距离; 基于所述第一损失、 所述第二损失和所述第三损失, 更新所述初始行 人再识别模型。 2.根据权利要求1所述的方法, 其中, 所述根据所述原始样本图像的第 一样本特征生成 所述原始样本图像对应的难正样本的第二样本特 征, 包括: 根据所述第 一样本特征, 确定所述初始行人再识别模型的多个可学习参数各自对应的 权重, 其中, 所述可学习参数表征所有原始样 本图像的共同特征, 所述可学习参数的维度与 所述第一样本特 征的维度相同; 根据所述可学习参数和所述可学习参数对应的权重, 确定所述原始样本图像对应的难 正样本的第二样本特 征。 3.根据权利要求2所述的方法, 其中, 所述确定所述初始行人再识别模型的多个可学习 参数各自对应的权 重, 包括: 将所述第一样本特征分别输入多个全链接层, 得到与 所述多个可学习参数各自对应的 权重。 4.根据权利要求2所述的方法, 其中, 所述根据所述可学习参数和所述可学习参数对应 的权重, 确定所述原 始样本对应的难正样本的第二样本特 征, 包括: 按照所述可学习参数对应的权重, 对所述可学习参数进行加权求和, 得到所述第二样 本特征。 5.一种行 人再识别方法, 包括: 获取待识别图像和目标 行人图像; 将所述待识别图像和所述目标行人图像分别输入行人再识别模型, 得到所述待识别图权 利 要 求 书 1/3 页 2 CN 114724090 B 2像的特征向量和所述 目标行人图像的特征向量, 其中, 所述行人再识别模型是采用权利要 求1‑4中任一项所述的方法训练得到的; 基于所述待识别图像的特征向量与所述目标行人图像的特征向量的相似度确定所述 待识别图像的识别结果。 6.一种行 人再识别模型的训练装置, 包括: 输入模块, 用于将原始样本集中的原始样本 图像分别输入初始行人再识别模型, 得到 所述原始样本图像的第一样本特 征; 聚类模块, 用于对所述原 始样本图像的第一样本特 征进行聚类, 得到多个聚类簇; 生成模块, 用于根据 所述原始样本图像的第 一样本特征生成所述原始样本图像对应的 难正样本的第二样本特 征; 更新模块, 用于基于所述第 一样本特征、 所述第 二样本特征和所述聚类簇, 更新所述初 始行人再识别模型; 所述更新模块包括: 第三确定单元, 用于根据所述第 一样本特征和所述 聚类簇的聚类中心之间的第 一损失 函数, 确定第一损失; 其中, 所述第一损失函数用于使得所述原始样 本图像与所述原始样本 图像所属的聚类簇的聚类中心的距离减小, 且所述原始样本图像与其他聚类簇的聚类中心 的距离增大; 第四确定单元, 用于根据所述第 二样本特征和所述 聚类簇的聚类中心之间的第 二损失 函数, 确定第二损失; 其中, 所述第二损失函数用于使得所述难正样 本与所述原始样本图像 所属的聚类簇的聚类中心的距离减小, 且所述难正样本与其他聚类簇的聚类中心的距离增 大; 第五确定单元, 用于根据所述第一样本特征、 所述第二样本特征和所述原始样本 图像 所属的聚类簇的聚类中心之 间的第三损失函数, 确定第三损失; 其中, 所述第三损失函数用 于使得所述原始样本图像距离所述原始样本图像所属的聚类簇的聚类中心的距离, 小于所 述难正样本距离所述原 始样本图像所属的聚类簇的聚类中心的距离; 更新单元, 用于基于所述第 一损失、 所述第二损失和所述第 三损失, 更新所述初始行人 再识别模型。 7.根据权利要求6所述的装置, 其中, 所述 生成模块包括: 第一确定单元, 用于根据所述第一样本特征, 确定所述初始行人再识别模型的多个可 学习参数各自对应的权重, 其中, 所述可学习参数表征所有原始样本图像的共同特征, 所述 可学习参数的维度与所述第一样本特 征的维度相同; 第二确定单元, 用于根据所述可学习参数和所述可学习参数对应的权重, 确定所述原 始样本图像对应的难正样本的第二样本特 征。 8.根据权利要求7 所述的装置, 其中, 所述第一确定单 元用于: 将所述第一样本特征分别输入多个全链接层, 得到与 所述多个可学习参数各自对应的 权重。 9.根据权利要求7 所述的装置, 其中, 所述第二确定单 元用于: 按照所述可学习参数对应的权重, 对所述可学习参数进行加权求和, 得到所述第二样 本特征。权 利 要 求 书 2/3 页 3 CN 114724090 B 3

PDF文档 专利 行人再识别模型的训练方法、行人再识别方法及装置

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 行人再识别模型的训练方法、行人再识别方法及装置 第 1 页 专利 行人再识别模型的训练方法、行人再识别方法及装置 第 2 页 专利 行人再识别模型的训练方法、行人再识别方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:32:56上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。