说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210606674.0 (22)申请日 2022.05.31 (71)申请人 厦门市美亚柏科信息股份有限公司 地址 361000 福建省厦门市思明区软件园 二期观日路12号102-402单 元 (72)发明人 吴俊毅 张安国 高志鹏 赵建强  杜新胜 张辉极  (74)专利代理 机构 厦门福贝知识产权代理事务 所(普通合伙) 35235 专利代理师 郭涵炜 (51)Int.Cl. G06V 40/10(2022.01) G06K 9/62(2022.01) G06N 3/02(2006.01) G06N 3/08(2006.01)G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01) G06V 10/74(2022.01) (54)发明名称 基于辅助域分类和二阶信息瓶颈的行人再 识别方法和系统 (57)摘要 本发明给出了一种基于辅助域分类和二阶 信息瓶颈的行人再识别方法和系统, 包括将非行 人数据集和行人再识别数据集作为粗粒度到细 粒度模块的输入, 分类出行人和非行人; 利用二 阶信息瓶颈层压缩将行人的图片的信息冗余和 噪声; 将分类的行人的 图片和行人再识别数据集 的特征进行级联, 获取行人更细粒度的特征; 将 行人更细粒度的特征送入二阶信息瓶颈层, 经过 分类层, 在三元组损失函数的约束下进行训练行 人再识别模 型。 该行人再识别方法显著降低了类 内人物图像的神经网络输出方差, 具有优于目前 方法的性能。 权利要求书2页 说明书7页 附图2页 CN 114782999 A 2022.07.22 CN 114782999 A 1.基于辅助域分类和二阶信息瓶颈的行 人再识别方法, 其特 征在于, 包括: S1: 将非行人数据集和行人再识别数据集作为粗粒度到细粒度模块的输入, 分类出行 人和非行 人; S2: 利用二阶信息瓶颈层压缩将所述行 人的图片的信息 冗余和噪声; S3: 将分类的所述行人的图片和所述行人再识别数据集的特征进行级联, 获取行人更 细粒度的特 征; S4: 将所述行人更细粒度的特征送入所述二阶信息瓶颈层, 经过分类层, 在三元组损失 函数的约束下进行训练行 人再识别模型。 2.根据权利要求1所述的行人再识别方法, 其特征在于, 所述S1中具体为将所述非行人 数据集和所述行人再识别数据集作为所述粗粒度到细粒度模块的输入, 经过全局平均池化 层、 二阶信息瓶颈层和全连接层, 分类出 行人和非行 人, 损失函数为交叉熵损失函数。 3.根据权利要求2所述的行人再识别方法, 其特征在于, 所述二阶信 息瓶颈层表达 式为 IB(T)=H2(Y|T)+β I2(X; T), 其中, β 为用于平衡压缩和预测的超参 数且β >0, X定 义为二阶信 息瓶颈层的输入, Y 定义为目标输出, T定义 为二阶信息瓶颈的变量。 4.根据权利要求1所述的行人再识别方法, 其特征在于, 所述S4中三元组损失函数为: 其中P代表不同行人身份 的数量, K0 代表每个行人选择K0张不同的图像, 对于每张训练图像xa, 在和xa相同身份的图像中选择一 张相似度距离最大的图像xp作为正样本, 在和xa不同身份的图像中选择一张相似度距离最 小的图像xn作为负样本, 为认为设定的阈值, d( ·,·)定义为欧式距离 。 5.根据权利要求2所述的行人再识别方法, 其特征在于, 所述全连接层只保留表征为行 人的神经 元节点, 含弃表征为非行 人的节点和连接 权值。 6.一种计算机可读存储介质, 其上存储有一或多个计算机程序, 其特征在于, 该一或多 个计算机程序被 计算机处 理器执行时实施权利要求1至 5中任一项所述的方法。 7.基于辅助域分类和二阶信息瓶颈的行 人再识别系统, 其特 征在于, 所述系统包括: 粗粒度到细粒度模块: 配置用于将 非行人数据集和行人再识别数据集作为粗粒度到细 粒度模块的输入, 分类出 行人和非行 人; 二阶信息瓶颈模块: 配置用于利用二阶信 息瓶颈层压缩将所述行人的图片的信 息冗余 和噪声; 特征提取模块: 配置用于将分类的所述行人的图片和所述行人再识别数据集的特征进 行级联, 获取 行人更细粒度的特 征; 训练模块: 配置用于将所述行人更细粒度的特征送入所述二阶信息瓶颈层, 经过分类 层, 在三元组损失函数的约束下进行训练行 人再识别模型。 8.根据权利要求7所述的行人再识别系统, 其特征在于, 所述粗粒度到细粒度模块具体 配置用于将所述非行人数据集和所述行人再识别数据集作为所述粗粒度到细粒度模块的 输入, 经过全局平均池化层、 二阶信息瓶颈层和全连接层, 分类出行人和非行人, 损失函数 为交叉熵损失函数。 9.根据权利要求8所述的行人再识别系统, 其特征在于, 所述二阶信 息瓶颈层表达 式为 IB(T)=H2(Y|T)+β I2(X; T), 其中, β 为用于平衡压缩和预测的超参 数且β >0, X定 义为二阶信权 利 要 求 书 1/2 页 2 CN 114782999 A 2息瓶颈层的输入, Y 定义为目标输出, T定义 为二阶信息瓶颈的变量。 10.根据权利要求7所述的行人再识别系统, 其特征在于, 所述三元组损失函数为: 其中P代表不同行人身份 的数量, K0 代表每个行人选择K0张不同的图像, 对于每张训练图像xa, 在和xa相同身份的图像中选择一 张相似度距离最大的图像xp作为正样本, 在和xa不同身份的图像中选择一张相似度距离最 小的图像xn作为负样本, 为认为设定的阈值, d( ·,·)定义为欧式距离 。 11.根据权利要求8所述的行人再识别系统, 其特征在于, 所述全连接层只保留表征为 行人的神经 元节点, 含弃表征为非行 人的节点和连接 权值。权 利 要 求 书 2/2 页 3 CN 114782999 A 3

PDF文档 专利 基于辅助域分类和二阶信息瓶颈的行人再识别方法和系统

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于辅助域分类和二阶信息瓶颈的行人再识别方法和系统 第 1 页 专利 基于辅助域分类和二阶信息瓶颈的行人再识别方法和系统 第 2 页 专利 基于辅助域分类和二阶信息瓶颈的行人再识别方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:32:47上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。