(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210651076.5
(22)申请日 2022.06.08
(71)申请人 浙江大华 技术股份有限公司
地址 310051 浙江省杭州市滨江区滨安路
1187号
(72)发明人 黄胡晏 潘华东 殷俊 周明伟
朱书磊
(74)专利代理 机构 深圳市威世博知识产权代理
事务所(普通 合伙) 44280
专利代理师 何倚雯
(51)Int.Cl.
G06V 10/764(2022.01)
G06V 10/74(2022.01)
G06V 10/774(2022.01)
G06V 10/82(2022.01)
(54)发明名称
图像分类模型训练方法、 电子 设备和计算机
可读存储介质
(57)摘要
本申请公开了一种图像 分类模型训练方法、
电子设备和计算机可读存储介质, 该训练方法包
括: 将训练图像集和变换图像集输入图像分类模
型, 得到原始概率矩阵和变换概率矩阵; 基于原
始概率矩阵和概率阈值, 得到每种图像类型各自
对应的分类集合; 每个分类集合包括至多第二数
值个概率超 过概率阈值的训练图像, 且第二数值
与图像分类模 型的训练次数正相关; 基于各个分
类集合和变换图像集, 得到目标矩阵; 目标矩阵
包括每两个变换图像是否属于同一图像类型的
判断结果; 基于目标矩阵和变换概率矩阵, 得到
损失值, 基于损失值调整图像分类模 型的参数并
更新当前的训练次数, 直至满足预设收敛条件。
上述方案, 能够降低训练难度并提高图像分类的
准确率。
权利要求书2页 说明书12页 附图4页
CN 115205583 A
2022.10.18
CN 115205583 A
1.一种图像分类模型训练方法, 其特 征在于, 所述方法包括:
将训练图像集, 以及所述训练图像集对应的变换图像集输入图像分类模型, 得到原始
概率矩阵和变换概率矩阵; 其中, 所述训练图像集共包括第一数值个图像类型, 所述原始 概
率矩阵包括所述训练图像集中的每个训练图像属于每种图像类型的概率, 所述变换概率矩
阵包括所述变换图像集中的每 个变换图像属于每种图像 类型的概 率;
基于所述原始概率矩阵和概率阈值, 得到每种所述图像类型各自对应的分类集合; 每
个所述分类集合包括至多第二数值个概率超过所述概率阈值的训练图像, 且所述第二数值
与所述图像分类模型的训练次数正相关;
基于各个所述分类集合和所述变换图像集, 得到目标矩阵; 所述目标矩阵包括每两个
所述变换图像是否属于同一图像 类型的判断结果;
基于所述目标矩阵和所述变换概率矩阵, 得到损 失值, 基于所述损 失值调整所述图像
分类模型 的参数并更新当前 的训练次数, 直至满足预设收敛条件, 获得训练后的所述图像
分类模型。
2.根据权利要求1所述的图像分类模型训练方法, 其特征在于, 所述基于所述原始概率
矩阵和概 率阈值, 得到每种所述图像 类型各自对应的分类集 合, 包括:
利用所述概率阈值对所述原始概率矩阵中的概率进行过滤, 得到超过所述概率阈值的
过滤概率;
基于所述过滤概率对应的图像类型和所述过滤概率对应的训练图像的位置索引, 得到
每种所述图像 类型各自对应的初始集 合;
基于当前的训练次数、 所述第一数值和所述训练图像的数量, 得到所述第二数值;
基于所述位置索引对应的过滤概率, 选择概率最大的前所述第二数值个位置索引, 得
到至多所述第二数值个位置索引组成的所述分类集 合。
3.根据权利要求2所述的图像分类模型训练方法, 其特征在于, 所述训练次数对应有最
大训练次数和 最小训练次数, 所述基于当前 的训练次数、 所述第一数值和所述训练图像的
数量, 得到所述第二数值, 包括:
基于所述最大训练次数、 所述最小训练次数和当前的训练次数, 得到比例值; 所述比例
值与当前的训练次数正相关;
基于所述比例值, 以及所述训练图像的数量与所述第一数值的比值, 得到与训练次数
正相关的所述第二数值。
4.根据权利要求3所述的图像分类模型训练方法, 其特征在于, 所述将训练图像集, 以
及所述训练图像集对应的变换图像集输入图像分类模型, 得到原始 概率矩阵和变换概率矩
阵之前, 还 包括:
获得多个训练图像组成的训练图像集, 对所述训练图像集中的各个所述训练图像分别
进行随机变换, 得到所述训练图像集对应的所述变换图像集;
将所述变换图像集中基于同一训练图像变换而来的所有变换图像, 确定为属于同一所
述图像类型, 得到所述变换图像集对应的先验信息;
所述基于各个所述分类集 合和所述变换图像集, 得到目标矩阵, 包括:
响应于当前的训练次数未达到所述最小训练次数, 基于所述变换图像对应的先验信
息, 对所述变换图像集中的任意两个所述变换图像是否属于同一图像类型进行判断, 得到权 利 要 求 书 1/2 页
2
CN 115205583 A
2所述目标矩阵;
响应于当前的训练次数达到所述最小训练次数, 基于各个所述分类集合和所述变换图
像对应的先验信息, 对所述变换图像集中的任意两个所述变换图像是否属于同一图像类型
进行判断, 得到所述目标矩阵。
5.根据权利要求1所述的图像分类模型训练方法, 其特征在于, 所述图像分类模型包括
特征提取模块和分类模块, 所述将训练图像集, 以及所述训练图像集对应的变换图像集输
入图像分类模型, 得到原 始概率矩阵和变换概 率矩阵, 包括:
将所述训练图像集和所述变换图像集输入所述特征提取模块, 得到原始特征矩阵和变
换特征矩阵; 其中, 所述原始特征矩阵包括每个所述训练图像对应的特征, 所述变换特征矩
阵包括每 个所述变换图像对应的特 征;
将所述原始特征矩阵和所述变换特征矩阵输入所述分类模块, 得到所述原始概率矩阵
和所述变换概 率矩阵。
6.根据权利要求5所述的图像分类模型训练方法, 其特征在于, 基于所述原始概率矩阵
和概率阈值, 得到每种所述图像 类型各自对应的分类集 合之后, 还 包括:
在所述原始特征矩阵中, 确定各个所述分类集合中的训练图像对应的特征, 计算得到
各个所述分类集 合对应的平均特 征;
基于各个所述分类集合及其对应的平均 特征, 得到与 所述平均 特征相似度最高的前第
三数值个概率超过所述概率阈值的训练图像, 以更新各个所述分类集合; 所述第三数值小
于所述第二数值。
7.根据权利要求5所述的图像分类模型训练方法, 其特征在于, 所述基于所述目标矩阵
和所述变换概 率矩阵, 得到损失值, 包括:
基于所述变换特征矩阵, 得到所述变换图像集对应的特征相似度矩阵, 基于所述变换
概率矩阵, 得到所述变换图像集对应的概率相似度矩阵; 所述特征相似度矩阵中的每个元
素包括每两个所述变换图像的特征之 间的相似度, 所述概率相似度矩阵中的每个元素包括
每两个所述变换图像各自对应的概 率之间的相似度;
基于所述目标矩阵、 所述特 征相似度矩阵和所述 概率相似度矩阵, 得到所述损失值。
8.根据权利要求7所述的图像分类模型训练方法, 其特征在于, 所述判断结果包括真值
和假值, 所述基于所述目标矩阵、 所述特征相似度 矩阵和所述概率相似度 矩阵, 得到所述损
失值, 包括:
基于所述目标矩阵中的所述真值, 在所述特征相似度矩阵中提取与 所述真值对应的特
征真值相似度, 在所述 概率相似度矩阵中提取与所述真值对应的概 率真值相似度;
对所有所述特征真值相似度进行转换操作, 得到特征损 失, 对所有所述概率真值相似
度进行转换操作, 得到概 率损失; 所述 转换操作包括计算指数之和的对数;
对所述特 征损失和所述 概率损失进行加权求和, 得到所述损失值。
9.一种电子设备, 其特征在于, 包括: 相互耦接的存储器和处理器, 其中, 所述存储器存
储有程序数据, 所述处 理器调用所述 程序数据以执 行如权利要求1 ‑8中任一项所述的方法。
10.一种计算机可读存储介质, 其上存储有程序数据, 其特征在于, 所述程序数据被处
理器执行时实现如权利要求1 ‑8中任一项所述的方法。权 利 要 求 书 2/2 页
3
CN 115205583 A
3
专利 图像分类模型训练方法、电子设备和计算机可读存储介质
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:32:41上传分享