(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210823468.5
(22)申请日 2022.07.13
(71)申请人 浙江大华 技术股份有限公司
地址 310053 浙江省杭州市滨江区滨安路
1187号
(72)发明人 马媛媛 王仁根 张学涵 蔡丹平
黄鹏 吴立 周祥明 张朋
(74)专利代理 机构 北京同达信恒知识产权代理
有限公司 1 1291
专利代理师 张洁
(51)Int.Cl.
G06V 10/764(2022.01)
G06V 10/762(2022.01)
G06V 10/74(2022.01)
G06V 10/774(2022.01)G06V 10/40(2022.01)
G06V 10/26(2022.01)
(54)发明名称
一种训练图像分类模型的方法、 装置、 设备
及存储介质
(57)摘要
本申请提供一种训练图像 分类模型的方法、
装置、 设备及存储介质, 可 以应用于人工智 能领
域等, 用于解决训练得到的图像分类模型的分类
准确性和分类可靠性较低的问题。 该方法包括:
获取多个原始样本图像集; 采用至少一种图像集
扩展策略, 分别对所述多个原始样 本图像集中的
每两个原始样本图像集进行图像集扩展处理, 获
得多个扩展样本图像集; 对各个训练图像集进行
图像集聚类处理, 获得多个图像集聚类簇, 其中,
每个图像集聚类簇包含至少一个训练图像集, 所
述训练图像集为所述原始样本图像集或所述扩
展样本图像集; 分别基于所述多个图像集聚类
簇, 对相应的待训练的 图像分类模 型进行多轮迭
代训练, 输出已训练的多个目标图像分类模型。
权利要求书3页 说明书17页 附图10页
CN 115272752 A
2022.11.01
CN 115272752 A
1.一种训练图像分类模型的方法, 其特 征在于, 包括:
获取多个原 始样本图像集, 其中, 不同原 始样本图像集属于不同的图像域;
采用至少一种图像集扩展策略, 分别对所述多个原始样本图像集中的每两个原始样本
图像集进行图像集扩展处 理, 获得多个扩展样本图像集;
对各个训练图像集进行图像集聚类处理, 获得多个图像集聚类簇, 其中, 每个图像集 聚
类簇包含至少一个训练图像集, 所述训练图像集为所述原始样本图像集或所述扩展样本图
像集, 所述多个图像集聚类簇中, 至少存在一个图像集聚类簇中包 含所述扩展样本图像集;
分别基于所述多个图像集聚类簇, 对相应的待训练的图像分类模型进行多轮迭代训
练, 输出已训练的多个目标图像分类模型。
2.根据权利要求1所述的方法, 其特征在于, 所述至少一种图像集扩展策略包括小波变
换策略时, 所述采用至少一种图像集扩展策略, 分别对所述多个原始样本图像集中的每两
个原始样本图像集进行图像集扩展处 理, 获得多个扩展样本图像集, 包括:
针对每两个原 始样本图像集, 执 行以下操作:
分别对两个所述原始样本图像集进行小波变换, 获得两个原始低频特征集和两个原始
高频特征集;
对所述两个原 始低频特征集进行线性插值处 理, 获得插值低频 特征集;
分别对所述插值低频特征集, 与所述两个原始高频特征集进行小波逆变换, 获得两个
扩展样本图像集。
3.根据权利要求1所述的方法, 其特征在于, 所述至少一种图像集扩展策略包括傅里叶
变换策略时, 所述采用至少一种图像集扩展策略, 分别对所述多个原始样本图像集中的每
两个原始样本图像集进行图像集扩展处 理, 获得多个扩展样本图像集, 包括:
针对每两个原 始样本图像集, 执 行以下操作:
分别对两个所述原始样本图像集进行傅里叶变换, 获得两个原始相位特征集和两个原
始幅度特 征集;
对所述两个原 始相位特 征集进行线性插值处 理, 获得插值相位特 征集;
分别对所述插值相位特征集, 与所述两个原始幅度特征集进行傅里叶逆变换, 获得两
个扩展样本图像集。
4.根据权利要求1所述的方法, 其特征在于, 所述对各个训练图像集进行图像集 聚类处
理, 获得多个图像集聚类簇, 包括:
针对所述各个训练图像集中的每两个训练图像集, 执 行以下操作:
针对两个训练图像集, 分别采用相应的图像分类模型, 对所述两个训练图像集进行特
征提取, 获得两个图像特征集, 并基于所述两个图像特征集, 分别确定所述两个图像特征集
各自对应的分类概 率分布集;
针对从获得的两个分类概率分布集中选取的每两个分类概率分布, 确定相应的概率分
布误差, 并基于获得的各概 率分布误差, 确定所述两个训练图像集之间的相似度;
基于所述各个训练图像集中的每两个训练图像集之间的相似度, 对所述各个训练图像
集进行图像集聚类处 理, 获得多个图像集聚类簇 。
5.根据权利要求4所述的方法, 其特征在于, 所述基于所述各个训练图像集中的每两个
训练图像集之间的相似度, 对所述各个训练图像集进行图像集聚类处理, 获得多个图像集权 利 要 求 书 1/3 页
2
CN 115272752 A
2聚类簇, 包括:
基于所述各个训练图像集中的每两个训练图像集之间的相似度, 确定各相似度组成的
相似度矩阵和对角矩阵;
将所述各个训练图像集作为顶点, 并基于所述相似度矩阵与 所述对角矩阵之差建立各
顶点之间的无向边, 获得 无向图;
对所述无向图进行图像分割处理, 获得多个子 图, 并分别基于所述多个子 图各自包含
的训练图像集, 建立相应的图像集聚类簇 。
6.根据权利要求1~5任一项所述的方法, 其特征在于, 所述分别基于所述多个图像集
聚类簇, 对相应的图像 分类模型进行多轮迭代训练, 输出已训练的多个目标图像分类模型,
包括:
针对每个图像集聚类簇中的每两个训练图像集, 执 行以下操作:
针对两个训练图像集, 分别采用相应的图像分类模型, 对所述两个训练图像集进行特
征提取, 获得两个图像特征集, 并分别基于所述两个图像特征集, 确定相应的分类概率分布
集;
针对从获得的两个分类概率分布集中选取的每两个分类概率分布, 确定相应的概率分
布误差, 并基于获得的各概 率分布误差, 确定所述图像分类模型的训练损失;
在获得的训练损失不满足训练目标时, 调整所述图像分类模型的模型参数;
在获得的训练损失满足训练目标时, 输出已训练的目标图像分类模型。
7.根据权利要求1~5任一项所述的方法, 其特征在于, 在所述分别基于所述多个图像
集聚类簇, 对相 应的图像分类模型进行多轮迭代训练, 输出已训练的多个目标图像分类模
型之后, 还 包括:
获得待分类图像;
分别从所述各个训练图像集中选取一个训练图像, 获得多个训练图像;
针对所述多个训练图像, 分别执 行以下操作:
采用与训练图像相匹配的目标图像分类模型, 对所述训练图像和所述待分类图像进行
特征提取, 获得相应的第一图像特征和第二图像特征, 并分别基于所述第一图像特征和所
述第二图像特 征, 确定相应的第一分类概 率分布和第二分类概 率分布;
在所述第一分类概率分布和所述第二分类概率分布之间的概率分布误差满足预设误
差条件时, 基于所述第二分类概 率分布, 确定所述待分类图像的目标类别。
8.一种训练图像分类模型的装置, 其特 征在于, 包括:
获取模块: 用于获取多个原始样本图像集, 其中, 不同原始样本图像集属于不同的图像
域;
处理模块: 用于采用至少一种图像集扩展策略, 分别对所述多个原始样本 图像集中的
每两个原 始样本图像集进行图像集扩展处 理, 获得多个扩展样本图像集;
所述处理模块还用于: 对各个训练图像集进行图像集聚类处理, 获得多个图像集聚类
簇, 其中, 每个图像集聚类簇包含至少一个训练图像集, 所述训练图像集为所述原始样 本图
像集或所述扩展样本图像集, 所述多个图像集聚类簇中, 至少存在一个图像集聚类簇中包
含所述扩展样本图像集;
所述处理模块还用于: 分别基于所述多个图像集聚类簇, 对相应的图像分类模型进行权 利 要 求 书 2/3 页
3
CN 115272752 A
3
专利 一种训练图像分类模型的方法、装置、设备及存储介质
文档预览
中文文档
31 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:32:07上传分享