(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210714472.8
(22)申请日 2022.06.23
(65)同一申请的已公布的文献号
申请公布号 CN 114792398 A
(43)申请公布日 2022.07.26
(73)专利权人 阿里巴巴 (中国) 有限公司
地址 311121 浙江省杭州市余杭区五常街
道文一西路969号3幢5层5 54室
(72)发明人 袁建龙 王志斌 李昊
(74)专利代理 机构 北京博浩百 睿知识产权代理
有限责任公司 1 1134
专利代理师 谢湘宁 李静茹
(51)Int.Cl.
G06V 20/10(2022.01)
G06V 10/74(2022.01)G06V 10/774(2022.01)
G06V 10/764(2022.01)
G06V 10/82(2022.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
审查员 王婕
(54)发明名称
图像分类的方法、 存 储介质、 处 理器及系统
(57)摘要
本发明公开了一种图像分类的方法和目标
数据分类模型的构建方法。 其中, 该方法包括: 获
取待分类的目标图像数据; 采用目标数据分类模
型对所述目标图像数据进行分类处理, 得到所述
目标图像数据的分类结果, 其中, 所述目标数据
分类模型是由度量学习函数对神经网络模型进
行训练得到, 所述度量学习函数是通过目标特征
集来确定, 所述目标特征集是通过对训练样本的
初始特征集进行语义增强后得到的。 本发明解决
了相关技术中已有的领域泛化的神经网络模型,
由于在进行领域泛化时很难考虑到类间方差, 导
致在对数据分类时的准确度比较低的技 术问题。
权利要求书3页 说明书22页 附图7页
CN 114792398 B
2022.09.27
CN 114792398 B
1.一种图像分类的方法, 其特 征在于, 包括:
获取待分类的建筑物图像;
采用目标数据分类模型对所述建筑物图像进行分类处理, 得到所述建筑物图像的分类
结果, 其中, 所述目标数据分类模型是由度量学习函数对神经网络模 型进行训练得到, 所述
度量学习函数是通过目标特征集来确定, 所述目标特征集是通过对训练样本的初始特征集
进行语义增强后得到的;
其中, 采用目标数据分类模型对所述建筑物图像进行分类处理, 得到所述建筑物图像
的分类结果, 所述方法还 包括:
获取预设时间段之前的建筑物图像的分类结果, 得到初始分类结果;
将所述建筑物图像的分类结果与所述初始分类结果进行比对, 确定建筑物的变化信
息;
所述目标 数据分类模型通过 下述步骤训练得到:
获取多个训练样本, 其中, 所述多个训练样本至少包括: 训练样本数据和多个训练样本
数据对应的类别标签;
对所述多个训练样本进行处理, 得到所述度量学习函数, 并将所述度量学习函数作为
神经网络模型的损失函数;
依据所述度量学习函数和所述多个训练样本对所述神经网络模型进行训练, 得到所述
目标数据分类模型;
所述度量学习函数的形式为:
其中,
为所述度量学习函数,
,
和
是利用所述目标特征集得到的lo gits向
量集,
为预设不同类别标签之间的边距值;
其中, 所述 logits向量 集的形式为:
,
为所述神经网络模型的权重,
为
所述神经网络模型的偏差,
为第i个训练样本的特征向量, C为 所述训练样本的类别标签的
个数,
为预设参数,
。
2.根据权利要求1所述的方法, 其特征在于, 对所述多个训练样本进行处理, 得到所述
度量学习函数包括:
对所述多个训练样本进行 预处理, 得到所述多个训练样本对应的目标 特征集;
依据所述目标特征集、 所述神经网络模型的权重和所述神经网络模型的偏差进行计
算, 得到交叉熵函数的向量 集;
将所述向量 集作为所述度量学习函数的输入特 征, 得到所述度量学习函数。
3.根据权利要求2所述的方法, 其特征在于, 对所述多个训练样本进行预处理, 得到所
述多个训练样本对应的目标 特征集包括:权 利 要 求 书 1/3 页
2
CN 114792398 B
2对所述多个训练样本进行 特征提取, 得到初始特 征集;
对所述初始特 征集中的每 个特征向量进行语义增强, 得到所述目标 特征集。
4.根据权利要求2所述的方法, 其特征在于, 依据所述目标特征集、 神经网络模型的权
重和所述神经网络模型的偏差进行计算, 得到交叉熵函数的向量 集包括:
依据所述目标特征集、 所述神经网络模型的权重、 所述神经网络模型的偏差和每个训
练样本数据对应的类别标签, 得到所述交叉熵函数;
依据所述交叉熵函数, 得到所述交叉熵函数的向量 集;
其中, 所述交叉熵函数的形式为:
,
为所述神经
网络模型的权重,
为所述神经网络模型的偏差,
为第i个训练样本的特征向量, C为所述
训练样本的类别标签的个数,
为预设参数,
, 所述交叉熵函数的向量集为
logits向量 集, 所述logits向量 集的形式为:
。
5.一种计算机可读存储介质, 其特征在于, 所述存储介质包括存储的程序, 其中, 在所
述程序运行时控制所述存储介质所在设备执行权利要求1至4中的任意一项所述的图像分
类的方法。
6.一种处理器, 其特征在于, 所述处理器用于运行程序, 其中, 所述程序运行时执行权
利要求1至4中的任意 一项所述的图像分类的方法。
7.一种图像分类的系统, 其特 征在于, 包括:
处理器; 以及
存储器, 与所述处 理器连接, 用于为所述处 理器提供处 理以下处 理步骤的指令:
获取待分类的建筑物图像;
采用目标数据分类模型对所述建筑物图像进行分类处理, 得到所述建筑物图像的分类
结果, 其中, 所述目标数据分类模型是由度量学习函数对神经网络模 型进行训练得到, 所述
度量学习函数是通过目标特征集来确定, 所述目标特征集是通过对训练样本的初始特征集
进行语义增强后得到的;
其中, 获取 预设时间段之前的建筑物图像的分类结果, 得到初始分类结果;
将所述建筑物图像的分类结果与所述初始分类结果进行比对, 确定建筑物的变化信
息;
所述目标 数据分类模型通过 下述步骤训练得到:
获取多个训练样本, 其中, 所述多个训练样本至少包括: 训练样本数据和所述多个训练
样本数据对应的类别标签;
对所述多个训练样本进行处理, 得到所述度量学习函数, 并将所述度量学习函数作为
神经网络模型的损失函数;
依据所述度量学习函数和所述多个训练样本对所述神经网络模型进行训练, 得到所述权 利 要 求 书 2/3 页
3
CN 114792398 B
3
专利 图像分类的方法、存储介质、处理器及系统
文档预览
中文文档
33 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共33页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:32:26上传分享