说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210809767.3 (22)申请日 2022.07.11 (71)申请人 零束科技有限公司 地址 201805 上海市嘉定区安亭镇墨玉南 路888号2201室JT1740 (72)发明人 祝露 邵全全 张松 严玮  别晓芳 王汉超  (74)专利代理 机构 北京合智同创知识产权代理 有限公司 1 1545 专利代理师 李杰 (51)Int.Cl. G06V 20/56(2022.01) G06V 10/74(2022.01) G06N 20/00(2019.01) (54)发明名称 图像标注模型训练方法、 装置、 电子设备及 存储介质 (57)摘要 本申请实施例提供了一种图像标注模型训 练方法、 装置、 电子设备及存储介质, 该图像标注 模型训练方法包括: 获取包括至少两个待标注图 像的待标注数据集; 确定待 标注数据集中待 标注 图像之间的相似度; 通过待训练的第一标注模型 分别对待标注数据集中的每个待标注 图像进行 标注, 获得每个待标注图像的第一标注结果; 根 据待标注 图像之间的相似度和每个待标注 图像 的第一标注结果, 确定样本子集; 通过样本子集 包括的各待标注图像及相对应的人工标注结果, 对第一标注模型进行训练。 应用本申请方案, 可 以解决算法辅助人工标注时算法标注效果差的 问题, 充分利用数据集中的已标注数据, 提高了 算法标注效果。 权利要求书2页 说明书9页 附图3页 CN 115050002 A 2022.09.13 CN 115050002 A 1.一种图像标注模型训练方法, 其特 征在于, 包括: 获取包括至少两个待标注图像的待标注数据集; 确定所述待标注数据集中所述待标注图像之间的相似度; 通过待训练的第 一标注模型分别对所述待标注数据集中的每个待标注图像进行标注, 获得每个所述待标注图像的第一标注结果, 其中, 所述第一标注模型用于对图像中的目标 对象进行 标注; 根据所述待标注图像之间的相似度和每个所述待标注图像的第 一标注结果, 确定样本 子集, 其中, 所述样本子集包括至少两个所述待标注图像, 所述样本子集中各所述待标注图 像之间的相似度小于相似度阈值, 且所述样本子集中每个所述待标注图像的第一标注结果 的准确度小于准确度阈值; 获取所述样本 子集中每 个待标注图像对应的人工标注结果; 通过所述样本子集包括的各待标注图像及相对应的所述人工标注结果, 对所述第 一标 注模型进行训练。 2.根据权利要求1所述的方法, 其特征在于, 所述确定所述待标注数据集中所述待标注 图像之间的相似度, 包括: 通过预训练的编码模型, 分别对所述待标注数据集包括的每个所述待标注图像进行编 码, 获得每 个所述待标注图像的特 征向量; 分别计算所述待标注数据集中不同所述待标注图像的特征向量之间的距离, 作为相对 应两个所述待标注图像之间的相似度。 3.根据权利要求1所述的方法, 其特征在于, 所述根据所述待标注图像之间的相似度和 每个所述待标注图像的第一标注结果, 确定样本 子集, 包括: 对所述待标注数据集中对应相似度 大于相似度阈值的所述待标注图像进行去重处理, 获得备选数据集; 分别计算所述备选数据集中每 个所述待标注图像的第一标注结果的准确度; 从所述备选数据集中抽取至少两个对应准确度小于准确度阈值的所述待标注图像, 将 所抽取出的各所述待标注图像的集 合确定为所述样本 子集。 4.根据权利要求3所述的方法, 其特征在于, 所述分别计算所述备选数据集中每个所述 待标注图像的第一标注结果的准确度, 包括: 分别确定所述备选数据集中每个所述待标注图像的概率分布图, 其中, 所述概率分布 图用于指示相对应的所述待标注图像中每 个像素点包 含于目标对象的图像的概 率; 分别确定所述备选数据集中每个所述待标注图像的候选框叠加图, 其中, 所述候选框 叠加图由至少两个候选框叠加形成, 所述候选框用于指示所述待标注图像中候选对象所处 的区域; 针对所述备选数据集中每个所述待标注图像, 计算该待标注图像对应的所述概率分布 图和所述候选框叠加图的交并比, 并根据所述交并比确定该待标注图像的所述第一标注结 果的准确度。 5.根据权利要求3所述的方法, 其特征在于, 所述从所述备选数据集中抽取至少两个对 应准确度小于准确度阈值的所述待标注图像, 将所抽取出的各所述待标注图像的集合确定 为所述样本 子集, 包括:权 利 要 求 书 1/2 页 2 CN 115050002 A 2从所述备选数据集中随机抽取对应准确度小于准确度阈值的2N个待标注图像, 其中, N 为正整数; 按照相对应准确度由小至大的顺序, 对所述2N个待标注图像进行排序; 将排序后所述2N个待标注图像中的前N个待标注图像的集 合, 确定为所述样本 子集。 6.根据权利要求4所述的方法, 其特征在于, 所述分别确定所述备选数据集中每个所述 待标注图像的候选 框叠加图, 包括: 针对所述备选数据集中的每个所述待标注图像, 确定该待标注图像中每个所述候选框 内包括候选对象图像的概 率; 将对应包括候选对象图像的概率大于预设的概率阈值的至少两个所述候选框进行叠 加, 获得所述候选框叠加图。 7.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 通过第二标注模型分别对所述样本子集中的每个待标注图像进行标注, 获得每个所述 待标注图像的第二标注结果, 其中, 所述第二标注模型用于对图像中的所述 目标对象进行 标注; 对所述样本子集中每个待标注图像的第 二标注结果进行展示, 以辅助用户对所述样本 子集中的待标注图像进行 人工标注。 8.一种图像标注模型训练装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取包括至少两个待标注图像的待标注数据集和获取所述样本子集中 每个待标注图像对应的人工标注结果; 标注模块, 用于通过待训练 的第一标注模型分别对所述待标注数据集中的每个待标注 图像进行 标注, 获得每 个所述待标注图像的第一标注结果; 图像处理模块, 用于确定所述待标注数据集中所述待标注图像之间的相似度和根据 所 述待标注图像之间的相似度和每 个所述待标注图像的第一标注结果, 确定样本 子集; 训练模块, 用于通过所述样本子集包括的各待标注图像及相对应的所述人工标注结 果, 对所述标注模型进行训练。 9.一种电子设备, 其特征在于, 包括: 处理器、 存储器、 通信接口和通信总线, 所述处理 器、 所述存 储器和所述 通信接口通过 所述通信总线完成相互间的通信; 所述存储器用于存放至少一可执行指令, 所述可执行指令使所述处理器执行如权利要 求1‑7中任一项所述的方法对应的操作。 10.一种计算机存储介质, 其特征在于, 其上存储有计算机程序, 该程序被处理器执行 时实现如权利要求1 ‑7中任一所述方法。 11.一种计算机程序产品, 其特征在于, 当所述计算机程序被处理器执行时, 实现如权 利要求1‑7中任一项所述的图像标注模型训练方法。权 利 要 求 书 2/2 页 3 CN 115050002 A 3

PDF文档 专利 图像标注模型训练方法、装置、电子设备及存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像标注模型训练方法、装置、电子设备及存储介质 第 1 页 专利 图像标注模型训练方法、装置、电子设备及存储介质 第 2 页 专利 图像标注模型训练方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:32:10上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。