说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210814991.1 (22)申请日 2022.07.12 (71)申请人 浙江大华 技术股份有限公司 地址 310053 浙江省杭州市滨江区滨安路 1187号 (72)发明人 蔡丹平 张朋 张学涵 虞响  吴立 陈波扬 黄鹏  (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 专利代理师 张洁 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/74(2022.01) G06V 20/40(2022.01) (54)发明名称 一种数据标注方法、 装置、 电子设备和存储 介质 (57)摘要 本申请涉及人工智能技术领域, 尤其涉及一 种数据标注方法、 装置、 电子设备和存储介质, 用 以提高训练数据的生成 效率。 其中, 方法包括: 通 过已训练的目标检测模型, 对各个初始图像分别 进行目标检测, 获得各个初始图像各自的目标检 测结果; 基于各个目标检测结果, 从各个初始图 像中确定 出包含目标对象 的多个中间图像; 通过 已训练的目标标注模型对各个中间图像包含的 目标对象进行标注, 获得各个中间图像各自的标 注信息; 基于各个中间图像以及各自包含的目标 对象, 从各个中间图像中确定出至少一个目标图 像, 并获取各个目标图像的标注信息。 由于本申 请通过对初始图像进行目标检测及标注, 获得目 标图像和相应的标注信息, 能够 有效提高训练数 据的生成效率。 权利要求书3页 说明书20页 附图5页 CN 114972893 A 2022.08.30 CN 114972893 A 1.一种数据标注方法, 其特 征在于, 该 方法包括: 通过已训练的目标检测模型, 对各个初始图像分别进行目标检测, 获得所述各个初始 图像各自的目标检测结果; 基于各个目标检测结果, 从所述各个初始图像中确定出包含目标对象的多个中间图 像; 通过已训练的目标标注模型对各个中间图像包含的目标对象进行标注, 获得所述各个 中间图像各自的标注信息, 所述标注信息用于表示相应的中间图像中目标对象的位置; 基于所述各个 中间图像以及各自包含的目标对象, 从所述各个中间图像中确定出至少 一个目标图像, 并获取 各个目标图像的标注信息 。 2.如权利要求1所述的方法, 其特征在于, 所述基于所述各个中间图像以及各自包含的 目标对象, 从所述各个中间图像中确定出至少一个目标图像的步骤, 包括以下至少一种方 式: 基于所述各个 中间图像各自包含的目标对象, 确定所述各个中间图像中的候选 中间图 像; 从去除所述候选中间图像后剩余的中间图像中, 确定出所述至少一个目标图像, 所述候 选中间图像用于表征包 含的目标对象的对象分辨 率或置信度不符合预设条件的中间图像; 基于所述各个中间图像之间的相似度, 确定所述各个中间图像中的目标相似图像, 所 述目标相似图像与对应的中间图像之 间的相似度高于相似度阈值; 从去除所述目标相似图 像后剩余的中间图像中, 确定出 所述至少一个目标图像。 3.如权利要求2所述的方法, 其特征在于, 所述基于所述各个中间图像各自包含的目标 对象, 确定所述各个中间图像中的候选中间图像, 包括: 基于所述各个 中间图像各自的标注信 息, 确定所述各个中间图像各自包含的目标对象 的对象分辨率; 将对应的分辨率不属于预设分辨率区间的中间图像, 作为候选中间图像; 和/或 基于已训练的分类模型, 分别对所述各个中间图像各自包含的目标对象进行分类, 获 得各个目标对 象各自的置信度; 将对应的置信度低于置信度阈值的中间图像, 作为候选中 间图像。 4.如权利要求2所述的方法, 其特征在于, 所述基于所述各个中间图像之间的相似度, 确定所述各个中间图像中的目标相似图像, 包括: 分别对所述各个中间图像进行 特征提取, 获得 各个中间图像特 征; 分别基于所述各个中间图像特征, 确定所述各个中间图像中, 每两个中间图像之间的 相似度; 基于各个相似度, 确定所述各个相似度中高于相似度阈值的各个目标相似度, 并将所 述各个目标相似度各自对应的两个中间图像作为 候选相似图像; 分别确定每两个候选相似图像各自包含的目标对象的置信度, 将每两个置信度中较低 的置信度对应的候选相似图像作为所述目标相似图像。 5.如权利要求1所述的方法, 其特征在于, 所述基于所述各个中间图像以及各自包含的 目标对象, 从所述各个中间图像中确定出至少一个目标图像, 包括: 基于已训练的分类模型, 分别对所述各个中间图像包含的目标对象进行分类, 获得所 述各个中间图像包含的目标对象各自对应的置信度, 并确定出高于置信度阈值的置信度对权 利 要 求 书 1/3 页 2 CN 114972893 A 2应的目标对象所在的中间图像; 从确定出的各个中间图像中确定出至少一个目标图像。 6.如权利要求1所述的方法, 其特征在于, 所述中间图像为视频帧图像; 在所述通过已 训练的目标 标注模型对各个中间图像包 含的目标对象进行 标注之前, 还 包括: 获取各个中间图像的中间标识, 所述中间标识用于标识所述各个中间图像的先后顺 序; 基于各个中间标识对所述各个中间图像进行筛 选, 获得筛 选后的中间图像。 7.如权利要求1所述的方法, 其特征在于, 在所述基于已训练的目标标注模型对各个中 间图像中的目标对象进行 标注之前, 还 包括: 分别对各个待清洗 图像进行特征提取, 获得各个清洗 图像特征, 所述各个待清洗 图像 为初始图像或中间图像; 分别基于各个清洗 图像特征, 确定所述各个待清洗 图像中, 每两个清洗 图像之间的相 似度; 基于各个相似度, 确定所述各个相似度中高于相似度阈值的各个目标相似度, 以及所 述各个目标相似度分别对应的两个候选相似图像; 分别确定每两个候选相似图像各自包含的目标对象的置信度, 将每两个置信度中较 高 的置信度对应的候选相似图像作为清洗后的待清洗图像。 8.如权利要求2~5、 7任一所述的方法, 其特征在于, 所述置信度用于表示所述目标对象 的清晰度类别置信度和所述目标对象的对象类别置信度中的至少一种。 9.如权利要求1 ‑7任一所述的方法, 其特 征在于, 所述方法还 包括: 按照至少一种统计维度, 对各个待分析图像的分布进行统计分析, 获得相应的统计分 析信息, 其中, 所述各个待分析图像包括所述中间图像和所述目标图像中的至少一种; 基于所述统计分析信息, 对所述初始图像的数量进行扩充, 并基于扩充的初始图像获 得相应的目标图像以及各个目标图像的标注信息 。 10.如权利要求9所述的方法, 其特征在于, 所述按照至少一种统计维度, 对各个待分析 图像的分布进行统计分析, 获得相应的统计分析信息, 包括: 按照所述各个待分析图像的标注信息, 对所述各个待分析图像的分布进行统计分析, 获得标注统计分析信息; 按照所述各个待分析图像的场景信息, 对所述各个待分析图像的分布进行统计分析, 获得场景统计分析信息, 其中, 每个待分析图像的场景信息是通过对相 应的待分析图像进 行场景分类获得的。 11.如权利要求10所述的方法, 其特征在于, 所述待分析图像的标注信 息包括所述待分 析图像的图像分辨率、 所述待分析图像中的目标对象的对象分辨率和所述目标对象的类别 信息中的至少一种。 12.如权利要求1~7任一项所述的方法, 其特征在于, 通过以下方式获得所述已训练的 目标检测模型: 获取第一训练样本集, 所述第一训练样本集中的每个第一训练样本包括: 包含所述目 标对象的第一样本图像; 基于所述第一训练样本集对待训练的目标检测模型进行 预训练, 获得中间检测模型;权 利 要 求 书 2/3 页 3 CN 114972893 A 3

PDF文档 专利 一种数据标注方法、装置、电子设备和存储介质

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据标注方法、装置、电子设备和存储介质 第 1 页 专利 一种数据标注方法、装置、电子设备和存储介质 第 2 页 专利 一种数据标注方法、装置、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:32:09上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。