说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211066952.4 (22)申请日 2022.09.01 (71)申请人 武汉联一 合立技术有限公司 地址 430000 湖北省武汉市东湖新 技术开 发区武汉软件新城1.2期2号楼15层 (1)厂房 申请人 武汉科技大 学 (72)发明人 陈斌 蔡宾 郭偲琦 蒋林  邹汉城 胡谦 罗文龙  (74)专利代理 机构 深圳市世纪恒程知识产权代 理事务所 4 4287 专利代理师 罗敏 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/774(2022.01)G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 数据集生成方法、 设备、 存 储介质及装置 (57)摘要 本发明公开了一种数据集生成方法、 设备、 存储介质及装置, 该方法包括: 根据第一图片和 第一图片对应的第一标注文件对预设模型进行 训练, 获得第一模型, 通过第一模型对第二图片 进行标注, 获得第二图片对应的第二标注文件, 根据第二图片和第二标注文件对第一模型进行 训练, 获得第二模型, 通过第二模型对第三图片 进行标注, 获得第三图片对应的第三标注文件, 根据第一图片、 第一标注文件、 第二图片、 第二标 注文件、 第三图片以及第三标注文件生成数据 集; 由于本发 明通过根据第二图片和第二标注文 件对第一模 型进行训练获得第二模 型, 再由第二 模型获得第三标注文件, 通过提高标注文件的精 确度从而提高在特定场景下物体的识别率并且 提高工作效率。 权利要求书2页 说明书9页 附图4页 CN 115471696 A 2022.12.13 CN 115471696 A 1.一种数据集 生成方法, 其特 征在于, 所述数据集 生成方法包括以下步骤: 根据第一图片和第一图片对应的第一标注文件 对预设模型进行训练, 获得第一模型; 通过所述第一模型对第二图片进行 标注, 获得 所述第二图片对应的第二标注文件; 根据所述第二图片和所述第二标注文件 对所述第一模型进行训练, 获得第二模型; 通过所述第二模型对第三图片进行 标注, 获得 所述第三图片对应的第三标注文件; 根据所述第一图片、 所述第一标注文件、 所述第二图片、 所述第二标注文件、 所述第三 图片以及所述第三标注文件生成数据集。 2.如权利要求1所述的数据集生成方法, 其特征在于, 所述根据第 一图片和第 一图片对 应的第一标注文件 对预设模型进行训练, 获得第一模型的步骤之前, 还 包括: 基于预设距离参数和预设角度参数对目标物体进行拍摄, 获得目标物体图片; 从所述目标物体图片中选取第一图片、 第二图片和第三图片。 3.如权利要求1所述的数据集生成方法, 其特征在于, 所述通过所述第 一模型对第 二图 片进行标注, 获得 所述第二图片对应的第二标注文件的步骤, 包括: 通过所述第 一模型对第 二图片中的待识别物体进行标注, 获得所述第 二图片对应的文 本标注文件; 对所述文本标注文件进行转换, 获得 所述第二图片对应的第二标注文件。 4.如权利要求1所述的数据集生成方法, 其特征在于, 所述根据所述第一图片、 所述第 一标注文件、 所述第二图片、 所述第二标注文件、 所述第三图片以及所述第三标注文件生成 数据集的步骤, 包括: 根据所述第三图片和所述第三标注文件 对所述第二模型进行训练, 获得第三模型; 通过所述第三模型对所述第一图片、 所述第二图片和所述第三图片进行标注, 获得目 标第一标注文件、 目标第二标注文件和目标第三标注文件; 根据所述第一图片、 所述目标第一标注文件、 所述第二图片、 所述目标第二标注文件、 所述第三图片以及所述目标第三标注文件生成数据集。 5.如权利要求2所述的数据集生成方法, 其特征在于, 所述根据 所述第三图片和所述第 三标注文件 对所述第二模型进行训练, 获得第三模型的步骤, 包括: 在第二模型的卷积基上训练所述第三图片和所述第三标注文件; 根据训练后的第三图片和第三标注文件对第二模型的分类器进行训练, 获得第三模 型。 6.如权利要求1至5中任一项所述的数据集生成方法, 其特征在于, 所述根据所述第二 图片和所述第二标注文件 对所述第一模型进行训练, 获得第二模型的步骤之前, 包括: 在所述第二标注文件中存在误标时, 获取 所述第二标注文件中误标图片的识别框; 调整所述第二标注文件中误标图片的识别框, 获得调整后的第二标注文件。 7.如权利要求1至5中任一项所述的数据集生成方法, 其特征在于, 所述根据所述第一 图片、 所述第一标注文件、 所述第二图片、 所述第二标注文件、 所述第三图片以及所述第三 标注文件生成数据集的步骤, 还 包括: 对所述第一图片、 所述第一标注文件、 所述第二图片、 所述第二标注文件、 所述第三图 片以及所述第三标注文件进行 数据增强处 理; 根据增强后的所述第一图片、 所述第一标注文件、 所述第二图片、 所述第二标注文件、权 利 要 求 书 1/2 页 2 CN 115471696 A 2所述第三图片以及所述第三标注文件生成数据集。 8.一种数据集生成设备, 其特征在于, 所述数据集生成设备包括: 存储器、 处理器及存 储在所述存储器上并可在所述处理器上运行的数据集生成程序, 所述数据集生成程序被所 述处理器执行时实现如权利要求1至7中任一项所述的数据集 生成方法的步骤。 9.一种存储介质, 其特征在于, 所述存储介质上存储有数据集生成程序, 所述数据集生 成程序被处 理器执行时实现如权利要求1至7中任一项所述的数据集 生成方法的步骤。 10.一种数据集生成装置, 其特征在于, 所述数据集生成装置包括: 第 一训练模块、 第 一 标注模块、 第二训练模块、 第二标注模块以及数据生成模块; 所述第一训练模块, 用于根据第 一图片和第 一图片对应的第 一标注文件对预设模型进 行训练, 获得第一模型; 所述第一标注模块, 用于通过所述第一模型对第二图片进行标注, 获得所述第二图片 对应的第二标注文件; 所述第二训练模块, 用于根据 所述第二图片和所述第 二标注文件对所述第 一模型进行 训练, 获得第二模型; 所述第二标注模块, 用于通过所述第二模型对第三图片进行标注, 获得所述第三图片 对应的第三标注文件; 所述数据生成模块, 用于根据所述第一图片、 所述第一标注文件、 所述第二图片、 所述 第二标注文件、 所述第三图片以及所述第三标注文件生成数据集。权 利 要 求 书 2/2 页 3 CN 115471696 A 3

.PDF文档 专利 数据集生成方法、设备、存储介质及装置

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据集生成方法、设备、存储介质及装置 第 1 页 专利 数据集生成方法、设备、存储介质及装置 第 2 页 专利 数据集生成方法、设备、存储介质及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 16:43:24上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。