说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210657254.5 (22)申请日 2022.06.10 (71)申请人 达而观数据 (成 都) 有限公司 地址 610000 四川省成 都市中国 (四川) 自 由贸易试验区成都市天府新区湖畔路 北段366号1栋3楼1号 (72)发明人 吴万杰 文敏 白良俊 纪传俊  纪达麒 陈运文  (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 马迪 (51)Int.Cl. G06V 30/148(2022.01) G06V 30/19(2022.01) G06V 30/41(2022.01)G06F 40/295(2020.01) G06F 40/30(2020.01) (54)发明名称 一种图像的语义识别方法、 装置、 设备和存 储介质 (57)摘要 本发明公开了一种图像的语义识别方法、 装 置、 设备和存储介质。 包括: 根据样本字符识别结 果进行训练获取信息抽取训练模 型; 对待测图像 进行光学字符识别获取待测字 符识别结果; 根据 待测字符识别结果进行分割处理获取待测语料, 将待测语料输入信息抽取训练模型获取待测图 像的语义识别结果。 通过较少的样 本字符识别结 果进行训练所 获取的信息抽取训练模 型, 来对待 测字符识别结果进行信息抽取, 从而在无需大量 标注数据的情况下, 就可以实现对 具有多样式文 本分布的图像进行有效的语义识别。 权利要求书2页 说明书9页 附图3页 CN 114898374 A 2022.08.12 CN 114898374 A 1.一种图像的语义识别方法, 其特 征在于, 包括: 根据样本 字符识别结果进行训练获取信息抽取训练模型; 对待测图像进行光学字符识别获取待测字符识别结果; 根据所述待测字符识别结果进行分割处理获取待测语料, 将所述待测语料输入所述信 息抽取训练模型获取 所述待测图像的语义识别结果。 2.根据权利要求1所述的方法, 其特征在于, 所述根据样本字符识别文本进行训练获取 信息抽取训练模型之前, 还 包括: 获取样本图像, 其中, 所述样本图像中包 含字符; 对所述样本图像进行光学字符识别获取包含文本信息和文本位置的所述样本字符识 别结果, 其中, 所述文本位置包含所述文本信息在所述样本图像的起始点位置、 高度和宽 度。 3.根据权利要求1所述的方法, 其特征在于, 所述根据样本字符识别结果进行训练获取 信息抽取训练模型, 包括: 对所述样本字符识别结果按照指定特征进行聚类获取初始簇团, 其中, 每个初始簇团 中包含至少一个完整语义; 对所述初始簇团进行去噪处理获取样本簇团, 并根据所述样本簇团进行训练获取信 息 抽取训练模型。 4.根据权利要求3所述的方法, 其特征在于, 所述根据所述样本簇团进行训练获取信 息 抽取训练模型, 包括: 确定实体抽取模板, 并根据 所述实体抽取模板和所述样本簇团构建训练语料, 其中, 每 个所述训练语料中包 含实体抽取模板的置信度; 根据所述训练语料对初始信息模型进行训练, 获取 所述信息抽取训练模型。 5.根据权利要求1所述的方法, 其特征在于, 所述对待测图像进行光学字符识别获取待 测字符识别结果, 包括: 对所述待测图像进行光学字符识别获取文本信息和文本位置的所述待测字符识别结 果, 其中, 所述文本位置包 含所述文本信息在所述待测图像的起始点 位置、 高度和宽度。 6.根据权利要求4所述的方法, 其特征在于, 所述根据所述待测字符识别结果进行分割 处理获取待测语料, 将所述待测语料输入所述信息抽取训练模型获取所述待测图像的语义 识别结果, 包括: 对所述待测字符识别结果进行聚类处 理获取待测簇团; 根据所述实体抽取模板和所述待测簇团构建待测语料, 其中, 每个待测语料对应至少 两个实体抽取模板; 将所述待测语料输入所述信 息抽取训练模型, 获取待测语料所对应的每个实体抽取模 板的语言概 率; 获取概率最高的实体抽取模板, 并将所述实体抽取模板对应的实体作为所述待测图像 的语义识别结果。 7.根据权利要求1所述的方法, 其特征在于, 所述将所述待测语料输入所述信 息抽取训 练模型获取 所述待测图像的语义识别结果之后, 还 包括: 对所述语义识别结果进行检测;权 利 要 求 书 1/2 页 2 CN 114898374 A 2当确定检测结果 不符合要求时进行报警提 示。 8.一种图像的语义识别装置, 其特 征在于, 包括: 模型训练模块, 用于根据样本 字符识别结果进行训练获取信息抽取训练模型; 待测字符识别结果获取模块, 用于对待测图像进行光学字符识别获取待测字符识别结 果; 语义识别模块, 用于根据所述待测字符识别结果进行分割处理获取待测语料, 将所述 待测语料输入所述信息抽取训练模型获取 所述待测图像的语义识别结果。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7中任一项所述的 方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指 令, 所述计算机指令用于使处 理器执行时实现权利要求1 ‑7中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114898374 A 3

.PDF文档 专利 一种图像的语义识别方法、装置、设备和存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种图像的语义识别方法、装置、设备和存储介质 第 1 页 专利 一种图像的语义识别方法、装置、设备和存储介质 第 2 页 专利 一种图像的语义识别方法、装置、设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:07:09上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。