说明:收录90万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210657254.5 (22)申请日 2022.06.10 (71)申请人 达而观数据 (成 都) 有限公司 地址 610000 四川省成 都市中国 (四川) 自 由贸易试验区成都市天府新区湖畔路 北段366号1栋3楼1号 (72)发明人 吴万杰 文敏 白良俊 纪传俊 纪达麒 陈运文 (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 马迪 (51)Int.Cl. G06V 30/148(2022.01) G06V 30/19(2022.01) G06V 30/41(2022.01)G06F 40/295(2020.01) G06F 40/30(2020.01) (54)发明名称 一种图像的语义识别方法、 装置、 设备和存 储介质 (57)摘要 本发明公开了一种图像的语义识别方法、 装 置、 设备和存储介质。 包括: 根据样本字符识别结 果进行训练获取信息抽取训练模 型; 对待测图像 进行光学字符识别获取待测字 符识别结果; 根据 待测字符识别结果进行分割处理获取待测语料, 将待测语料输入信息抽取训练模型获取待测图 像的语义识别结果。 通过较少的样 本字符识别结 果进行训练所 获取的信息抽取训练模 型, 来对待 测字符识别结果进行信息抽取, 从而在无需大量 标注数据的情况下, 就可以实现对 具有多样式文 本分布的图像进行有效的语义识别。 权利要求书2页 说明书9页 附图3页 CN 114898374 A 2022.08.12 CN 114898374 A 1.一种图像的语义识别方法, 其特 征在于, 包括: 根据样本 字符识别结果进行训练获取信息抽取训练模型; 对待测图像进行光学字符识别获取待测字符识别结果; 根据所述待测字符识别结果进行分割处理获取待测语料, 将所述待测语料输入所述信 息抽取训练模型获取 所述待测图像的语义识别结果。 2.根据权利要求1所述的方法, 其特征在于, 所述根据样本字符识别文本进行训练获取 信息抽取训练模型之前, 还 包括: 获取样本图像, 其中, 所述样本图像中包 含字符; 对所述样本图像进行光学字符识别获取包含文本信息和文本位置的所述样本字符识 别结果, 其中, 所述文本位置包含所述文本信息在所述样本图像的起始点位置、 高度和宽 度。 3.根据权利要求1所述的方法, 其特征在于, 所述根据样本字符识别结果进行训练获取 信息抽取训练模型, 包括: 对所述样本字符识别结果按照指定特征进行聚类获取初始簇团, 其中, 每个初始簇团 中包含至少一个完整语义; 对所述初始簇团进行去噪处理获取样本簇团, 并根据所述样本簇团进行训练获取信 息 抽取训练模型。 4.根据权利要求3所述的方法, 其特征在于, 所述根据所述样本簇团进行训练获取信 息 抽取训练模型, 包括: 确定实体抽取模板, 并根据 所述实体抽取模板和所述样本簇团构建训练语料, 其中, 每 个所述训练语料中包 含实体抽取模板的置信度; 根据所述训练语料对初始信息模型进行训练, 获取 所述信息抽取训练模型。 5.根据权利要求1所述的方法, 其特征在于, 所述对待测图像进行光学字符识别获取待 测字符识别结果, 包括: 对所述待测图像进行光学字符识别获取文本信息和文本位置的所述待测字符识别结 果, 其中, 所述文本位置包 含所述文本信息在所述待测图像的起始点 位置、 高度和宽度。 6.根据权利要求4所述的方法, 其特征在于, 所述根据所述待测字符识别结果进行分割 处理获取待测语料, 将所述待测语料输入所述信息抽取训练模型获取所述待测图像的语义 识别结果, 包括: 对所述待测字符识别结果进行聚类处 理获取待测簇团; 根据所述实体抽取模板和所述待测簇团构建待测语料, 其中, 每个待测语料对应至少 两个实体抽取模板; 将所述待测语料输入所述信 息抽取训练模型, 获取待测语料所对应的每个实体抽取模 板的语言概 率; 获取概率最高的实体抽取模板, 并将所述实体抽取模板对应的实体作为所述待测图像 的语义识别结果。 7.根据权利要求1所述的方法, 其特征在于, 所述将所述待测语料输入所述信 息抽取训 练模型获取 所述待测图像的语义识别结果之后, 还 包括: 对所述语义识别结果进行检测;权 利 要 求 书 1/2 页 2 CN 114898374 A 2当确定检测结果 不符合要求时进行报警提 示。 8.一种图像的语义识别装置, 其特 征在于, 包括: 模型训练模块, 用于根据样本 字符识别结果进行训练获取信息抽取训练模型; 待测字符识别结果获取模块, 用于对待测图像进行光学字符识别获取待测字符识别结 果; 语义识别模块, 用于根据所述待测字符识别结果进行分割处理获取待测语料, 将所述 待测语料输入所述信息抽取训练模型获取 所述待测图像的语义识别结果。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7中任一项所述的 方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指 令, 所述计算机指令用于使处 理器执行时实现权利要求1 ‑7中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114898374 A 3
专利 一种图像的语义识别方法、装置、设备和存储介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:07:09
上传分享
举报
下载
原文档
(539.6 KB)
分享
友情链接
数据安全评估师ccrc-dsa.pdf
NY-T 4047-2021 家禽精液品质检测方法.pdf
T-CSAC 004—2023 网络靶场 试验任务导调总体要求.pdf
GB-T 42938-2023 资产管理 人员参与和能力指南.pdf
GB-T 36670-2018 城市道路交通组织设计规范.pdf
T-CSAE 82—2018 能量回馈式整车动力学控制系统耐久 性能要求及台架试验方法.pdf
供应商安全管理制度.pdf
专利 黑产设备的确定方法、装置及服务器.PDF
GB 7000.204-2008 灯具 第2-4部分:特殊要求 可移式通用灯具.pdf
GB-T 15909-2017 电子工业用气体 硅烷.pdf
GB-T 37961-2019 信息技术服务 服务基本要求.pdf
GB-T 40765-2021 基础地理信息本体模型.pdf
GB-T 43443-2023 物联网 智慧农业信息系统接口要求.pdf
DB14-T 2374-2021 行政审批事项服务指南编制规范 山西省.pdf
GB-T 38332-2019 智能电网用户自动需求响应 集中式空调系统终端技术条件.pdf
GB-T 19828-2018 食盐定点生产企业质量管理技术规范.pdf
GBT 40861-2021 汽车信息安全通用技术要求.pdf
GB 26783-2011 消防救生照明线.pdf
GB-T 21296.1-2020 动态公路车辆自动衡器 第1部分:通用技术规范.pdf
云原生安全白皮书中文版第二版.pdf
1
/
3
15
评价文档
赞助2.5元 点击下载(539.6 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。