说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210671093.5 (22)申请日 2022.06.14 (71)申请人 广州探迹科技有限公司 地址 510000 广东省广州市番禺区小谷围 街青蓝街26号5 03 (72)发明人 陈开冉 黎展 谢智权 黄东阳  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 陈志明 (51)Int.Cl. G06F 40/295(2020.01) G06F 40/30(2020.01) G06F 40/247(2020.01) G06F 40/242(2020.01) G06K 9/62(2022.01) (54)发明名称 一种基于提示的命名实体识别方法、 装置及 终端设备 (57)摘要 本发明公开了本发明提供了一种基于提示 的命名实体识别方法、 装置及终端设备, 通过结 合待测语句与提示语集合中的提示语, 将结合提 示语的待测语句输入到预训练模型中进行命名 实体的识别, 相比于现有技术通过大量的计算资 源和微调数据进行预训练模型微调, 本发明通过 提示语的设计, 能够挖掘预训练模 型潜在的语义 能力, 使得预训练模型在提示语的作用下则增强 了识别效果, 有利于预训练模型能够依据少量数 据进行命名实体识别, 从而提高了命名实体识别 的效率。 权利要求书2页 说明书10页 附图2页 CN 115034223 A 2022.09.09 CN 115034223 A 1.一种基于提 示的命名实体识别方法, 其特 征在于, 包括: 获取待测语句; 根据预设的提 示语集合, 获得所述待测语句的提 示语; 将所述待测语句和所述提示语, 输入至预训练模型中, 获得所述待测语句的生成式命 名实体。 2.根据权利要求1所述的基于提示的命名实体识别方法, 其特征在于, 在所述获得所述 待测语句的生成式命名实体之后, 还 包括: 通过预设的同义词集合对所述生成式命名实体进行映射, 获得生成式命名实体的若干 个同义词汇; 根据所述若干个同义词汇, 分别与所述待测语句进行匹配, 获得最优 命名实体。 3.根据权利要求2所述的基于提示的命名实体识别方法, 其特征在于, 所述根据 所述若 干个同义词汇, 与所述待测语句进行匹配, 获得最优 命名实体, 具体为: 根据所述若干个同义词汇, 分别与待测语句的每 个语句进行匹配, 获得相似度; 根据相似度最高的同义词汇, 获得 所述最优命名实体。 4.根据权利要求3所述的基于提示的命名实体识别方法, 其特征在于, 所述提示语集合 的训练方法, 包括: 获取待训练实体类型, 将所述待训练实体类型输入至词向量模型中, 获得所述待训练 实体类型的词向量; 根据所述待训练实体类型的词向量, 通过余弦距离计算, 获得若干个待训练实体类型 的相似词; 其中, 所述待训练实体类型 的词向量分别与所述若干个相似词的词向量之间的 余弦距离小于预设值; 根据所述待训练实体 类型和所述若干个相似词, 设计若干个待选提 示语; 分别测试所述若干个待选提示语的验证指标, 根据验证指标达到预设值的待选提示 语, 获得所述提示语集合。 5.根据权利要求2所述的基于提示的命名实体识别方法, 其特征在于, 所述同义词集合 的训练方法, 包括: 获取命名词典; 其中, 所述命名词典由开源数据构建; 根据所述命名词典中的每 个原词汇, 通过词向量模型, 获得每 个所述原词汇的相似词; 分别测试每个所述原词汇的相似词的验证指标, 根据验证指标达到预设值的相似词, 作为每个所述原词汇的同义词汇; 汇总每个所述原词汇以及对应的同义词汇, 获得 所述同义词集 合。 6.根据权利要求3至5任一所述的基于提示的命名实体识别方法, 其特征在于, 所述词 向量模型的训练方法, 包括: 获取命名词典; 其中, 所述命名词典由开源数据构建; 根据所述命名词典的所有词汇, 分别输入至预训练模型中, 获得每 个词汇的高维向量; 根据每个词汇的高维向量, 获得每 个词汇的词向量。 7.根据权利要求2所述的基于提示的命名实体识别方法, 其特征在于, 所述将所述待测 语句和所述 提示语, 输入至预训练模型中, 获得 所述待测语句的生成式命名实体, 具体为: 所述提示语包括若干个备选提 示语;权 利 要 求 书 1/2 页 2 CN 115034223 A 2将所述待测语句分别和所述若干个备选提 示语互相组合, 获得若干个拼接语句; 将所述若干个拼接语句分别输入到预训练模型中, 获得若干个待选命名实体; 在所述若干个待选命名实体中, 计算重合度, 将重合度最高的待选命名实体输出为生 成式命名实体。 8.一种基于提示的命名实体识别装置, 其特征在于, 包括: 数据获取模块、 提示语获取 模块和数据生成模块; 所述数据获取模块, 用于获取待测语句; 所述提示语获取模块, 用于根据预设的提 示语集合, 获得所述待测语句的提 示语; 所述数据生成模块, 用于将所述待测语句和所述提示语, 输入至预训练模型中, 获得所 述待测语句的生成式命名实体。 9.一种计算机终端设备, 其特征在于, 包括处理器、 存储器以及存储在所述存储器 中且 被配置为由所述处理器执行的计算机程序, 所述处理器执行所述计算机程序时实现如权利 要求1至7中任意 一项所述的一种基于提 示的命名实体识别方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质包括存储的计算 机程序, 其中, 在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权 利要求1至7中任意 一项所述的一种基于提 示的命名实体识别方法。权 利 要 求 书 2/2 页 3 CN 115034223 A 3

.PDF文档 专利 一种基于提示的命名实体识别方法、装置及终端设备

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于提示的命名实体识别方法、装置及终端设备 第 1 页 专利 一种基于提示的命名实体识别方法、装置及终端设备 第 2 页 专利 一种基于提示的命名实体识别方法、装置及终端设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:07:55上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。