说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210515296.5 (22)申请日 2022.05.12 (71)申请人 南京大学 地址 210023 江苏省南京市栖霞区仙林大 道163号 (72)发明人 瞿裕忠 王妍佳 刘奇志  (74)专利代理 机构 南京天翼专利代理有限责任 公司 321 12 专利代理师 奚铭 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/211(2020.01) G06F 40/289(2020.01) (54)发明名称 一种数量型属性比较类句子理解方法、 设备 及存储介质 (57)摘要 一种数量型属性比较类句子理解方法、 设备 及存储介质, 包括输入预处理步骤、 句子识别步 骤、 论元抽取步骤、 输出生成步骤。 首先输入预处 理步骤会删除句子中与句子理解无关的内容, 对 句子进行词法、 句法分析; 然后句子识别步骤使 用触发词、 正则表达式和数量型属性词表对句子 进行识别; 其次论元抽取步骤根据句子模式和句 法结构从句子中抽取论元; 最后, 输出生成步骤 会识别句子中的时间地点信息, 并对识别出的论 元进行标准化, 得到结构化数据。 本发明提出了 一种有效理解数量型属性比较类句子的方法, 对 数量型属性比较类句子进行 理解, 生成计算机可 理解的结构化数据。 本发明易于部署且可实用性 强。 权利要求书2页 说明书6页 附图3页 CN 115114929 A 2022.09.27 CN 115114929 A 1.一种数量型属性比较类句子理解方法, 其特征在于, 将含有对数量型属性进行定量 比较的内容的句子, 生成计算机可理解的结构化数据, 包括: 输入预处理, 删除句子中与句子理解无关的内容, 对句子进行词法、 句法分析, 得到句 子的分词结果、 词性标注结果和句法树; 句子识别, 使用触发词、 正则表达 式和数量型属性词 表对预处理后的句子进行识别, 得 到数量型属性比较 类句子的细粒度类别; 论元抽取, 根据句子识别结果和句法结构从句子中抽取论元; 输出生成, 识别句子中的时间地点信息, 对识别出的论元进行标准化, 得到结构化数 据。 2.根据权利要求1所述的一种数量型属性比较类句子理解方法, 其特征在于, 所述输入 预处理步骤具体为: 步骤100, 确定处 理对象为 一个句子; 步骤101, 删除句子中的承接和提 示语, 去除与句子理解无关的内容; 步骤102, 对句子进行分词; 步骤103, 对句子分词后的结果进行词性标注; 步骤104, 基于分词和词性标注结果对句子进行句法分析。 3.根据权利要求1所述的一种数量型属性比较类句子理解方法, 其特征在于, 所述句子 识别步骤 对预处理后句子进行识别, 具体为: 步骤200, 根据专 家规则构建数量型属性词表; 步骤201, 设定数量型属性比较类句子识别的细粒度类别, 包括比较级、 最高级和变化 类句子; 步骤202, 为每种细粒度类别设计 触发词表; 步骤203, 为每种细粒度类别设计 触发词规则; 步骤204, 对预处 理后的句子遍历每种细粒度类别; 步骤205, 判断遍历是否结束, 如果是, 跳转到步骤21 1, 否则跳转到步骤20 6; 步骤206, 根据该类别的触发词表和触发规则对句子进行判定; 步骤207, 判定句子是否属于该类别, 如果是, 跳转到步骤208, 否则跳转到步骤204; 步骤208, 根据数量型属性词表进一 步进行判定; 步骤209, 判定是否是 数量型属性句子, 如果是, 跳转到步骤210, 否则跳转到步骤204; 步骤210, 返回当前 执行过程的细粒度类别为识别结果; 步骤211, 返回其它作为识别结果。 4.根据权利要求1所述的一种数量型属性比较类句子理解方法, 其特征在于, 所述论元 抽取根据句子细粒度类别、 触发词位置和句法树抽取语义模板 定义的论元, 具体为: 步骤300, 为每种细粒度类别设计 语义模板, 模板中包括待抽取的论元; 步骤301, 总结每种细粒度类别的句子模式; 步骤302, 根据句子识别的结果, 获取句子及其细粒度类别, 以及细粒度类别对应的触 发词的位置; 步骤303, 识别获得句子中辅助论元抽取的辅助词位置; 步骤304, 根据触发词和辅助词位置抽取论元;权 利 要 求 书 1/2 页 2 CN 115114929 A 2步骤305, 判断是否识别出所有待抽取论元, 如果是, 跳转到步骤307, 否则跳转到步骤 306; 步骤306, 利用句法结构规则抽取论元; 步骤307, 返回所有 待抽取论元的抽取 结果。 5.根据权利要求1所述的一种数量型属性比较类句子理解方法, 其特征在于, 所述输出 生成步骤具体为: 步骤400, 对句子中时间进行识别; 步骤401, 对句子中地 点进行识别; 步骤402, 对句子抽取的论元和时间地 点进行词义表达的标准 化; 步骤403, 根据标准 化结果作为句子解析 结果, 组织 为结构化数据; 步骤404, 返回结构化数据。 6.根据权利要求1所述的一种数量型属性比较类句子理解方法, 其特征在于, 含有对数 量型属性进行定量比较的内容的句 子为问答选择题形式, 将题干和每个选项进行拼接, 得 到一个句子作为处 理对象, 进行句子理解。 7.一种计算机设备, 其特征在于, 该计算机设备包括存储器、 处理器及存储在存储器上 并可在处理器上运行的计算机程序, 所述计算机程序执行时实现如权利要求1 ‑6中任一项 所述的数量型属性比较 类句子理解方法。 8.一种计算机可读存储介质, 其特征在于, 该计算机可读存储介质存储有执行如权利 要求1‑6中任一项所述的数量型属性比较 类句子理解方法的计算机程序。权 利 要 求 书 2/2 页 3 CN 115114929 A 3

.PDF文档 专利 一种数量型属性比较类句子理解方法、设备及存储介质

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数量型属性比较类句子理解方法、设备及存储介质 第 1 页 专利 一种数量型属性比较类句子理解方法、设备及存储介质 第 2 页 专利 一种数量型属性比较类句子理解方法、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:09:06上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。