说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210688597.8 (22)申请日 2022.06.17 (71)申请人 中原工学院 地址 450007 河南省郑州市中原中路41号 (72)发明人 买志玉 赵冬 马超凡  (74)专利代理 机构 成都鱼爪智云知识产权代理 有限公司 513 08 专利代理师 严成 (51)Int.Cl. G06F 40/30(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于人工智能的自然语言处理方法及 系统 (57)摘要 本发明提出了一种基于人工智能的自然语 言处理方法及系统, 涉及计算机处理技术领域。 该方法包括: 获取待处理语言语句。 将待处理语 言语句输入至语 言类型匹配模型中, 得到所有语 言类型。 根据所有语言类型, 划分待处理语言语 句, 得到仅使用一种语言类型的待处理字词句。 针对各个语言类型, 将待处理语言语句转换为多 个格式化语句。 基于任一格式化语句使用的语言 类型, 将该格式化语句输入至对应的自然语言处 理模型中。 自然语 言处理模型根据格式化语句中 语句内字词关系和语句关系对格式化语句进行 语义分析处理, 得到语义解析结果。 根据所有语 义解析结果, 将待处理语言语句转换为人工语言 得到的自然语 言处理结果, 避免了计算机交互处 理的偏差和错 误。 权利要求书2页 说明书9页 附图3页 CN 114997178 A 2022.09.02 CN 114997178 A 1.一种基于人工智能的自然语言处 理方法, 其特 征在于, 包括如下步骤: 获取待处 理语言语句, 所述待处 理语言语句至少使用一种语言类型; 将所述待处理语言语句输入至语言类型匹配模型中, 得到该待处理语言语句使用的所 有语言类型; 根据所有语言类型, 对所述待处理语言语句进行划分, 得到多个待处理字词句, 其中, 任一所述待处 理字词句仅使用一种语言类型; 按照各个语言类型, 依次将所述待处理语言语句转换为多个格式化语句, 任一所述格 式化语句仅使用一种语言类型且该格式化语句中包 含对应语言类型的所有 待处理字词句; 基于任一格式化语句使用的语言类型, 将该格式化语句输入至对应的自然语言处理模 型中, 得到对应的语义解析结果, 所述自然语言处理模型为利用语句内字词关系相似度和 语句相似度对 对应语言类型的基础字词匹配模型进行 更新得到的模型; 根据所有格式化语句的语义解析结果, 按照预置人工语言格式, 将所述待处理语言语 句转换为人工语言, 得到自然语言处 理结果。 2.根据权利要求1所述的基于人工智能的自然语言处理方法, 其特征在于, 所述基于任 一格式化语句使用的语言类型, 将该格式化语句输入至对应的自然语言处理模型中, 得到 对应的语义 解析结果的步骤之前, 还 包括: 根据任一格式化语句使用的语言类型, 获取多个第一训练样本和多个第二训练样本, 所述第一训练样本包括语句间相似度高于第一相似度的多个语句, 所述第二训练样本包括 语句内字词间相似度高于第二相似度的多个 语句; 基于该格式化语句使用的语言类型, 获取训练好的基础字词匹配模型; 将所述多个第 一训练样本输入至训练好的基础字词匹配模型, 得到所述基础字词匹配 模型的第一处 理偏差值; 将所述多个第 二训练样本输入至训练好的基础字词匹配模型, 得到所述基础字词匹配 模型的第二处 理偏差值; 基于所述第 一处理偏差值和所述第 二处理偏差值, 对训练好的基础字词匹配模型进行 更新, 得到该语言类型对应的自然语言处 理模型。 3.根据权利要求2所述的基于人工智能的自然语言处理方法, 其特征在于, 基于所述第 一处理偏差值和所述第二处理偏差值, 对训练好的基础字词匹配模型进行更新, 得到该语 言类型对应的自然语言处 理模型的步骤之后, 还 包括: 获取与该语言类型相匹配的测试 数据库; 利用所述测试 数据库测试 该语言类型对应的自然语言处 理模型, 生成测试报告; 根据所述测试报告, 对所述自然语言处 理模型进行调整优化。 4.根据权利要求2所述的基于人工智能的自然语言处理方法, 其特征在于, 所述基于该 格式化语句使用的语言类型, 获取训练好的基础字词匹配模型的步骤之前, 还 包括: 根据所有语言类型, 建立多个基础字词 匹配模型, 所述基础字词 匹配模型与所述语言 类型一一对应; 基于任一基础字词 匹配模型对应的语言类型, 获取多个第三训练样本, 所述第三训练 样本包括使用该语言类型的多个字词句; 利用所述多个第 三训练样本训练所述基础字词匹配模型, 得到训练好的基础字词匹配权 利 要 求 书 1/2 页 2 CN 114997178 A 2模型。 5.根据权利要求1所述的基于人工智能的自然语言处理方法, 其特征在于, 所述按照各 个语言类型, 依次将所述待处 理语言语句转换为多个 格式化语句的步骤 包括: 针对任一语言类型, 将所述待处理语言语句中使用该语言类型的待处理字词句进行保 留, 且将使用其 他语言类型的待处 理字词句替换为预设符号, 以得到对应 格式化语句。 6.根据权利要求1所述的基于人工智能的自然语言处理方法, 其特征在于, 将所述待处 理语言语句输入至语言类型匹配模型中, 得到该待处理语言语句使用的所有语言类型的步 骤包括: 获取各个语言类型对应的语料库, 并利用所有语料库构建语言类型匹配模型; 所述语言类型匹配模型将所述待处理语言语句中的每个字与 所有语料库进行对比, 以 判断所述待处 理语言语句中所有字的语言类型。 7.根据权利要求1所述的基于人工智能的自然语言处理方法, 其特征在于, 所述待处理 语言语句包括口头语言和书面语言。 8.一种基于人工智能的自然语言处 理系统, 其特 征在于, 包括: 待处理语言语句 获取模块, 用于获取待处理语言语句, 所述待处理语言语句至少使用 一种语言类型; 语言类型匹配模块, 用于将所述待处理语言语句输入至语言类型匹配模型中, 得到该 待处理语言语句使用的所有语言类型; 语句划分模块, 用于根据 所有语言类型, 对所述待处理语言语句进行划分, 得到多个待 处理字词句, 其中, 任一所述待处 理字词句仅使用一种语言类型; 格式化语句转换模块, 用于按照各个语言类型, 依次将所述待处理语言语句转换为多 个格式化语句, 任一所述格式化语句仅使用一种语言类型且该格式化语句中包含对应语言 类型的所有 待处理字词句; 语义解析模块, 用于基于任一格式化语句使用的语言类型, 将该格式化语句输入至对 应的自然语言处理模型中, 得到对应的语义解析结果, 所述自然语言处理模型为利用语句 内字词关系相似度和语句相似度对对应语言类型的基础字词匹配模型进行更新得到的模 型; 语言转换模块, 用于根据 所有格式化语句的语义解析结果, 按照预置人工语言格式, 将 所述待处 理语言语句转换为人工语言, 得到自然语言处 理结果。 9.一种电子设备, 其特 征在于, 包括: 存储器, 用于存 储一个或多个程序; 处理器; 当所述一个或多个程序被所述处理器执行时, 实现如权利要求1 ‑7中任一项所述的方 法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被 处理器执行时实现如权利要求1 ‑7中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114997178 A 3

.PDF文档 专利 一种基于人工智能的自然语言处理方法及系统

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于人工智能的自然语言处理方法及系统 第 1 页 专利 一种基于人工智能的自然语言处理方法及系统 第 2 页 专利 一种基于人工智能的自然语言处理方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:07:21上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。