说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210803847.8 (22)申请日 2022.07.07 (71)申请人 安徽芯智科技有限公司 地址 230000 安徽省合肥市高新区习友路 3333号中 国(合肥)国际智能语音产业 园研发中心 楼611-111室 (72)发明人 王诗林  (74)专利代理 机构 合肥正则元起专利代理事务 所(普通合伙) 3416 0 专利代理师 李敏 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/31(2019.01) G06F 40/247(2020.01)G06F 40/253(2020.01) G06F 40/30(2020.01) G10L 15/26(2006.01) (54)发明名称 一种文本理解、 意图提取方法 (57)摘要 本发明公开了一种文本理解、 意图提取方 法, 涉及人工智 能技术领域, 解决了自然语言理 解过度依赖初始模板定义以及AI模型使用成本 高的技术问题; 方法包括: 步骤一: 智能语音 转换 模块获取需要进行文本理解和意图提取的目标 文本信息; 步骤二: 文本处理模块根据目标文本 信息内容加载语 法文件, 并输出所述目标文本信 息的意图; 并由文本转语音模块将目标文本信息 的意图转为音频信息; 步骤三: 多次重复输入目 标文本信息, 直到用户确认输出的意图的正确 性, 并记录用户确认之后的目标文本信息匹配的 意图; 实现了语法文件的泛化拓展复用, 编写少 量的语法文件即可覆盖大多数语义说法, 大大降 低了传统模板的维护成本、 开发 成本。 权利要求书1页 说明书4页 附图1页 CN 115186076 A 2022.10.14 CN 115186076 A 1.一种文本理解、 意图提取 方法, 应用于人机对话系统, 其特 征在于, 包括: 步骤一: 智能语音转换模块获取需要 进行文本理解和意图提取的目标文本信息; 步骤二: 文本处理模块根据目标文本信息内容加载语法文件, 并输出所述目标文本信 息的意图; 并由文本转语音模块将目标文本信息的意图转 为音频信息; 步骤三: 多次重复输入目标文本信 息, 直到用户确 认输出的意图的正确性, 并记录用户 确认之后的目标文本信息匹配的意图。 2.根据权利要求1所述的一种文本理解、 意图提取方法, 其特征在于, 所述智能语音转 换模块用于将自然语言的音频信息转换为文本信息; 所述文本处理模块用于对文本信息进 行处理; 所述文本转语音模块用于将文本处理模块处理过的文本信息的意图转换为自然语 言的音频信息 。 3.根据权利要求1所述的一种文本理解、 意图提取 方法, 其特 征在于, 所述目标文本信息的语义理解和意图提取的语法文件设定如下: S01: 设定对所述目标文本信息进行语义理解和意图提取的场景, 即人机对话支持的系 统或软件; S02: 设定语法对所述目标文本信息进行语义理解和意图提取的方法复用至多种系统 或软件; S03: 自定义自然语言中出现的某类词语的多种说法, 即一类词语设定有若干个与此类 词语意思相近相同形式的词语、 意思相近不同形式的词语以及同属一个领域的词语; S04: 设定语法对所述目标文件信息的关键词槽进行提取; S05: 设定通用句式, 所述通用句式为一种拓展说法, 符合所述通用句式的目标文本信 息即可匹配所述 通用句式表示的意图。 4.根据权利要求1所述的一种文本理解、 意图提取 方法, 其特 征在于, 对所述目标文本信息按照语法文件进行文本理解和意图理解的处 理过程如下: a1: 所述文本处 理模块获取 所述目标文本信息; a2: 所述文本处理模块对所述目标文本信息的关键词槽进行提取, 将所述目标文本信 息中的关键词槽匹配至通用句式; a3: 所述文本处理模块将所述目标文本信息与各种通用句式匹配, 并将其中匹配度较 高的意图输出。 5.根据权利要求1所述的一种文本理解、 意图提取 方法, 其特 征在于, 关键词语法拓展为多个领域; 关键词语法泛化, 即由具体的、 个别的关键词扩大为一般 的; 关键词语法重复使用。 6.根据权利要求1所述的一种文本理解、 意图提取 方法, 其特 征在于, 所述语法文件的数据存 储结构为 树形。权 利 要 求 书 1/1 页 2 CN 115186076 A 2一种文本理解、 意 图提取方 法 技术领域 [0001]本发明属于人工智能领域, 涉及自然语言理解技术, 具体是一种文本理解、 意图提 取方法。 背景技术 [0002]目前常见的自然语言理解分为传统的基于规则模板引擎和基于机器学习的AI模 型, 两种方式在实际生产中都有大量使用, 但是存在配置复杂不灵活和成本过高的问题。 [0003]基于规则模板引擎的语义理解, 极度依赖于初始模板 的定义, 对语句说法的支持 不足, 日常生活中同一个意图会存在多种说法, 这样模板需要 大量配置来满足功能, 不然必 须按照模板的特定句式输入, 才能正确处 理意图。 [0004]基于机器学习的AI模型依赖大量的标注文本训练, 存在学习使用成本过高的问 题。 [0005]因此, 本发明提出了一种文本理解、 意图提取 方法。 发明内容 [0006]本发明旨在至少解决现有技术中存在的技术问题之一。 为此, 本发明提出一种文 本理解、 意图提取方法, 该一种文本理解、 意图提取方法解决了自然语 言理解过度 依赖初始 模板定义以及AI模型使用成本高的问题。 [0007]为实现上述目的, 根据本发明的第一方面的实施例提出一种文本理解、 意图提取 方法, 应用于人机对话系统, 包括: [0008]步骤一: 智能语音转换模块获取需要 进行文本理解和意图提取的目标文本信息; [0009]步骤二: 文本处理模块根据目标文本信息内容加载语法文件, 并输出所述目标文 本信息的意图; 并由文本转语音模块将目标文本信息的意图转 为音频信息; [0010]步骤三: 多次重复输入目标文本信息, 直到用户确认输出的意图的正确性, 并记录 用户确认之后的目标文本信息匹配的意图。 [0011]进一步地, 所述智能语音转换模块用于将自然语言的音频信息转换为文本信息; 所述文本处理模块用于对文本信息进 行处理; 所述文本转语音模块用于将文本处理模块处 理过的文本信息的意图转换为自然语言的音频信息 。 [0012]进一步地, 所述目标文本信息的语义理解和意图提取的语法文件设定如下: [0013]S01: 设定对所述目标文本信息进行语义理解和意图提取的场景, 即人机对话支持 的系统或软件; [0014]S02: 设定语法对所述目标文本信息进行语义理解和意图提取的方法复用至多种 系统或软件; [0015]S03: 自定义自然语言中出现的某类词语的多种说法, 即一类词语设定有若干个与 此类词语意思相近相同形式的词语、 意思相近不同形式的词语以及同属一个领域的词语; [0016]S04: 设定语法对所述目标文件信息的关键词槽进行提取;说 明 书 1/4 页 3 CN 115186076 A 3

.PDF文档 专利 一种文本理解、意图提取方法

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种文本理解、意图提取方法 第 1 页 专利 一种文本理解、意图提取方法 第 2 页 专利 一种文本理解、意图提取方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:09:17上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。