说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210765141.7 (22)申请日 2022.06.30 (71)申请人 华人运通 (上海) 云计算科技有限公 司 地址 201100 上海市闵行区苏召路1628号2 幢C075室 (72)发明人 丁磊 葛超  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 麦小婵 (51)Int.Cl. G10L 15/22(2006.01) G10L 15/26(2006.01) G06F 16/35(2019.01) G06F 40/253(2020.01)G06F 40/295(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 一种工程化实现自然语义处理的方法、 装 置、 设备及系统 (57)摘要 本发明公开了一种工程化实现自然语义处 理的方法、 装置、 设备及系统, 所述方法包括: 获 取用户发出的待执行语音指令经语音识别后的 文字信息; 根据训练后的文本分类模 型和训练后 的命名实体识别模型对文字信息进行处理, 获得 待执行语音指令的第一领域信息、 第一意图信息 和第一槽位信息; 对第一领域信息、 第一意图信 息和第一槽位信息进行归一化映射处理, 获得第 二领域信息、 第二意图信息和第二槽位信息; 根 据第二领域信息、 第二意图信息和第二槽位信 息, 并利用待执行语音指令的上下文信息, 执行 待执行语音指令, 获得指令执行结果。 采用本发 明的技术方案能够适用于不同车型、 不同引擎, 提高方案的自适应性, 保证语音指令执行结果的 准确性。 权利要求书2页 说明书12页 附图4页 CN 115171686 A 2022.10.11 CN 115171686 A 1.一种工程 化实现自然语义处 理的方法, 其特 征在于, 包括: 获取用户发出的待执 行语音指令经语音识别后的文字信息; 根据训练后的文本分类模型和训练后的命名实体识别模型对所述文字信 息进行处理, 获得所述待执 行语音指令对应的第一领域信息、 第一 意图信息和第一槽位信息; 对所述第一领域信息、 所述第一意图信息和所述第一槽位信息进行归一化映射处理, 对应获得第二领域信息、 第二 意图信息和第二槽位信息; 根据所述第二领域信息、 所述第二意图信息和所述第二槽位信息, 并利用所述待执行 语音指令对应的上 下文信息, 执 行所述待执 行语音指令, 获得指令执 行结果。 2.如权利要求1所述的工程化实现自然语义处理的方法, 其特征在于, 所述方法通过以 下步骤获得 所述训练后的文本分类模型和所述训练后的命名实体识别模型: 生成文本分类 语料、 命名实体识别语料、 词向量文件、 目标向量文件和停用词文件; 根据所述文本分类语料、 所述词向量文件和所述停用词文件, 对预设的文本分类模型 进行训练, 获得 所述训练后的文本分类模型; 根据所述命名实体识别语料、 所述目标向量文件和所述停用词文件, 对预设的命名实 体识别模型进行训练, 获得训练后的命名实体识别模型。 3.如权利要求2所述的工程化实现自然语义处理的方法, 其特征在于, 所述方法通过以 下步骤生成所述文本分类 语料和所述命名实体识别语料: 基于JSGF规则, 增 加Rule引用、 Gram mar引用和若干个 基础规则, 形成HGF规则; 对基于HGF规则的HGF语法表达式进行语法解析, 获得所述文本分类语料和所述命名实 体识别语料; 其中, 所述文本 分类语料中包括至少一个H GF语法表达式所对应的至少一条指 令, 所述命名实体识别语料中包括至少一个HGF语法表达式所对应的至少一条指令 。 4.如权利要求3所述的工程化实现自然语义处理的方法, 其特征在于, 所述方法还包 括: 对于每一个HGF语法表达式, 当同一个HGF语法表达式所对应的指令的数量大于预设数 量阈值时, 将同一个H GF语法表达式所对应的指 令按照8:1:1的比例添加到模型训练的训练 集、 测试集和开发集中; 对于每一个HGF语法表达式, 当同一个HGF语法表达式所对应的指令的数量不大于预设 数量阈值时, 将同一个HGF语法表达式所对应的指令全部添加到模型训练的训练集中。 5.如权利要求2所述的工程化实现自然语义处理的方法, 其特征在于, 所述根据 所述文 本分类语料、 所述词向量文件和所述停用词文件, 对预设的文本 分类模型进行训练, 获得所 述训练后的文本分类模型, 具体包括: 将所述文本分类语料、 所述词向量文件和所述停用词文件划分为训练集、 开发集和测 试集; 根据所述训练集、 所述开发集和所述测试集对所述预设的文本分类模型进行训练, 获 得第一文本分类模型; 获取训练过程中生成的模型文件, 并根据所述模型文件进行模型 预测, 获得 预测结果; 当所述预测结果中存在异常预测结果时, 将所述异常预测结果添加到所述训练集中, 获得添加后的训练集; 根据所述添加后的训练集、 所述开发集和所述测试集对所述第 一文本分类模型进行训权 利 要 求 书 1/2 页 2 CN 115171686 A 2练及迭代, 获得 所述训练后的文本分类模型。 6.如权利要求5所述的工程化实现自然语义处理的方法, 其特征在于, 每一个语料集中 均包括至少一条基于预设的向量映射规则进行映射获得的固定格式指令; 其中, 所述语料 集包括所述训练集、 所述开发集和所述测试集; 每一条固定格式指令均由目标部分和内容 部分组成, 所述目标部 分包含用户语音指令的领域信息、 意图信息和置信度, 所述内容部分 包含用户语音指令的指令信息 。 7.如权利要求1~6中任一项所述的工程化实现自然语义处理的方法, 其特征在于, 所 述方法还 包括: 基于里程碑管理不同模型的不同版本; 当在里程碑中构建新模型 版本时, 设置所述 新模型版本对应的领域和意图; 当用户语音指令中包含版本信息时, 查找所述版本信息对应的模型, 并根据找到的模 型对用户语音指令进行 预测, 获得指令预测结果。 8.一种工程化实现自然语义处理的装置, 其特征在于, 用于实现如权利要求1~7中任 一项所述的工程 化实现自然语义处 理的方法, 所述装置包括: 文字信息获取模块, 用于获取用户发出的待执 行语音指令经语音识别后的文字信息; 文字语义理解模块, 用于根据训练后的文本分类模型和训练后的命名实体识别模型对 所述文字信息进行处理, 获得所述待执行语音指令对应的第一领域信息、 第一意图信息和 第一槽位信息; 归一化处理模块, 用于对所述第一领域信息、 所述第一意图信息和所述第一槽位信息 进行归一 化映射处 理, 对应获得第二领域信息、 第二 意图信息和第二槽位信息; 语音指令执行模块, 用于根据所述第二领域信息、 所述第二意图信息和所述第二槽位 信息, 并利用所述待 执行语音指 令对应的上下文信息, 执行所述待 执行语音指 令, 获得指 令 执行结果。 9.一种终端设备, 其特征在于, 包括处理器、 存储器以及存储在所述存储器中且被配置 为由所述处理器执行的计算机程序, 所述处理器在执行所述计算机程序时实现如权利要求 1~7中任一项所述的工程 化实现自然语义处 理的方法。 10.一种工程化实现自然语义处理的系统, 其特征在于, 所述系统包括车端和云端; 其 中, 所述车端, 用于接收用户发出的待执行语音指令, 对所述待执行语音指令进行语音识 别, 获得文字信息, 并将所述文字信息上传到所述云端; 所述云端, 用于根据 所述文字信息实现如权利要求1~7中任一项所述的工程化实现自 然语义处 理的方法, 获得指令执 行结果, 并将所述指令执 行结果发送至所述车端; 所述车端, 还用于根据所述指令执 行结果形成语音信息, 并播报所述语音信息 。权 利 要 求 书 2/2 页 3 CN 115171686 A 3

.PDF文档 专利 一种工程化实现自然语义处理的方法、装置、设备及系统

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种工程化实现自然语义处理的方法、装置、设备及系统 第 1 页 专利 一种工程化实现自然语义处理的方法、装置、设备及系统 第 2 页 专利 一种工程化实现自然语义处理的方法、装置、设备及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:08:55上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。