说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210793159.8 (22)申请日 2022.07.05 (71)申请人 车智互联 (北京) 科技有限公司 地址 100080 北京市海淀区丹棱 街3号B座 11层1110、 1111室 (72)发明人 吴锡坤 战立涛 杨雷  (74)专利代理 机构 北京思睿峰知识产权代理有 限公司 1 1396 专利代理师 高攀 赵爱军 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/9535(2019.01) G06F 40/295(2020.01) G06F 40/30(2020.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于问答库的信息检索方法、 问答系统 及计算设备 (57)摘要 本公开公开了一种基于问答库的信息检索 方法、 问答系统及计算设备, 其中, 问答库包含至 少一个问题及各问题对应的至少一个答案, 作为 各问题的答案集合, 基于问答库的信息检索方法 包括: 响应于用户查询, 从问答库中确定召回的 问题及召回问题对应的候选答案子集, 作为召回 的至少一个问答对, 其中候选答案子集来自答案 集合; 将用户查询及至少一个问答对, 输入预设 匹配模型进行处理, 以得到用户查询与各问答对 的匹配度; 以及按照匹配度对问答对进行排序, 以作为检索结果。 根据本公开的方案, 能够显著 提高问答的准确性和相关性, 提高问答质量。 权利要求书2页 说明书13页 附图3页 CN 115292459 A 2022.11.04 CN 115292459 A 1.一种基于问答库的信息检索方法, 所述问答库包含至少一个问题及各问题对应的至 少一个答案, 作为各问题的答案集 合, 所述方法包括: 响应于用户查询, 从所述问答库中确定召回的问题及召回问题对应的候选答案子集, 作为召回的至少一个问答对, 其中所述 候选答案 子集来自所述 答案集合; 将所述用户查询及所述至少一个问答对, 输入预设匹配模型进行处理, 以得到所述用 户查询与各 所述问答对的匹配度; 以及 按照所述匹配度对所述问答对进行排序, 以作为检索结果。 2.如权利要求1所述的方法, 还 包括生成所述预设匹配模型的步骤: 将用户查询、 问题和答案作为训练数据, 并基于预设任务, 分别对训练数据进行标注, 得到标注数据; 构建用于生成预设匹配模型的训练模型, 并设置模型的初始参数; 将所述训练数据拼接后输入训练模型进行处 理, 以得到预测匹配度和预测类别; 以及 利用所述预测匹配度、 预测类别和标注数据, 计算损失值, 并基于损失值调整所述训练 模型的模型参数, 直到训练结束, 得到预设匹配模型。 3.如权利要求2所述的方法, 其中, 所述训练模型包括语言表示模型、 文本匹配组件和实体识别组件; 以及 当训练结束时, 将训练好的语言表示模型和训练好的文本匹配组件, 作为预设匹配模 型。 4.如权利要求3所述的方法, 其中, 所述将训练数据拼接后输入训练模型进行处理, 以 得到预测匹配度和预测类别的步骤 包括: 将所述训练数据输入语言表示模型进行处 理, 得到第一语义向量和第二语义向量; 将所述第一语义向量输入文本匹配组件中进行处 理, 以输出 预测匹配度; 将所述第二语义向量输入实体识别组件中进行处 理, 以输出 预测类别。 5.如权利要求1 ‑4中任一项所述的方法, 还 包括步骤: 针对所述问答库中的各问题, 分别选取出与所述问题的匹配度高的至少一个答案, 作 为所述问题的候选答案 子集。 6.如权利要求5所述的方法, 其中, 所述针对问答库中的各问题, 分别选取出与所述问 题的匹配度高的至少一个答案, 作为所述问题的候选答案 子集的步骤 包括: 针对所述问答库中的各问题, 将所述问题分别与其对应的各答案进行拼接, 对应得到各拼接 子句; 将各拼接 子句分别输入预设匹配模型, 得到对应的问题与答案的匹配度; 当问题与答案的匹配度高于阈值时, 将该答案作为该问题的候选答案 。 7.如权利要求2 ‑6中任一项所述的方法, 其中, 所述预设任务包括文本匹配任务和实体 识别任务, 以及 基于预设任务, 分别对训练数据进行 标注, 得到标注数据的步骤 包括: 基于文本匹配任务, 标注用户查询、 问题、 答案之间的匹配度, 作为标注匹配度; 基于实体识别任务, 标注训练数据中每个文本中各元素所属的实体类别, 作为标注类 别。 8.一种问答系统, 包括:权 利 要 求 书 1/2 页 2 CN 115292459 A 2问答存储装置, 适于存储至少一个问题及各问题对应的至少一个答案, 作为问答库, 其 中各问题包 含对应的答案集 合; 离线装置, 适于训练生成预设匹配模型, 还适于针对所述问答库中的各问题, 利用所述 预设匹配模型, 分别确定出所述问题的候选答案子集, 其中所述候选答案子集来自所述答 案集合; 在线装置, 适于响应于用户查询, 基于所述预设匹配模型, 从所述问答库中确定出至少 一个问题及其对应的候选答案 子集, 作为检索结果。 9.一种计算设备, 包括: 一个或多个处 理器; 存储器; 一个或多个程序, 其中所述一个或多个程序存储在所述存储器中并被配置为由所述一 个或多个处理器执行, 所述一个或多个程序包括用于执行如权利要求1 ‑7中任一项所述方 法的指令 。 10.一种存储一个或多个程序的计算机可读存储介质, 所述一个或多个程序包括指令, 所述指令在被 计算设备 执行时, 使得 所述计算设备 执行如权利要求1 ‑7任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115292459 A 3

.PDF文档 专利 一种基于问答库的信息检索方法、问答系统及计算设备

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于问答库的信息检索方法、问答系统及计算设备 第 1 页 专利 一种基于问答库的信息检索方法、问答系统及计算设备 第 2 页 专利 一种基于问答库的信息检索方法、问答系统及计算设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:08:42上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。