(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210743637.4
(22)申请日 2022.06.27
(71)申请人 平安银行股份有限公司
地址 518000 广东省深圳市罗湖区深南 东
路5047号
(72)发明人 周柱君
(74)专利代理 机构 北京超凡宏宇专利代理事务
所(特殊普通 合伙) 11463
专利代理师 张文娥
(51)Int.Cl.
G06F 40/211(2020.01)
G06F 40/289(2020.01)
G06F 40/30(2020.01)
G06F 16/35(2019.01)
H04L 51/04(2022.01)
(54)发明名称
一种基于依存句法评分的文本筛选方法和
文本筛选装置
(57)摘要
本申请提供了一种基于依存句法评分的文
本筛选方法和文本筛选装置, 该文本筛选方法包
括: 获取历史会话文本; 对所述历史会话文本进
行依存句法解析分类, 从预设的至少一种原始依
存句法结构类别中确定出所述历史会话文本对
应的至少一种目标依存句法结构类别; 基于确定
出的至少一种目标依存句法结构类别, 利用预设
的评分标准对 所述历史会话文本进行评分, 得到
所述历史会话文本对应的依存句法评分; 判断所
述历史会话文本对应的依存句法评分是否大于
或等于预设的评分阈值; 若是, 则将所述历史会
话文本确定为目标会话文本。 根据所述文本筛选
方法和所述文本筛选装置, 提高了文本筛选的效
率和准确性。
权利要求书2页 说明书11页 附图4页
CN 115099218 A
2022.09.23
CN 115099218 A
1.一种基于依存句法评分的文本 筛选方法, 其特 征在于, 所述文本 筛选方法包括:
获取历史会话文本;
对所述历史会话文本进行依存句法解析分类, 从预设的至少一种原始依存句法结构类
别中确定出 所述历史会话文本对应的至少一种目标依存句法结构类别;
基于确定出的至少一种目标依存句法结构类别, 利用预设的评分标准对所述历史会话
文本进行评分, 得到所述历史会话文本对应的依存句法评 分; 其中, 所述评 分标准用于表征
每种目标依存句法结构类别对应的评分 分值;
判断所述历史会话文本对应的依存句法评分是否大于或等于预设的评分阈值;
若是, 则将所述历史会话文本确定为目标会话文本 。
2.根据权利要求1所述的文本筛选方法, 其特征在于, 所述将所述历史会话文本输入到
预训练模型中, 对所述历史会话文本进行依存句法解析分类, 从预设的至少一种原始依存
句法结构类别中确定出 所述历史会话文本对应的至少一种目标依存句法结构类别, 包括:
将所述历史会话文本输入到依存句法解析模型中, 对所述历史会话文本进行分词, 得
到所述历史会话文本对应的至少一个子 字符;
针对每个子字符, 将该子字符输入到所述依存句法解析模型的生成器中, 对该子字符
进行语义编码计算, 以得到该子 字符对应的子 字符序列;
将该子字符对应的子字符序列输入到所述依存句法解析模型的判别器中, 根据 该子字
符序列对该子字符进 行依存句法解析分类, 从至少一种原始依存句法结构 类别中确定出该
子字符对应的目标依存句法结构类别;
基于每个子字符对应的目标依存句法结构类别, 确定出所述历史会话文本对应的至少
一种目标依存句法结构类别。
3.根据权利要求1所述的文本筛选方法, 其特征在于, 所述基于确定出的至少一种目标
依存句法结构类别, 利用预设的评分标准对所述历史会话文本进行评分, 得到所述历史会
话文本对应的依存句法评分, 包括:
针对于所述历史会话文本对应的每种目标依存句法结构类别, 根据所述评分标准确定
出该目标依存句法结构类别对应的目标评分 分值;
将每种目标依存句法结构类别对应的目标评分分值进行求和, 得到所述历史会话文本
对应的依存句法评分。
4.根据权利要求1所述的文本 筛选方法, 其特 征在于, 所述筛 选方法还 包括:
针对于每个用户, 获取该用户所涉及的目标会话文本, 并确定该用户所涉及的目标会
话文本的数量;
判断所述数量是否大于或等于预设的数量阈值;
若是, 则将该用户确定为目标用户, 为所述目标用户提供 所需的业 务服务。
5.一种基于依存句法评分的文本 筛选装置, 其特 征在于, 所述文本 筛选装置包括:
获取模块, 用于获取历史会话文本;
类别确定模块, 用于对所述历史会话文本进行依存句法解析分类, 从预设的至少一种
原始依存句法结构类别中确定出所述历史会话文本对应的至少一种目标依存句法结构类
别;
评分确定模块, 用于基于确定出的至少一种目标依存句法结构类别, 利用预设的评分权 利 要 求 书 1/2 页
2
CN 115099218 A
2标准对所述历史会话文本进 行评分, 得到所述历史会话文本对应的依存句法评分; 其中, 所
述评分标准用于表征每种目标依存句法结构类别对应的评分 分值;
判断模块, 用于判断所述历史会话文本对应的依存句法评分是否大于或等于预设的评
分阈值;
目标对话文本确定模块, 用于若是, 则将所述历史会话文本确定为目标对话文本 。
6.根据权利要求5所述的文本筛选装置, 其特征在于, 所述类别确定模块在用于对所述
历史会话文本进 行依存句法解析分类, 从预设的至少一种原始依存句法结构 类别中确定出
所述历史会话文本对应的至少一种目标依存句法结构类别时, 所述类别确定模块还用于:
将所述历史会话文本输入到依存句法解析模型中, 对所述历史会话文本进行分词, 得
到所述历史会话文本对应的至少一个子 字符;
针对每个子字符, 将该子字符输入到所述依存句法解析模型的生成器中, 对该子字符
进行语义编码计算, 以得到该子 字符对应的子 字符序列;
将该子字符对应的子字符序列输入到所述依存句法解析模型的判别器中, 根据 该子字
符序列对该子字符进 行依存句法解析分类, 从至少一种原始依存句法结构 类别中确定出该
子字符对应的目标依存句法结构类别;
基于每个子字符对应的目标依存句法结构类别, 确定出所述历史会话文本对应的至少
一种目标依存句法结构类别。
7.根据权利要求5所述的文本筛选装置, 其特征在于, 所述评分确定模块在用于基于确
定出的至少一种目标依存句法结构 类别, 利用预设的评 分标准对所述历史会话文本进 行评
分, 得到所述历史会话文本对应的依存句法评分时, 所述评分确定模块还用于:
针对于所述历史会话文本对应的每种目标依存句法结构类别, 根据所述评分标准确定
出该目标依存句法结构类别对应的目标评分 分值;
将每种目标依存句法结构类别对应的目标评分分值进行求和, 得到所述历史会话文本
对应的依存句法评分。
8.根据权利要求5所述的文本筛选装置, 其特征在于, 所述文本筛选装置还包括目标用
户确定模块, 所述目标用户确定模块用于:
针对于每个用户, 获取该用户所涉及的目标会话文本, 并确定该用户所涉及的目标会
话文本的数量;
判断所述数量是否大于或等于预设的数量阈值;
若是, 则将该用户确定为目标用户, 为所述目标用户提供 所需的业 务服务。
9.一种电子设备, 其特征在于, 包括: 处理器、 存储器和总线, 所述存储器存储有所述处
理器可执行 的机器可读指令, 当电子设备运行时, 所述处理器与所述存储器之间通过所述
总线进行通信, 所述机器可读指 令被所述处理器运行时执行如权利要求 1至4任一所述的基
于依存句法评分的文本 筛选方法的步骤。
10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机
程序, 所述计算机程序被处理器运行时执行如权利要求 1至4任一所述的基于依存句法评分
的文本筛选方法的步骤。权 利 要 求 书 2/2 页
3
CN 115099218 A
3
专利 一种基于依存句法评分的文本筛选方法和文本筛选装置
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:07:23上传分享