说明:收录90万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210733483.0 (22)申请日 2022.06.27 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融街31号 (72)发明人 张辉 李俊 杨建昆 (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 专利代理师 孙小明 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) (54)发明名称 一种批量投诉的识别方法及装置 (57)摘要 本申请公开了一种批量投诉的识别方法及 装置, 用以通过计算机自动发现和识别批量投 诉, 不再依赖人工, 提升批量投诉识别的效率和 准确率。 该方法包括: 将接收到的各个投诉文本 转化为文本向量; 根据任意两个文本向量之间的 距离, 确定各文本向量预设距离范围内的文本向 量的数量; 距离用于表征任意两个文本向量对应 的投诉文本的语义相近程度; 在数量达到设定阈 值时, 确定预设距离范围内文本向量对应的投诉 文本为批量投诉; 根据预设距离范围内文本向量 对应的投诉 文本, 输出批量投诉警报信息 。 权利要求书2页 说明书10页 附图3页 CN 115062149 A 2022.09.16 CN 115062149 A 1.一种批量投诉的识别方法, 其特 征在于, 包括: 将接收到的各个投诉文本转 化为文本向量; 根据任意两个文本向量之间的距离, 确定各文本向量预设距离范围内的文本向量的数 量; 所述距离用于表征 所述任意两个文本向量对应的投诉文本的语义相近程度; 在所述数量达到设定 阈值时, 确定所述预设距离范围内文本向量对应的投诉文本为批 量投诉; 根据所述预设距离范围内文本向量对应的投诉文本, 输出批量投诉警报信息 。 2.根据权利要求1所述的方法, 其特征在于, 所述将接收到的各个投诉文本转化为文本 向量, 包括: 将任一投诉文本进行拆词处 理, 得到所述任一投诉文本对应的多个词语; 将所述多个词语中每一个词语转 化为词向量; 通过多个词向量组成所述任一投诉文本对应的文本向量。 3.根据权利要求2所述的方法, 其特征在于, 所述将多个词语中每一个词语转化为词向 量, 包括: 获取预先构建的多组词语与词向量之间的对应关系; 所述对应关系是基于预训练的词 向量转化模型生成的; 根据多组对应关系, 确定所述多个词语中每一个词语对应的词向量。 4.根据权利要求2或3所述的方法, 其特征在于, 所述将任一投诉文本进行拆词处理, 得 到所述任一投诉文本对应的多个词语, 包括: 将所述任一投诉文本与预 先配置的词语库进行匹配, 确定匹配成功的词语; 将剔除所述匹配成功的词语后的所述任一投诉文本进行拆词处理, 将拆词得到的词语 与所述匹配成功的词语组成述任一投诉文本对应的多个词语。 5.根据权利要求1 ‑3任一项所述的方法, 其特征在于, 所述根据任意两个文本向量之间 的距离, 确定各文本向量预设距离范围内的文本向量的数量, 包括: 分别计算第一文本向量与所述各文本向量中除所述第一文本向量外的其他文本向量 之间的距离; 将与所述第一文本向量距离小于预设值的文本向量的数量, 作为所述第 一文本向量预 设距离范围内的文本向量的数量; 其中, 所述第一文本为所述各文本向量中的任意 一个文本向量。 6.根据权利要求1 ‑3任一项所述的方法, 其特 征在于, 所述方法还 包括: 向投诉处理人员的设备发送所述批量投诉警报信 息、 所述预设距离范围内文本向量的 数量和所述预设距离范围内文本向量对应的投诉文本 。 7.一种批量投诉的识别装置, 其特 征在于, 包括: 通信单元, 用于接收多个投诉文本; 处理单元, 被配置为执 行: 将各个投诉文本转 化为文本向量; 根据任意两个文本向量之间的距离, 确定各文本向量预设距离范围内的文本向量的数 量; 所述距离用于表征 所述任意两个文本向量对应的投诉文本的语义相近程度; 在所述数量达到设定 阈值时, 确定所述预设距离范围内文本向量对应的投诉文本为批权 利 要 求 书 1/2 页 2 CN 115062149 A 2量投诉; 根据所述预设距离范围内文本向量对应的投诉文本, 输出批量投诉警报信息 。 8.根据权利要求7 所述的装置, 其特 征在于, 所述处 理单元, 具体用于: 将任一投诉文本进行拆词处 理, 得到所述任一投诉文本对应的多个词语; 将所述多个词语中每一个词语转 化为词向量; 通过多个词向量组成所述任一投诉文本对应的文本向量。 9.根据权利要求8所述的装置, 其特 征在于, 所述处 理单元, 具体用于: 获取预先构建的多组词语与词向量之间的对应关系; 所述对应关系是基于预训练的词 向量转化模型生成的; 根据多组对应关系, 确定所述多个词语中每一个词语对应的词向量。 10.根据权利要求8或9所述的装置, 其特 征在于, 所述处 理单元, 具体用于: 将所述任一投诉文本与预 先配置的词语库进行匹配, 确定匹配成功的词语; 将剔除所述匹配成功的词语后的所述任一投诉文本进行拆词处理, 将拆词得到的词语 与所述匹配成功的词语组成述任一投诉文本对应的多个词语。 11.根据权利要求7 ‑9任一项所述的装置, 其特 征在于, 所述处 理单元, 具体用于: 分别计算第一文本向量与所述各文本向量中除所述第一文本向量外的其他文本向量 之间的距离; 将与所述第一文本向量距离小于预设值的文本向量的数量, 作为所述第 一文本向量预 设距离范围内的文本向量的数量; 其中, 所述第一文本为所述各文本向量中的任意 一个文本向量。 12.根据权利要求7 ‑9任一项所述的装置, 其特 征在于, 所述 通信单元, 还用于: 向投诉处理人员的设备发送所述批量投诉警报信 息、 所述预设距离范围内文本向量的 数量和所述预设距离范围内文本向量对应的投诉文本 。 13.一种电子设备, 其特 征在于, 包括: 存 储器以及控制器; 存储器, 用于存 储程序指令; 控制器, 用于调用所述存储器 中存储的程序指令, 按照获得的程序 执行权利要求1 ‑6中 任一项所述的方法。 14.一种计算机存储介质, 存储有计算机可执行指令, 其特征在于, 所述计算机可执行 指令用于执 行如权利要求1 ‑6中任一权利要求所述的方法。权 利 要 求 书 2/2 页 3 CN 115062149 A 3
专利 一种批量投诉的识别方法及装置
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:09:01
上传分享
举报
下载
原文档
(530.9 KB)
分享
友情链接
T-CAQI 225—2021 钢制模块化装配污水处理池体技术要求.pdf
T-CHES 45—2020 雷达水位计.pdf
GB-T 36630.3-2018 信息安全技术 信息技术产品安全可控评价指标 第3部分:操作系统.pdf
T-CSAE 78—2018 电动汽车再生制动平顺性的评价 及试验方法.pdf
T-CSAE 284.1—2022 自动驾驶乘用车 线控底盘性能要求及试验方法 第1部分:驱动系统.pdf
T-QGCML 264—2022 智能数字化血糖监测系统通用技术要求.pdf
GB-T 21082.4-2007 银行业务 密钥管理(零售) 第4部分 使用公开密钥密码的密钥管理技术.pdf
DB22-T 3222-2021 医药企业安全生产标准化等级划分与评定 吉林省.pdf
ISO 31000-2018 风险管理标准 中文.pdf
GB-T 32614-2016 户外运动服装 冲锋衣.pdf
GB-T 38667-2020 信息技术 大数据 数据分类指南.pdf
GB-T 36324-2018 信息安全技术 工业控制系统信息安全分级规范.pdf
GB-T 32923-2016 信息技术 安全技术 信息安全治理 .pdf
XF 869-2010 消防员灭火防护头套.pdf
DB31-T 367-2022 黄浦江游览船及码头运营设施与服务质量要求 上海市.pdf
SY-T 7617-2021 海相页岩地质力学评价规范.pdf
GB-T 15045-2013 脂肪烷基二甲基叔胺.pdf
GB-T 42449-2023 系统与软件工程 功能规模测量 IFPUG方法.pdf
DB11-T 2046.4-2022 智慧停车系统技术要求 第4部分:数据规范及质量评估 北京市.pdf
GB 4824-2019 工业、科学和医疗设备 射频骚扰特性 限值和测量方法.pdf
1
/
3
16
评价文档
赞助2.5元 点击下载(530.9 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。