说明:收录90万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221074986 6.7 (22)申请日 2022.06.29 (71)申请人 深圳太极数智技 术有限公司 地址 518000 广东省深圳市福田区梅林街 道梅都社区中康路136号深圳新一代 产业园3栋1402 (72)发明人 李晓琼 黄鼎 陈昭 (74)专利代理 机构 深圳中一联合知识产权代理 有限公司 4 4414 专利代理师 张菁华 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/211(2020.01) G06F 40/242(2020.01)G06F 40/295(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 7/00(2006.01) (54)发明名称 一种文本情感分析的方法及装置 (57)摘要 本申请适用于自然语 言处理技术领域, 提供 了一种文本情感分析的方法及装置。 该方法包 括: 根据第一情感词在语料库中出现的次数, 确 定所述第一情感词的情感倾向强度值; 根据所述 第一情感词典 中的第二情感词, 在所述语料库中 提取与所述第二情感词具有相似句法结构的第 三情感词; 根据所述情感倾向强度值和所述第三 情感词, 生成第二情感词典, 所述第二情感词典 包括所述第一情感词、 所述第二情感词和所述第 三情感词; 根据所述第二情感词典对待测文本的 情感极性进行分析。 本申请可以提高在基于情感 词典对待测文本进行情感极性分析时的覆盖面 和准确率。 权利要求书4页 说明书24页 附图7页 CN 115098636 A 2022.09.23 CN 115098636 A 1.一种文本情感分析的方法, 其特 征在于, 包括: 根据第一情感词在语料库中出现的次数, 确定所述第一情感词的情感倾向强度值; 根据第二情感词在所述语料库中提取第 三情感词, 所述第 二情感词指第 一情感词典中 的词, 所述第三情感词与所述第二情感词具有相似的句法结构; 根据所述情感倾向强度值和所述第三情感词, 生成第二情感词典, 所述第二情感词典 包括所述第一情感词、 所述第二情感词和所述第三情感词; 根据所述第二情感词典对待测文本的情感极性进行分析。 2.根据权利要求1所述的方法, 其特征在于, 在根据 所述第二情感词典对待测文本的情 感极性进行分析之前, 所述方法还 包括: 确定所述待测文本的情感极性 概率; 其中, 所述 根据所述第二情感词典对待测文本的情感极性进行分析, 包括: 根据所述情感极性 概率和所述第二情感词典, 对所述待测文本的情感极性进行分析。 3.根据权利要求1或2所述的方法, 其特征在于, 所述第一情感词包括正面情感词和负 面情感词, 所述语料库中包括 正面情感语料和负面情感语料; 其中, 所述根据第一情感词在语料库中出现的次数, 确定所述第一情感词的情感倾向 强度值, 包括: 根据所述正面情感词在所述正面情感语料中表示正面语义 时的出现次数、 所述正面情 感词在所述负面情感语料中表示正面语义时的出现次数、 所述正面情感词在所述负面情感 语料中出现次数、 在所述正面情感语料中所有表 示正面语义的情感词出现次数之和中的一 项或多项, 确定所述 正面情感词的情感倾向强度值; 根据所述负面情感词在所述负面情感语料中表示负面语义 时的出现次数、 所述负面情 感词在所述正面情感语料中表示负面语义时的出现次数、 所述负面情感词在所述正面情感 语料中出现次数、 在所述负面情感语料中所有表 示负面语义的情感词出现次数之和中的一 项或多项, 确定所述负面情感词的情感倾向强度值。 4.根据权利要求3所述的方法, 其特征在于, 所述正面情感词的情感倾向强度值满足下 式: 其中, ti为所述正面情感词, 为ti的情感倾向强度值, 为ti在所述正面情感语料 中表示正面语义时的出现次数, pwords为所有所述正面情感词构成 的集合, 为所 述正面情感语料中所有表示正面语义的情感词出现次数之和, 为ti在所述负面情感语 料中表示 正面语义时的出现次数, 为ti在所述负面情感语料中出现次数; 所述负面情感词的情感倾向强度值满足下式:权 利 要 求 书 1/4 页 2 CN 115098636 A 2其中, ti为所述负面情感词, 为ti的情感倾向强度值, 为ti在所述负面情感语料 中表示负面语义时的出现次数, nwords为所有所述负面情感词构成的集合, 为所 述负面情感语料中所有表示负面语义的情感词 出现次数之和, 为ti在所述正面情感语 料中表示负面语义时的出现次数, 为ti在所述正面情感语料中出现次数。 5.根据权利要求1至4中任一项的所述方法, 其特征在于, 所述根据第二情感词在所述 语料库中提取第三情感词, 包括: 对所述语料库中的文本进行句法分析, 获得句法分析 结果; 将所述文本划分为短句集; 根据所述第 二情感词确定所述第 二情感词所在的第 一短句, 所述第 一短句为所述短句 集中的短句; 对所述第二情感词和所述第一短句进行 标注, 获得句法结构标注结果; 根据所述句法分析结果以及所述句法结构标注结果, 确定第 二短句以及所述第 三情感 词, 所述第二短句为所述第三情感词在所述短句集中所在的短句, 且所述第二短句与所述 第一短句具有相似的句法结构, 其中, 所述第三情感词在语料库中的出现次数大于第一阈 值; 根据所述第二情感词, 确定所述第三情感词的情感倾向, 所述情感倾向包括正面情感 倾向和负面情感倾向; 根据所述第三情感词的情感倾向, 确定所述第三情感词的情感倾向强度值。 6.根据权利要求5所述的方法, 其特征在于, 所述根据所述第二情感词, 确定所述第三 情感词的情感倾向, 包括: 根据所述第二情感词和所述第三情感词在同一所述文本中的共现关系, 确定情感词 图, 所述情感词图包括 正面情感子图和负面情感子图; 确定第一分离代价以及第二分离代价, 其中, 所述第一分离代价指所述第三情感词与 所述正面情感子图的分离代价, 所述第二分离代 价指所述第三情感词 与所述负面情感子图 的分离代价; 比较所述第一分离代价和所述第二分离代价; 将所述第一分离代价和所述第二分离代价中分离代价最大的情感子图所对应的情感 倾向, 确定为所述第三情感词的情感倾向。 7.根据权利要求6所述的方法, 其特 征在于, 所述第一分离代价满足下式: 其中, SepCost为所述第一分离代价, si为所述正面情感子图中的所述第二情感词的情 感倾向强度值, G为所述正面情感子图, di表示所述正面情感子图中所述第二情感词与所述权 利 要 求 书 2/4 页 3 CN 115098636 A 3
专利 一种文本情感分析的方法及装置
文档预览
中文文档
36 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共36页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:09:14
上传分享
举报
下载
原文档
(1016.1 KB)
分享
友情链接
GB-T 41464-2022 高成长企业分类导引.pdf
GB-T 43624-2023 湿地术语.pdf
GB-T 32386-2015 电子工业用气体 六氟化钨.pdf
OWASP ASVS应用安全验证标准 4.0.3 中文版.pdf
GB-T 26141.2-2010 无损检测 射线照相底片数字化系统的质量鉴定 第2部分:最低要求.pdf
GB-T 23020-2013工业企业信息化和工业化融合评估规范.pdf
GB-T 22372-2008 单色黑白激光打印机测试版.pdf
GB-T 26775-2011 车载音视频系统通用技术条件.pdf
CSA 网络基础安全之XDR扩展检测与响应平台.pdf
ISO IEC 27035-1-2016.pdf
T-CEC 612—2022 港口岸电系统船用移动电源.pdf
GA-T 460.3-2020 居民身份证卡体材料及打印薄膜技术规范 第3部分:制卡用保护层PETG薄膜.pdf
GB-T 14344-2022 化学纤维 长丝拉伸性能试验方法.pdf
AIGC行业投资手册:挖掘美股“七巨头”外的AI软件核心标的-浦银国际证券 2024.pdf
GB-T 29321-2012 光伏发电站无功补偿技术规范.pdf
DB31-T 1244-2020 冷却塔节能降噪改造技术指南 上海市.pdf
T-WAPIA 045.3—2021 信息技术 系统间远程通信和信息交换 原子密钥建立与实体鉴别 第3部分:采用证书的原子密钥建立与实体鉴别.pdf
DB43-T 2256-2021 信息技术应用创新工程建设规范第 13 部分:国产化信息系统运行维护规范 湖南省.pdf
T-SZUAVIA 009.8—2019 多旋翼无人机系统实验室环境试验方法 第 8 部分:振动试验.pdf
GB-T 27563-2011 工业用N-甲基-2-吡咯烷酮.pdf
1
/
3
36
评价文档
赞助2.5元 点击下载(1016.1 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。