说明:收录90万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210522355.1 (22)申请日 2022.05.13 (71)申请人 国网江苏省电力有限公司信息通信 分公司 地址 210024 江苏省南京市北京西路20号 (72)发明人 田然 李瑾辉 相增辉 庞渊源 苏杨 王义成 王磊 陈轩 陈鑫 朱晓鸿 王鑫 (74)专利代理 机构 重庆创新专利商标代理有限 公司 50125 专利代理师 易文学 (51)Int.Cl. G06F 40/30(2020.01) G06N 20/10(2019.01) G06K 9/62(2022.01)G06F 16/215(2019.01) (54)发明名称 一种基于文本情感曲线的分析方法 (57)摘要 本发明涉及数据处理技术领域, 具体涉及一 种基于文本情感曲线的分析方法, 包括获取文本 信息; 对文本信息进行预处理, 得到训练集和测 试集; 构建学习模型; 使用训练集和测试集对学 习模型进行训练和测试, 得到监督学习模型; 对 待测文本进行预处理, 得到待测特征; 将待测特 征输入监督学习模型进行训练, 得到情感曲线 图; 对情感曲线图进行分析, 得到分析结果, 本发 明通过建立监督学习模型可实现对待测文本进 行自动分析, 生成情感曲线图, 解决了现有的文 本情感分析方法的人工成本高的问题。 权利要求书1页 说明书4页 附图2页 CN 114970542 A 2022.08.30 CN 114970542 A 1.一种基于文本情感曲线的分析 方法, 其特 征在于, 包括以下步骤: 获取文本信息; 对所述文本信息进行 预处理, 得到训练集和 测试集; 构建学习模型; 使用所述训练集和所述测试集对所述学习模型进行训练和 测试, 得到监 督学习模型; 对待测文本进行 预处理, 得到待测特 征; 将所述待测特 征输入所述 监督学习模型进行训练, 得到情感曲线图; 对所述情感曲线图进行分析, 得到分析 结果。 2.如权利要求1所述的基于文本情感曲线的分析 方法, 其特 征在于, 所述对所述文本信息进行 预处理, 得到训练集和 测试集的具体方式为: 去除所述文本信息中的停用词, 得到过 滤文本; 标记所述过 滤文本的权 重, 得到权重文本; 将所述权 重文本进行划分, 得到训练集和 测试集。 3.如权利要求2所述的基于文本情感曲线的分析 方法, 其特 征在于, 所述标记所述过 滤文本的权 重, 得到权重文本的具体方式为: 标记所述过 滤文本中的关键词; 基于所述关键词提取 所述过滤文本中的前缀词, 得到 权重文本。 4.如权利要求1所述的基于文本情感曲线的分析 方法, 其特 征在于, 所述使用所述训练集和所述测试集对所述学习模型进行训练和测试, 得到监督学习 模 型的具体方式为: 使用所述训练集对所述学习模型进行训练, 得到训练模型; 使用所述测试集对所述训练模型进行测试, 测试通过, 得到监 督学习模型。 5.如权利要求1所述的基于文本情感曲线的分析 方法, 其特 征在于, 所述对待测文本进行 预处理, 得到待测特 征的具体方式为: 去除所述待测文本中的停用词, 得到去除文本; 对所述去除文本进行 特征提取, 得到待测特 征。权 利 要 求 书 1/1 页 2 CN 114970542 A 2一种基于文本情 感曲线的分析方 法 技术领域 [0001]本发明涉及数据处 理技术领域, 尤其涉及一种基于文本情感曲线的分析 方法。 背景技术 [0002]文本情感曲线是一种基于文本情感分析的具体情感模式, 可以通过情感曲线展示 文本的具体情感变化, 一般用于 长文本的情感分析。 [0003]目前, 现有技术公开了一种文本情感分析方法通过人工抓取数据进行标注得到情 感词典, 根据情感词典对文本的情感表达将词语进行正负向和强弱程度区分, 人工成本高。 发明内容 [0004]本发明的目的在于提供一种基于文本情感曲线的分析方法, 旨在解决现有的文本 情感分析 方法的人工成本高的问题。 [0005]为实现上述目的, 本发明提供了一种基于文本情感曲线的分析方法, 包括以下步 骤: [0006]获取文本信息; [0007]对所述文本信息进行 预处理, 得到训练集和 测试集; [0008]构建学习模型; [0009]使用所述训练集和所述测试集对所述学习模型进行训练和测试, 得到监督学习模 型; [0010]对待测文本进行 预处理, 得到待测特 征; [0011]将所述待测特 征输入所述 监督学习模型进行训练, 得到情感曲线图; [0012]对所述情感曲线图进行分析, 得到分析 结果。 [0013]其中, 所述对所述文本信息进行 预处理, 得到训练集和 测试集的具体方式为: [0014]去除所述文本信息中的停用词, 得到过 滤文本; [0015]标记所述过 滤文本的权 重, 得到权重文本; [0016]将所述权 重文本进行划分, 得到训练集和 测试集。 [0017]其中, 所述标记所述过 滤文本的权 重, 得到权重文本的具体方式为: [0018]标记所述过 滤文本中的关键词; [0019]基于所述关键词提取 所述过滤文本中的前缀词, 得到 权重文本。 [0020]其中, 所述使用所述训练集和所述测试集对所述学习模型进行训练和测试, 得到 监督学习模型的具体方式为: [0021]使用所述训练集对所述学习模型进行训练, 得到训练模型; [0022]使用所述测试集对所述训练模型进行测试, 测试通过, 得到监 督学习模型。 [0023]其中, 所述对待测文本进行 预处理, 得到待测特 征的具体方式为: [0024]去除所述待测文本中的停用词, 得到去除文本; [0025]对所述去除文本进行 特征提取, 得到待测特 征。说 明 书 1/4 页 3 CN 114970542 A 3
专利 一种基于文本情感曲线的分析方法
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:07:59
上传分享
举报
下载
原文档
(596.8 KB)
分享
友情链接
GB-T 43706-2024 资产管理 战略资产管理计划 SAMP 实施指南.pdf
国家网络安全事件应急预案.pdf
DB12-T 905-2019 地源热泵系统节能减排绩效评价方法 天津市.pdf
GB-T 19113-2022 桑蚕鲜茧分级 茧层量法.pdf
T-CSAE 79—2018 能量回馈式汽车液压防抱死制动系统 性能要求及试验方法.pdf
GM-T 0115-2021 信息系统密码应用测评要求.pdf
T-CMAM M10-20—2019 蒙医医疗技术操作规范.pdf
WS 539-2017 远程医疗信息基本数据集.pdf
GB-T 17359-2023 微束分析 原子序数不小于11的元素能谱法定量分析.pdf
GB 3096-2008_声环境质量标准.pdf
GB-T 43437-2023 信息技术 信息产品研发能力评估模型.pdf
GB-T 16900-2008 图形符号表示规则 总则.pdf
DB64-T 1962—2023 机关事务信息化系统建设规范 宁夏回族自治区.pdf
艾瑞咨询 中国云安全行业研究报告 2021.pdf
DB13-T 5266-2020 基于岩体基本质量BQ分级法的公路隧道围岩级别快速判定技术要求 河北省.pdf
YD-T 4060-2022 云计算安全责任共担模型.pdf
CSA AI安全白皮书.pdf
GB-T 19483-2016 无绳电话的电磁兼容性要求及测量方法.pdf
GB-T 31519-2015 台风型风力发电机组.pdf
T-CNZC 0008—2022 坛紫菜原藻数字化称重系统操作规程.pdf
1
/
3
8
评价文档
赞助2.5元 点击下载(596.8 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。