(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210708476.5
(22)申请日 2022.06.22
(71)申请人 徐州国云信息科技有限公司
地址 221000 江苏省徐州市 鼓楼区坝子街9
号中和大厦4层
(72)发明人 杨懿 孟庆森 马祥帅 杨政伟
孟庆麟
(74)专利代理 机构 苏州创策知识产权代理有限
公司 3232 2
专利代理师 周锦全
(51)Int.Cl.
G06F 16/33(2019.01)
G06F 16/332(2019.01)
G06F 16/34(2019.01)
G06F 16/35(2019.01)G06F 40/30(2020.01)
G06Q 30/02(2012.01)
(54)发明名称
一种基于语义的大 数据分析系统
(57)摘要
本发明涉及大数据网络技术领域, 且公开了
一种基于语义的大数据分析系统, 包括数据收集
单元、 数据识别单元、 数据分析单元和数据可视
化单元, 所述数据收集单元用于对 大数据的存储
和实时更新, 所述数据识别单元用于对用户需要
的信息进行识别和初步过滤, 所述数据分析单元
用于对大数据信息的整合、 分类和关联分析数
据, 形成分析结果, 提供分析需要的实时数据, 所
述数据可视化单元用于对数据分析结果 以用户
能够识别的图形语音呈现出来; 该系统还包括信
息处理单元、 业务输出单元、 业务匹配单元、 业务
处理单元。 本发明具备数据的分布式采集、 存储
和监控, 进而 为企业分析数据、 聚焦商业渠道、 提
供多方合作的机会的有益效果。
权利要求书2页 说明书8页 附图1页
CN 115269771 A
2022.11.01
CN 115269771 A
1.一种基于语义的大数据分析系统, 包括数据收集单元、 数据识别单元、 数据分析单元
和数据可视化单元, 其特征在于: 所述数据收集单元用于对大数据的存储和实时更新, 所述
数据识别单元用于对用户需要的信息进行识别和初步过滤, 所述数据分析单元用于对大数
据信息的整合、 分类和关联分析数据, 形成分析结果, 提供分析需要的实时数据, 所述数据
可视化单 元用于对数据分析 结果以用户能够识别的图形语音呈现出来;
该系统还包括信息处理单元、 业务输出单元、 业务匹配单元、 业务处理单元; 所述信息
处理单元用于对数据收集单元、 数据识别单元、 数据分析单元和数据可视化单元 的数据处
理结果依次进 行传送; 所述业务输出单元用户对所需业务信息进 行输入、 搜索和查找; 所述
业务匹配单元用于集合用户需求信息和大数据处理信息进 行匹配和调 度, 所述业务处理单
元用于用户具体业 务的执行和展现。
2.根据权利要求1所述的一种基于语义的大数据分析系统, 其特征在于: 所述数据收集
单元包括分布式采集单 元、 数据存 储单元和数据监控单 元;
所述分布式采集单 元用于对不同采集站之间的数据进行采集;
所述数据存 储单元用于对 海量数量的数据进行分类储 存;
所述数据监控单元用于对流动的数据进行监控, 按实现设定的解惑原则完成有效截
取, 然后对截获下 的数据进行数据还原, 最后对还原后的数据进行分析并做出某种控制决
定。
3.根据权利要求1所述的一种基于语义的大数据分析系统, 其特征在于: 所述数据识别
单元包括文本纠错单 元、 情感倾向分析 单元、 评论观点抽取 单元;
所述文本纠错单元包括识别文本 中错误的片段, 进行错误提示并给出正确的建议文本
内容;
所述情感倾向分析 单元用于包括主观信息的文本进行情感倾向型判断;
所述评论观点抽取单元用于自动分析评论关注点和评论观点, 并输出评论观点标签及
评论观点极性。
4.根据权利要求1所述的一种基于语义的大数据分析系统, 其特征在于: 所述数据分析
单元包括对话情绪识别单 元、 文章标签单 元和文章分类单 元和新闻摘要单 元;
所述对话情绪识别单元用于对话场景中识别对话双方文本被后续蕴含的用户情绪结
合上下文语境给 出有针对性 地参考回复话 术;
所述文章标签单元用于对文章进行核心关键词缝隙, 为新闻个性化催件、 相似文章聚
合、 文本内容而分析等 提供技术支持;
所述文章分类单元用于对文章安装内容类型进行自动分类, 支持娱乐、 体育、 科技等26
个主流内容类型, 为文章聚类、 文本内容分析等应用提供基础技 术支持;
所述新闻摘要单元基于深度语义分析模型, 自动抽取新闻文本中的关键信 息并生成指
定长度的新闻摘要。
5.根据权利要求1所述的一种基于语义的大数据分析系统, 其特征在于: 所述数据 可视
化单元包括结构化数据单 元和非结构化数据单 元;
所述结构化数据用于呈现固定格式和有限长度的数据; 所述非结构化数据用于无固定
格式的数据的呈现。
6.根据权利要求1所述的一种基于语义的大数据分析系统, 其特征在于: 所述业务处理权 利 要 求 书 1/2 页
2
CN 115269771 A
2单元包括企业信息记录单 元、 营销数据收集单 元、 营销报告生成单 元和商业信息分析 单元;
所述企业信 息记录单元用于精准提取文本 中的姓名、 电话、 地址信 息, 通过自然语言处
理辅助地址识别做自动补充和纠正, 生成标准 规范的结构化信息;
所述营销数据收集单 元用于精准营销提供 数据搜集、 分析和营销手段的技 术支持;
所述营销报告生成单元用于对用户生成概要性的营销摘要, 支持定期自动生成、 报告
和撰写;
所述商业信息分析单元用于对商业信息分析和竞争对手分析及商业营销计划数据分
析。
7.根据权利要求1所述的一种基于语义的大数据分析系统, 其特征在于: 所述业务处理
单元还包括人才资源推荐单 元和供应商资源推荐单 元;
所述人才资源推荐单 元用于对企业用户进行 人力资源推荐和服 务;
所述供应商资源推荐单 元用于对企业用户进行相匹配的供应商 进行匹配和链接 。
8.根据权利要求5所述的一种基于语义的大数据分析系统, 其特征在于: 所述非结构化
数据单元包括可视图形 单元和主体图单 元;
所述可视图形单元用于图形、 图像进行管理; 所述主体图单元通过表达、 建模、 表面、 属
性及动画的现实, 对数据加以可视化 解释。
9.根据权利要求1所述的一种基于语义的大数据分析系统, 其特征在于: 所述业务输出
单元、 业务匹配单元和业务处理单元运行时, 当社 交网络数据采集和分析后, 基于文档的分
类和结果输入给业务输出单元的服务请求, 服务请求被分配至业务匹配单元中的服务人员
进行交互, 进一步处理进入到业务处理单元, 进而触发业务处理单元中的服务人员满足用
户需求进行推荐和搜索信息 。
10.根据权利要求1所述的一种基于语义的大数据分析系统, 其特征在于: 所述业务输
出单元包括自动匹配单元和人工相应单元, 自动匹配单元用于将用户所需要的信息匹配处
理后自动回复用户, 人工相应单 元用于人工检索匹配处 理后进行 人工回复客户。权 利 要 求 书 2/2 页
3
CN 115269771 A
3
专利 一种基于语义的大数据分析系统
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:08:36上传分享