(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211060927.5
(22)申请日 2022.09.01
(71)申请人 睿智合创 (北京) 科技有限公司
地址 100000 北京市密云区鼓楼东大街3号
山水大厦3层313室-2 360(云创谷经济
开发中心集中办公区)
(72)发明人 王世今 莫卉星 刘珂杭 高铭
武欢欢
(74)专利代理 机构 北京冠和权律师事务所
11399
专利代理师 张树朋
(51)Int.Cl.
G06F 16/906(2019.01)
G06F 16/22(2019.01)
G06F 16/242(2019.01)G06F 16/23(2019.01)
(54)发明名称
一种从数据起源出发的数据处理方法及系
统
(57)摘要
本发明提供了一种从数据起源出发的数据
处理方法及系统, 包括: 根据初始数据的数据起
源, 确定数据分类的分类维度; 根据所述初始数
据的维度属性, 对所述初始数据进行数据类型划
分, 得到维度数据; 根据所述维度数据的类型属
性, 对所述维度数据进行数据名称命名, 得到数
据类型名称; 本发明通过从数据起源 出发确定数
据分类的分类维度, 保证分类维度能够涵盖所有
的数据, 通过根据维度属性, 对数据进行划分, 保
证数据划分的完整性和单一性, 根据类型属性,
确定合适的数据名称, 保证了对 数据的查询效率
和准确性, 最终提高对数据的有效利用和挖掘。
权利要求书3页 说明书10页 附图2页
CN 115544337 A
2022.12.30
CN 115544337 A
1.一种从数据起源出发的数据处 理方法, 其特 征在于, 包括:
步骤1: 根据初始数据的数据起源, 确定数据分类的分类维度;
步骤2: 根据所述初始数据的维度属性, 对所述初始数据进行数据类型划分, 得到维度
数据;
步骤3: 根据所述维度数据的类型属性, 对所述维度数据进行数据名称命名, 得到数据
类型名称。
2.根据权利要求1所述的一种从数据起源出发的数据处理方法, 其特征在于, 步骤1之
前, 还包括: 获取 所述初始数据的数据起源, 包括:
获取所述初始数据经过的临近数据采集节点, 并根据临近数据采集节点的时间戳, 获
取所述初始数据经 过的前一个数据采集节点;
根据所述前一个数据采集节点的时间戳, 对所述初始数据进行溯源, 得到所述初始数
据的初始采集节点;
基于所述初始采集节点的时间戳, 确定所述初始数据的数据起源。
3.根据权利要求1所述的一种从数据起源出发的数据处理方法, 其特征在于, 步骤1中,
根据初始数据的数据起源, 确定数据分类的分类维度包括:
根据对所述初始数据的应用需求, 确定分类角度;
从维度数据库中提取于所述分类角度一致的初始维度, 并基于所述应用需求的重点,
从所述初始维度中选取 预设数目个目标维度;
建立所述目标维度在所述分类角度 下的维度分布图, 并判断所述维度分布图是否涵盖
所述分类角度的所有方面;
若是, 确定所述目标维度为进行 数据分类的分类维度;
否则, 确定缺失方面, 并为所述缺失方面匹配最优的维度作为补充维度, 将所述补充维
度和目标维度共同组成进行 数据分类的分类维度。
4.根据权利要求3所述的一种从数据起源出发的数据处理方法, 其特征在于, 根据对所
述初始数据的应用需求, 确定分类角度, 包括:
提取所述应用需求中的关键词, 并为每一个关键词匹配对应的初始分类角度;
选取数量最多的初始分类角度作为所述初始数据的分类角度。
5.根据权利要求1所述的一种从数据起源出发的数据处理方法, 其特征在于, 步骤2中,
根据所述初始数据的维度属性, 对所述初始数据进行 数据类型划分, 得到维度数据, 包括:
基于所述分类维度的特点, 设置在每个所述分类维度下的分析点和每个分析点的权
重;
基于所述分类维度的分析点及其对应的权 重, 设置属性确定模型;
将所述初始数据输入所述属性确定模型中, 确定所述初始数据的维度属性;
获取与所述维度属性对应的初始维度, 作为所述初始数据的维度, 得到对应的维度数
据。
6.根据权利要求5所述的一种从数据起源出发的数据处理方法, 其特征在于, 基于所述
分类维度的分析点及其对应的权 重, 设置属性确定模型, 包括:
基于所述分类维度, 设定通道个数以及每个通道对应的属性, 并基于所述通道个数和
每个通道对应的属性, 构建通道模型;权 利 要 求 书 1/3 页
2
CN 115544337 A
2对所述分类维度的分析点进行分析, 确定所述分析点之间的关联 特征和分析顺序;
从数据分析库中获取与所述分析点对应的初始分析方式, 并根据所述关联特征, 选取
存在关联的初始分析 方式;
对所述存在 关联的初始分析方式进行拆分确定子分析规则, 选择所述存在 关联的初始
分析方式中的相同子分析规则, 并确定所述相同子分析规则在所述初始分析方式中的位
置;
基于所述相同子分析规则和位置, 对存在关联的初始分析方式进行合并和简化, 得到
目标分析 方式;
基于所述分析顺序, 建立所述目标分析方式的分析流程, 并获取与所述分析流程对应
的分析资源, 且基于所述分析资源, 构建 分析层;
基于所述分析点对应的权 重, 设置对应的计算 规则, 并基于所述计算 规则构建评分层;
基于所述分析点对应的权 重, 建立所述分析层和评分层的第一连接关系;
将所述分析层和评分层, 根据所述第一连接关系, 在所述通道模型中建立数据分析规
则;
所述通道模型中的每 个通道与输出层进行 连接;
所述输出层包括评分比较层, 用于对每个通道的输出评分进行比较, 并选取出最大评
分值;
所述输出层还包括属性输出层, 用于确定最大评分值对应的通道的属性, 作为最终初
始数据的维度属性;
基于所述 通道模型和输出层, 建立属性确定模型。
7.根据权利要求5所述的一种从数据起源出发的数据处理方法, 其特征在于, 将所述初
始数据输入所述属性确定模型中, 确定所述初始数据的维度属性, 包括:
将所述初始数据输入所述属性确定模型中, 得到 输出维度;
判断所述输出维度是否为 一个维度;
若是, 将所述输出维度作为所述初始数据的维度属性;
否则, 确定所述输出维度包含的每个维度的维度 特征, 并基于所述维度 特征, 获取所有
维度之间的相关特 征;
基于所述相关特征, 从所述分析点中获取所述初始数据的相关分析点, 选取所述初始
数据在所述相关 分析点的评分最高所对应的输出维度, 作为所述初始数据的维度属性。
8.根据权利要求1所述的一种从数据起源出发的数据处理方法, 其特征在于, 步骤3 中,
根据所述维度数据的类型属性, 对所述维度数据进 行数据名称命名, 得到数据类型名称, 包
括:
根据所述维度数据的类型属性, 确定在所述类型属性下的名称关键词;
根据所述维度数据在历史应用中的应用需求, 确定所述维度数据的应用关键词;
其中, 所述名称关键词和应用关键词为多个;
将所述名称关键词和应用关键词进行随机组合, 得到第一数据名称;
将所述第一数据名称输入语义评分模型中, 并根据评分结果从所述第 一数据名称中选
取评分值大于预设值的数据名称作为第二数据名称;
获取用于对于所述维度数据的历史搜索名称, 并确定在历史搜索名称下, 用户成功获权 利 要 求 书 2/3 页
3
CN 115544337 A
3
专利 一种从数据起源出发的数据处理方法及系统
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-07 12:42:53上传分享