说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211060927.5 (22)申请日 2022.09.01 (71)申请人 睿智合创 (北京) 科技有限公司 地址 100000 北京市密云区鼓楼东大街3号 山水大厦3层313室-2 360(云创谷经济 开发中心集中办公区) (72)发明人 王世今 莫卉星 刘珂杭 高铭  武欢欢  (74)专利代理 机构 北京冠和权律师事务所 11399 专利代理师 张树朋 (51)Int.Cl. G06F 16/906(2019.01) G06F 16/22(2019.01) G06F 16/242(2019.01)G06F 16/23(2019.01) (54)发明名称 一种从数据起源出发的数据处理方法及系 统 (57)摘要 本发明提供了一种从数据起源出发的数据 处理方法及系统, 包括: 根据初始数据的数据起 源, 确定数据分类的分类维度; 根据所述初始数 据的维度属性, 对所述初始数据进行数据类型划 分, 得到维度数据; 根据所述维度数据的类型属 性, 对所述维度数据进行数据名称命名, 得到数 据类型名称; 本发明通过从数据起源 出发确定数 据分类的分类维度, 保证分类维度能够涵盖所有 的数据, 通过根据维度属性, 对数据进行划分, 保 证数据划分的完整性和单一性, 根据类型属性, 确定合适的数据名称, 保证了对 数据的查询效率 和准确性, 最终提高对数据的有效利用和挖掘。 权利要求书3页 说明书10页 附图2页 CN 115544337 A 2022.12.30 CN 115544337 A 1.一种从数据起源出发的数据处 理方法, 其特 征在于, 包括: 步骤1: 根据初始数据的数据起源, 确定数据分类的分类维度; 步骤2: 根据所述初始数据的维度属性, 对所述初始数据进行数据类型划分, 得到维度 数据; 步骤3: 根据所述维度数据的类型属性, 对所述维度数据进行数据名称命名, 得到数据 类型名称。 2.根据权利要求1所述的一种从数据起源出发的数据处理方法, 其特征在于, 步骤1之 前, 还包括: 获取 所述初始数据的数据起源, 包括: 获取所述初始数据经过的临近数据采集节点, 并根据临近数据采集节点的时间戳, 获 取所述初始数据经 过的前一个数据采集节点; 根据所述前一个数据采集节点的时间戳, 对所述初始数据进行溯源, 得到所述初始数 据的初始采集节点; 基于所述初始采集节点的时间戳, 确定所述初始数据的数据起源。 3.根据权利要求1所述的一种从数据起源出发的数据处理方法, 其特征在于, 步骤1中, 根据初始数据的数据起源, 确定数据分类的分类维度包括: 根据对所述初始数据的应用需求, 确定分类角度; 从维度数据库中提取于所述分类角度一致的初始维度, 并基于所述应用需求的重点, 从所述初始维度中选取 预设数目个目标维度; 建立所述目标维度在所述分类角度 下的维度分布图, 并判断所述维度分布图是否涵盖 所述分类角度的所有方面; 若是, 确定所述目标维度为进行 数据分类的分类维度; 否则, 确定缺失方面, 并为所述缺失方面匹配最优的维度作为补充维度, 将所述补充维 度和目标维度共同组成进行 数据分类的分类维度。 4.根据权利要求3所述的一种从数据起源出发的数据处理方法, 其特征在于, 根据对所 述初始数据的应用需求, 确定分类角度, 包括: 提取所述应用需求中的关键词, 并为每一个关键词匹配对应的初始分类角度; 选取数量最多的初始分类角度作为所述初始数据的分类角度。 5.根据权利要求1所述的一种从数据起源出发的数据处理方法, 其特征在于, 步骤2中, 根据所述初始数据的维度属性, 对所述初始数据进行 数据类型划分, 得到维度数据, 包括: 基于所述分类维度的特点, 设置在每个所述分类维度下的分析点和每个分析点的权 重; 基于所述分类维度的分析点及其对应的权 重, 设置属性确定模型; 将所述初始数据输入所述属性确定模型中, 确定所述初始数据的维度属性; 获取与所述维度属性对应的初始维度, 作为所述初始数据的维度, 得到对应的维度数 据。 6.根据权利要求5所述的一种从数据起源出发的数据处理方法, 其特征在于, 基于所述 分类维度的分析点及其对应的权 重, 设置属性确定模型, 包括: 基于所述分类维度, 设定通道个数以及每个通道对应的属性, 并基于所述通道个数和 每个通道对应的属性, 构建通道模型;权 利 要 求 书 1/3 页 2 CN 115544337 A 2对所述分类维度的分析点进行分析, 确定所述分析点之间的关联 特征和分析顺序; 从数据分析库中获取与所述分析点对应的初始分析方式, 并根据所述关联特征, 选取 存在关联的初始分析 方式; 对所述存在 关联的初始分析方式进行拆分确定子分析规则, 选择所述存在 关联的初始 分析方式中的相同子分析规则, 并确定所述相同子分析规则在所述初始分析方式中的位 置; 基于所述相同子分析规则和位置, 对存在关联的初始分析方式进行合并和简化, 得到 目标分析 方式; 基于所述分析顺序, 建立所述目标分析方式的分析流程, 并获取与所述分析流程对应 的分析资源, 且基于所述分析资源, 构建 分析层; 基于所述分析点对应的权 重, 设置对应的计算 规则, 并基于所述计算 规则构建评分层; 基于所述分析点对应的权 重, 建立所述分析层和评分层的第一连接关系; 将所述分析层和评分层, 根据所述第一连接关系, 在所述通道模型中建立数据分析规 则; 所述通道模型中的每 个通道与输出层进行 连接; 所述输出层包括评分比较层, 用于对每个通道的输出评分进行比较, 并选取出最大评 分值; 所述输出层还包括属性输出层, 用于确定最大评分值对应的通道的属性, 作为最终初 始数据的维度属性; 基于所述 通道模型和输出层, 建立属性确定模型。 7.根据权利要求5所述的一种从数据起源出发的数据处理方法, 其特征在于, 将所述初 始数据输入所述属性确定模型中, 确定所述初始数据的维度属性, 包括: 将所述初始数据输入所述属性确定模型中, 得到 输出维度; 判断所述输出维度是否为 一个维度; 若是, 将所述输出维度作为所述初始数据的维度属性; 否则, 确定所述输出维度包含的每个维度的维度 特征, 并基于所述维度 特征, 获取所有 维度之间的相关特 征; 基于所述相关特征, 从所述分析点中获取所述初始数据的相关分析点, 选取所述初始 数据在所述相关 分析点的评分最高所对应的输出维度, 作为所述初始数据的维度属性。 8.根据权利要求1所述的一种从数据起源出发的数据处理方法, 其特征在于, 步骤3 中, 根据所述维度数据的类型属性, 对所述维度数据进 行数据名称命名, 得到数据类型名称, 包 括: 根据所述维度数据的类型属性, 确定在所述类型属性下的名称关键词; 根据所述维度数据在历史应用中的应用需求, 确定所述维度数据的应用关键词; 其中, 所述名称关键词和应用关键词为多个; 将所述名称关键词和应用关键词进行随机组合, 得到第一数据名称; 将所述第一数据名称输入语义评分模型中, 并根据评分结果从所述第 一数据名称中选 取评分值大于预设值的数据名称作为第二数据名称; 获取用于对于所述维度数据的历史搜索名称, 并确定在历史搜索名称下, 用户成功获权 利 要 求 书 2/3 页 3 CN 115544337 A 3

PDF文档 专利 一种从数据起源出发的数据处理方法及系统

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种从数据起源出发的数据处理方法及系统 第 1 页 专利 一种从数据起源出发的数据处理方法及系统 第 2 页 专利 一种从数据起源出发的数据处理方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:42:53上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。