专利 一种从数据起源出发的数据处理方法及系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211060927.5 (22)申请日 2022.09.01 (71)申请人睿智合创（北京）科技有限公司地址 100000 北京市密云区鼓楼东大街3号山水大厦3层313室-2 360(云创谷经济开发中心集中办公区) (72)发明人王世今　莫卉星　刘珂杭　高铭　武欢欢　 (74)专利代理机构北京冠和权律师事务所 11399 专利代理师张树朋 (51)Int.Cl. G06F 16/906(2019.01) G06F 16/22(2019.01) G06F 16/242(2019.01)G06F 16/23(2019.01) (54)发明名称一种从数据起源出发的数据处理方法及系统 (57)摘要本发明提供了一种从数据起源出发的数据处理方法及系统，包括：根据初始数据的数据起源，确定数据分类的分类维度；根据所述初始数据的维度属性，对所述初始数据进行数据类型划分，得到维度数据；根据所述维度数据的类型属性，对所述维度数据进行数据名称命名，得到数据类型名称；本发明通过从数据起源出发确定数据分类的分类维度，保证分类维度能够涵盖所有的数据，通过根据维度属性，对数据进行划分，保证数据划分的完整性和单一性，根据类型属性，确定合适的数据名称，保证了对数据的查询效率和准确性，最终提高对数据的有效利用和挖掘。权利要求书3页说明书10页附图2页 CN 115544337 A 2022.12.30 CN 115544337 A 1.一种从数据起源出发的数据处理方法，其特征在于，包括：步骤1：根据初始数据的数据起源，确定数据分类的分类维度；步骤2：根据所述初始数据的维度属性，对所述初始数据进行数据类型划分，得到维度数据；步骤3：根据所述维度数据的类型属性，对所述维度数据进行数据名称命名，得到数据类型名称。 2.根据权利要求1所述的一种从数据起源出发的数据处理方法，其特征在于，步骤1之前，还包括：获取所述初始数据的数据起源，包括：获取所述初始数据经过的临近数据采集节点，并根据临近数据采集节点的时间戳，获取所述初始数据经过的前一个数据采集节点；根据所述前一个数据采集节点的时间戳，对所述初始数据进行溯源，得到所述初始数据的初始采集节点；基于所述初始采集节点的时间戳，确定所述初始数据的数据起源。 3.根据权利要求1所述的一种从数据起源出发的数据处理方法，其特征在于，步骤1中，根据初始数据的数据起源，确定数据分类的分类维度包括：根据对所述初始数据的应用需求，确定分类角度；从维度数据库中提取于所述分类角度一致的初始维度，并基于所述应用需求的重点，从所述初始维度中选取预设数目个目标维度；建立所述目标维度在所述分类角度下的维度分布图，并判断所述维度分布图是否涵盖所述分类角度的所有方面；若是，确定所述目标维度为进行数据分类的分类维度；否则，确定缺失方面，并为所述缺失方面匹配最优的维度作为补充维度，将所述补充维度和目标维度共同组成进行数据分类的分类维度。 4.根据权利要求3所述的一种从数据起源出发的数据处理方法，其特征在于，根据对所述初始数据的应用需求，确定分类角度，包括：提取所述应用需求中的关键词，并为每一个关键词匹配对应的初始分类角度；选取数量最多的初始分类角度作为所述初始数据的分类角度。 5.根据权利要求1所述的一种从数据起源出发的数据处理方法，其特征在于，步骤2中，根据所述初始数据的维度属性，对所述初始数据进行数据类型划分，得到维度数据，包括：基于所述分类维度的特点，设置在每个所述分类维度下的分析点和每个分析点的权重；基于所述分类维度的分析点及其对应的权重，设置属性确定模型；将所述初始数据输入所述属性确定模型中，确定所述初始数据的维度属性；获取与所述维度属性对应的初始维度，作为所述初始数据的维度，得到对应的维度数据。 6.根据权利要求5所述的一种从数据起源出发的数据处理方法，其特征在于，基于所述分类维度的分析点及其对应的权重，设置属性确定模型，包括：基于所述分类维度，设定通道个数以及每个通道对应的属性，并基于所述通道个数和每个通道对应的属性，构建通道模型；权　利　要　求　书 1/3 页 2 CN 115544337 A 2对所述分类维度的分析点进行分析，确定所述分析点之间的关联特征和分析顺序；从数据分析库中获取与所述分析点对应的初始分析方式，并根据所述关联特征，选取存在关联的初始分析方式；对所述存在关联的初始分析方式进行拆分确定子分析规则，选择所述存在关联的初始分析方式中的相同子分析规则，并确定所述相同子分析规则在所述初始分析方式中的位置；基于所述相同子分析规则和位置，对存在关联的初始分析方式进行合并和简化，得到目标分析方式；基于所述分析顺序，建立所述目标分析方式的分析流程，并获取与所述分析流程对应的分析资源，且基于所述分析资源，构建分析层；基于所述分析点对应的权重，设置对应的计算规则，并基于所述计算规则构建评分层；基于所述分析点对应的权重，建立所述分析层和评分层的第一连接关系；将所述分析层和评分层，根据所述第一连接关系，在所述通道模型中建立数据分析规则；所述通道模型中的每个通道与输出层进行连接；所述输出层包括评分比较层，用于对每个通道的输出评分进行比较，并选取出最大评分值；所述输出层还包括属性输出层，用于确定最大评分值对应的通道的属性，作为最终初始数据的维度属性；基于所述通道模型和输出层，建立属性确定模型。 7.根据权利要求5所述的一种从数据起源出发的数据处理方法，其特征在于，将所述初始数据输入所述属性确定模型中，确定所述初始数据的维度属性，包括：将所述初始数据输入所述属性确定模型中，得到输出维度；判断所述输出维度是否为一个维度；若是，将所述输出维度作为所述初始数据的维度属性；否则，确定所述输出维度包含的每个维度的维度特征，并基于所述维度特征，获取所有维度之间的相关特征；基于所述相关特征，从所述分析点中获取所述初始数据的相关分析点，选取所述初始数据在所述相关分析点的评分最高所对应的输出维度，作为所述初始数据的维度属性。 8.根据权利要求1所述的一种从数据起源出发的数据处理方法，其特征在于，步骤3 中，根据所述维度数据的类型属性，对所述维度数据进行数据名称命名，得到数据类型名称，包括：根据所述维度数据的类型属性，确定在所述类型属性下的名称关键词；根据所述维度数据在历史应用中的应用需求，确定所述维度数据的应用关键词；其中，所述名称关键词和应用关键词为多个；将所述名称关键词和应用关键词进行随机组合，得到第一数据名称；将所述第一数据名称输入语义评分模型中，并根据评分结果从所述第一数据名称中选取评分值大于预设值的数据名称作为第二数据名称；获取用于对于所述维度数据的历史搜索名称，并确定在历史搜索名称下，用户成功获权　利　要　求　书 2/3 页 3 CN 115544337 A 3

专利 一种从数据起源出发的数据处理方法及系统

专利一种从数据起源出发的数据处理方法及系统