(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211197310.8
(22)申请日 2022.09.29
(71)申请人 上海浦东发展银行股份有限公司
地址 200001 上海市黄浦区中山 东一路12
号
(72)发明人 梁爽 高雨祺 薛劲菲 王许蓁
陈璇
(74)专利代理 机构 华进联合专利商标代理有限
公司 44224
专利代理师 帅梦媛
(51)Int.Cl.
G06F 16/21(2019.01)
G06F 16/22(2019.01)
G06F 16/2458(2019.01)
(54)发明名称
数据融合方法、 装置、 计算机设备和存储介
质
(57)摘要
本申请涉及一种数据融合方法、 装置、 计算
机设备、 存储介质和计算机程序产品。 所述方法
包括获取来源于外部系统的第一业务数据, 并对
第一业务数据进行主题划分, 得到至少一个一级
主题、 以及从属于一级主题的二级主题; 基于一
级主题和二级主题, 对第一业务数据进行数据标
准化处理, 得到贴源模型; 获取基于内部系统的
第二业务数据构建得到的范式模 型; 通过贴源模
型和范式模 型各自所包括的主体唯一识别信息,
关联范式模型和贴源模型, 得到融合模型, 其中,
贴源模型和 融合模型中的至少一种模型用于进
行业务数据分析。 采用本方法能够充分挖掘数据
价值。
权利要求书2页 说明书17页 附图4页
CN 115481111 A
2022.12.16
CN 115481111 A
1.一种数据融合方法, 其特 征在于, 所述方法包括:
获取来源于外部系统的第一业务数据, 并对所述第一业务数据进行主题划分, 得到至
少一个一级 主题、 以及从属于所述 一级主题的二级 主题;
基于所述一级主题和所述二级主题, 对所述第一业务数据进行数据标准化处理, 得到
贴源模型;
获取基于内部系统的第二 业务数据构建得到的范式模型;
通过所述贴源模型和所述范式模型各自所包括的主体唯一识别信 息, 关联所述范式模
型和所述贴源模型, 得到融合模 型, 其中, 所述贴源模型和所述融合模型中的至少一种模型
用于进行业 务数据分析。
2.根据权利要求1所述的方法, 其特征在于, 所述通过所述贴源模型和所述范式模型各
自所包括的主体唯一识别 信息, 关联 所述范式模型和所述贴源 模型, 得到融合模型, 包括:
根据目标业 务所属的一级 主题和二级 主题, 从贴源 模型中筛 选出目标贴源 模型;
确定所述目标贴源模型中各目标主体的主体唯一识别信 息, 以及所述目标贴源模型中
与所述各目标主体相关的多个第一数据;
将所述范式模型中与 所述各目标主体的主体唯一识别信 息对应的多个第 二数据, 分别
关联到与各目标主体相关的多个第一数据, 得到融合模型。
3.根据权利要求1所述的方法, 其特征在于, 所述通过所述贴源模型和所述范式模型各
自所包括的主体唯一识别 信息, 关联 所述范式模型和所述贴源 模型, 得到融合模型, 包括:
根据目标业 务所属的一级 主题和二级 主题, 从贴源 模型中筛 选出目标贴源 模型;
确定所述目标贴源模型中的多个目标主体, 并确定与每个目标主体分别相关的多个角
色;
确定每个角色的主体唯一识别信 息, 以及所述目标贴源模型中与各角色相关的多个第
一数据;
将所述范式模型中与 所述各角色的主体唯一识别信 息对应的多个第 二数据, 分别关联
到与各角色相关的多个第一数据, 得到与各角色对应的节点表;
基于与各角色对应的节点表, 确定融合模型。
4.根据权利要求3所述的方法, 其特征在于, 所述角色包括资源输入方、 资源管理方和
资源接收方, 所述与各角色对应的节点表包括资源输入方节点表、 资源管理方节点表和资
源输出方节点表, 其中, 所述资源输入方节点表、 所述资源管理方节点表、 所述资源输出方
节点表中每 个节点均具有唯一识别编号和节点类型;
所述基于与各角色对应的节点表, 确定融合模型, 包括:
确定所述资源输入方节点表、 资源管理方节点表、 资源输出方节点表中任意两个节点
之间的关联关系;
基于两个节点各自的所述唯一识别编号和节点类型, 从所述资源输入方节点表、 资源
管理方节点表、 资源输出 方节点表中确定出 所述两个节点的节点信息;
基于所述任意两个节点之间的关联关系和组成所述关联关系的两个节点的节点信 息,
构建关联关系汇总表;
基于所述资源输入方节点表、 所述资源管理方节点表、 所述资源输出方节点表、 所述关
联关系汇总表, 得到融合模型。权 利 要 求 书 1/2 页
2
CN 115481111 A
25.根据权利要求1所述的方法, 其特征在于, 所述基于所述一级主题和所述二级主题,
对所述第一 业务数据进行 数据标准 化处理, 得到贴源 模型, 包括:
根据所述 一级主题和所述 二级主题, 对所述第一 业务数据中的表名进行统一命名;
对表名统一命名后的第 一业务数据中的字段和字段类型进行统一命名, 得到命名统一
的第一业务数据;
增加切片日期字段、 插入日期字段、 更新日期字段至所述命名统一的第 一业务数据, 去
除所述命名统一的第一业务数据中的重复字段, 并对所述命名统一的第一业务数据中的标
志类字段进行规则统一 化, 得到贴源 模型。
6.根据权利要求1所述的方法, 其特征在于, 所述基于所述一级主题和所述二级主题,
对所述第一 业务数据进行 数据标准 化处理, 得到贴源 模型, 包括:
基于所述一级主题和所述二级主题, 并通过第一数据处理平台, 对所述第一业务数据
进行数据标准 化处理, 得到第一贴源 模型;
基于所述一级主题和所述二级主题, 并通过第二数据处理平台, 对所述第一业务数据
进行数据标准化处理, 得到第二贴源模型, 所述第一贴源模型和所述第二贴源模型 的内容
相同;
所述通过所述贴源模型和所述范式模型各自所包括的主体唯一识别信 息, 关联所述范
式模型和所述贴源 模型, 得到融合模型, 包括:
通过所述第 二数据平台, 并根据所述贴源模型和所述范式模型各自所包括的主体唯一
识别信息, 关联 所述范式模型和所述贴源 模型, 得到融合模型;
所述方法还 包括:
在所述第一数据处 理平台上根据所述第一贴源 模型进行第一类型的数据分析;
在所述第二数据处理平台上根据所述第二贴源模型和所述融合模型中的至少一种进
行第二类型的数据分析。
7.一种数据融合装置, 其特 征在于, 所述装置包括:
获取模块, 用于获取来源于外部系统的第一业务数据, 并对所述第一业务数据进行主
题划分, 得到 至少一个一级 主题、 以及从属于所述 一级主题的二级 主题;
构建模块, 用于基于所述一级主题和所述二级主题, 对所述第一业务数据进行数据标
准化处理, 得到贴源 模型;
所述获取模块, 还用于获取基于内部系统的第二 业务数据构建得到的范式模型;
融合模块, 用于通过所述贴源模型和所述范式模型各自所包括的主体唯一识别信息,
关联所述范式模型和所述贴源模 型, 得到融合模型, 其中, 所述贴源模型和所述融合模型中
的至少一种模型用于进行业 务数据分析。
8.一种计算机设备, 包括存储器和处理器, 所述存储器存储有计算机程序, 其特征在
于, 所述处 理器执行所述计算机程序时实现权利要求1至 6中任一项所述的方法的步骤。
9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被
处理器执行时实现权利要求1至 6中任一项所述的方法的步骤。
10.一种计算机程序产品, 包括计算机程序, 其特征在于, 该计算机程序被处理器执行
时实现权利要求1至 6中任一项所述的方法的步骤。权 利 要 求 书 2/2 页
3
CN 115481111 A
3
专利 数据融合方法、装置、计算机设备和存储介质
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:11上传分享