说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211032717.5 (22)申请日 2022.08.26 (71)申请人 中国银行股份有限公司 地址 100818 北京市西城区复兴门内大街1 号 (72)发明人 范佳佳 文国军 刘美花 夏鼎玺  余静莹 张海洋  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 张东梅 (51)Int.Cl. G06F 16/23(2019.01) G06F 16/22(2019.01) G06F 16/215(2019.01) G06F 16/28(2019.01)G06F 21/60(2013.01) (54)发明名称 流数据处 理方法、 装置、 存 储介质和设备 (57)摘要 本申请公开了一种流数据处理方法、 装置、 存储介质和设备, 应用于大数据领域, 该方法为: 从预设消息队列中获取流数据; 对 各个数据进行 处理, 得到每个数据的处理结果; 基于数据所包 含的字段, 确定数据的第一校验码; 对处理结果 进行校验码转换, 得到数据的第二校验码; 在第 一校验码和第二校验码不相同的情况下, 对处理 结果进行修正, 得到满足预设要求的修正结果; 将数据以及修正结果, 保存到目标数据库中。 该 方法对流数据所示数据的第一校验码和第二校 验码进行比对, 在第一校验码和第二校验码不相 同的情况下, 对数据的处理结果进行修正, 得到 满足预设要求的修正结果, 使得处理后的数据与 处理前的数据保持一 致。 权利要求书2页 说明书8页 附图4页 CN 115374137 A 2022.11.22 CN 115374137 A 1.一种流数据处 理方法, 其特 征在于, 包括: 从预设消息队列中获取流数据; 所述流数据包括数据序列; 所述数据序列包括经由源 数据库上传给所述预设消息队列的多个数据, 且每个所述数据均按照所述数据自身的上传 次序进行排序; 对各个所述数据进行处 理, 得到每 个所述数据的处 理结果; 基于所述数据所包 含的字段, 确定所述数据的第一校验码; 对所述处 理结果进行 校验码转换, 得到所述数据的第二校验码; 在所述第一校验码和所述第二校验码不相同的情况下, 对所述处理结果进行修正, 得 到满足预设要求的修正结果; 所述预设要求为: 经 由对所述修正结果进行校验码转换得到 的第二校验码, 与所述第一校验码保持一 致; 将所述数据以及所述 修正结果, 保存到目标 数据库中。 2.根据权利要求1所述的方法, 其特征在于, 所述对各个所述数据进行处理, 得到每个 所述数据的处 理结果, 包括: 为各个所述数据分配时间戳和水印; 所述时间戳指示所述数据的处理时间; 所述水印 指示处理所述数据时的延迟时间; 按照处理时间从早到晚的顺序, 并延迟每个所述数据的延迟时间之后, 对各个所述数 据进行处 理, 得到每 个所述数据的处 理结果。 3.根据权利要求1所述的方法, 其特征在于, 所述按照处理时间从早到晚的顺序, 并延 迟每个所述数据的延迟时间之后, 对各个所述数据进行处理, 得到每个所述数据的处理结 果, 包括: 对各个所述数据中符合预设条件的数据进行删除, 得到有效流数据; 所述预设条件为: 数据的字段值 为空, 以及数据的字段包 含有预设敏感字符; 按照处理时间从早到晚的顺序, 并延迟每个所述数据的延迟时间之后, 对于所述有效 流数据中的每 个所述数据进行处 理, 得到每 个所述数据的处 理结果。 4.根据权利要求3所述的方法, 其特征在于, 所述按照处理时间从早到晚的顺序, 并延 迟每个所述数据的延迟时间之后, 对于所述有效流数据中的每个所述数据进行处理, 得到 每个所述数据的处 理结果, 包括: 对所述有 效流数据中的各个所述数据进行降维, 以使剔除所述有 效流数据中每个数据 的冗余属性列, 得到目标流数据; 按照处理时间从早到晚的顺序, 并延迟每个所述数据的延迟时间之后, 对于所述目标 流数据中的每 个所述数据进行处 理, 得到每 个所述数据的处 理结果。 5.根据权利要求4所述的方法, 其特征在于, 所述按照处理时间从早到晚的顺序, 并延 迟每个所述数据的延迟时间之后, 对于所述 目标流数据中的每个所述数据进行处理, 得到 每个所述数据的处 理结果, 包括: 对所述目标流数据中的各个所述数据进行分类, 得到多个数据分组; 所述数据分组包 括预设属性相同的多个数据; 对于每个所述数据分组, 按照处理时间从早到晚的顺序, 并延迟每个数据的延迟时间 之后, 依次对所述数据分组中各个数据进行处理, 得到所述数据分组中每个数据的处理结 果。权 利 要 求 书 1/2 页 2 CN 115374137 A 26.根据权利要求1所述的方法, 其特征在于, 所述基于所述数据所包含的字段, 确定所 述数据的第一校验码, 包括: 将所述数据所包 含的各个字段进行拼接, 得到所述数据的字符串; 对所述字符串 进行校验码转换, 得到所述数据的第一校验码。 7.根据权利要求1所述的方法, 其特征在于, 所述对所述处理结果进行校验码转换, 得 到所述数据的第二校验码之后, 还 包括: 在所述第一校验码和所述第 二校验码相同的情况下, 直接将所述数据以及所述处理结 果, 保存到所述目标 数据库中。 8.一种流数据处 理装置, 其特 征在于, 包括: 获取单元, 用于从预设消息队列中获取流数据; 所述流数据包括数据序列; 所述数据序 列包括经由源数据库上传给所述预设消息队列的多个数据, 且每个所述数据均按照所述数 据自身的上传次序进行排序; 处理单元, 用于对各个所述数据进行处 理, 得到每 个所述数据的处 理结果; 确定单元, 用于基于所述数据所包 含的字段, 确定所述数据的第一校验码; 转换单元, 用于对所述处 理结果进行 校验码转换, 得到所述数据的第二校验码; 修正单元, 用于在所述第一校验码和所述第二校验码不相同的情况下, 对所述处理结 果进行修正, 得到满足预设要求的修正结果; 所述预设要求为: 经由对所述修正结果进行校 验码转换 得到的第二校验码, 与所述第一校验码保持一 致; 保存单元, 用于将所述数据以及所述 修正结果, 保存到目标 数据库中。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质包括存储的程序, 其中, 所述 程序执行权利要求1 ‑7任一所述的流数据处 理方法。 10.一种流数据处理设备, 其特征在于, 包括: 处理器、 存储器和总线; 所述处理器与所 述存储器通过 所述总线连接; 所述存储器用于存储程序, 所述处理器用于运行程序, 其中, 所述程序运行时执行权利 要求1‑7任一所述的流数据处 理方法。权 利 要 求 书 2/2 页 3 CN 115374137 A 3

PDF文档 专利 流数据处理方法、装置、存储介质和设备

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 流数据处理方法、装置、存储介质和设备 第 1 页 专利 流数据处理方法、装置、存储介质和设备 第 2 页 专利 流数据处理方法、装置、存储介质和设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:42:56上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。