(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211159444.0
(22)申请日 2022.09.22
(71)申请人 窦彦彬
地址 136000 吉林省四平市铁西区卫校路
26号
(72)发明人 窦彦彬 周鸿韬
(51)Int.Cl.
H04L 9/40(2022.01)
G06K 9/62(2022.01)
G06N 5/02(2006.01)
(54)发明名称
基于数据共享的数据安全处 理方法及系统
(57)摘要
本申请提供的基于数据共享的数据安全处
理方法及系统, 从第一身份认证标签中确定出若
干个第一敏感数据集, 进而通过每一第一敏感数
据集的屏蔽向量确定各第一敏感数据集间的干
扰向量, 由于各第一敏 感数据集的第一干扰向量
是基于每一第一敏感数据集的屏蔽向量确定所
得到的, 因此, 第一敏感数据集间的干扰向量涵
盖了第一局部网络数据中的屏蔽信息, 在使用第
一干扰向量对第一敏感知识要素进行调试的过
程既相当于基于第一网络数据中的屏蔽信息对
每一第一敏感数据集的第一敏感知识要素进行
调试, 从而可以削弱由屏蔽导致的第一局部网络
数据中涵盖的与屏蔽相关噪声数据, 提高数据 识
别的精确性。
权利要求书2页 说明书9页 附图2页
CN 115514564 A
2022.12.23
CN 115514564 A
1.一种基于数据共享的数据安全处 理方法, 其特 征在于, 所述方法至少包括:
获得需要进行解析的所述网络数据中第 一身份认证标签的局部特征向量; 通过所获得
的局部特征向量, 从所述第一身份认证标签中确定若干个第一敏感数据集, 并筛选每一第
一敏感数据集的第一敏感知识要素;
确定所述第一身份认证标签中被屏蔽的屏蔽窗口, 并通过所确定的屏蔽窗口, 确定每
一第一敏感数据集被屏蔽的第一屏蔽向量;
获得通过统计得到的第一屏蔽向量确定的每一第一敏感数据集间的第一干扰向量;
通过所获得第 一干扰向量调试每一第 一敏感知识要素, 将调试后的第 一敏感知识要素
与第二敏感知识要 素进行比较, 得到所述第一身份认证标签的数据擦除结果, 其中, 所述第
二敏感知识要 素为: 通过每一第二干扰向量对每一第二敏感数据集的敏感知识要 素进行调
试所得到的重要内容, 每一第二敏感数据集为: 通过局部网络数据中指定的第二身份认证
标签内与每一第一敏感数据集相对应的特 征向量。
2.如权利要求1所述的方法, 其特征在于, 所述将调试后的第 一敏感知识要素与第 二敏
感知识要素进行比较, 得到所述第一身份认证标签的数据擦除结果, 包括:
确定每一第一敏感数据集调试后的第一敏感知识要素与所对应的第二敏感知识要素
的共享性特征向量, 作为每一第一敏感数据集对应的共享 性特征向量;
基于每一第 一敏感数据集的第 一屏蔽向量, 确定每一第 一敏感数据集的第 一敏感知识
要素针对所述第一身份认证标签的特 征的置信度;
通过所确定的置信度, 对各第一敏感数据集对应的共享性特征向量进行融合处理, 得
到融合处理结果, 作为所述第一身份认证标签与所述第二身份认证标签的共享性特征向
量;
通过所得到的共享 性特征向量, 确定所述第一身份认证标签的数据擦除结果。
3.如权利要求2所述的方法, 其特征在于, 所述基于每一第 一敏感数据集的第 一屏蔽向
量, 确定每一第一敏感数据集的第一敏感知识要 素针对所述第一身份认证标签的特征的置
信度, 包括: 基于每一第一敏感数据集的第一屏蔽向量和与所对应的第二敏感数据集的第
二屏蔽向量, 确定每一第一敏感数据集的第一敏感知识要 素针对所述第一身份认证标签的
特征的置信度。
4.如权利要求1所述的方法, 其特征在于, 所述将调试后的第 一敏感知识要素与第 二敏
感知识要素进行比较, 得到所述第一身份认证标签的数据擦除结果, 包括:
通过各第一敏感数据集的第 一屏蔽向量, 对各第 一敏感数据集的第 一敏感知识要素进
行拼接处理, 得到第一拼接处理向量, 并通过各第二敏感数据集的第二屏蔽向量, 对各第二
敏感数据集的第二敏感知识要素进行拼接处 理, 得到第二 拼接处理向量;
确定所述第一 拼接处理向量和所述第二 拼接处理向量的共享 性特征向量;
通过确定所 得到的共享 性特征向量, 确定所述第一身份认证标签的数据擦除结果。
5.如权利要求1 ‑4中任一项所述的方法, 其特征在于, 依照以下表达式确定第 一干扰向
量: Pro= max(屏蔽向量 masking vector, target value)x(1 ‑屏蔽向量 masking vector)其
中, Pro为第一敏感数据集Sensitive Data中的第一干扰向量, 屏蔽向量masking vector表
示第一敏感数据集Sensitive Data中的屏蔽向量, target value为指定的目标值。
6.如权利要求1所述的方法, 其特征在于, 所述通过所获得第 一干扰向量调试每一第 一权 利 要 求 书 1/2 页
2
CN 115514564 A
2敏感知识要素, 并将调 试后的第一敏感知识要素与第二敏感知识要素进行比较, 得到所述
第一身份认证标签的数据擦除结果, 包括:
将每一第一敏感知识要素、 每一第一敏感数据集间的第一干扰向量、 每一第二敏感数
据集的敏感知识要素、 每一第二敏感数据集间的第二干扰向量加载至在先配置的人工智能
先线程, 以使得所述人工智能先线程基于每一第一干扰向量对每一第一敏感知识要素进 行
调试, 得到调试后的第一敏感知识要素, 并基于每一第二干扰 向量对每一第二敏感数据集
的敏感知识要素进行调 试, 得到第二敏感知识要素, 以及比较所述调试后的第一敏感知识
要素与所述第二敏感知识要素进行比较, 输出数据擦除结果; 获取所述人工智能先线程输
出的所述数据擦除结果。
7.如权利要求1所述的方法, 其特征在于, 所述通过所获得的局部特征向量, 从所述第
一身份认证标签中确定若干个第一敏感数据集, 包括:
通过所获得的局部特征向量的重要种类, 以及指定的局部特征向量种类与第 一敏感数
据集的特 征向量种类之间的匹配情况, 确定各个局部特 征向量所属的特 征向量种类;
针对各个特征向量种类, 基于属于该特征向量种类的局部特征向量的定位数据, 获得
属于该特征向量种类的敏感数据集的基准定位, 并确定属于该特征向量种类的敏感数据集
的基准定位与靠近敏感数据集的基准定位之间的特征向量间差异, 通过所确定的特征向量
间差异, 确定属于该 特征向量种类的敏感数据集的特 征向量向量;
基于所获得的基准定位和确定所得的特征向量向量, 确定各个基准定位所属的第 一敏
感数据集。
8.如权利要求1所述的方法, 其特征在于, 所述筛选每一第 一敏感数据集内的局部描述
内容, 包括:
筛选所述需要 进行解析的网络数据中第一身份认证标签的全部知识向量 集;
基于每一第 一敏感数据集在所述第 一身份认证标签中所处 的定位, 确定所述全部知识
向量集中与每一第一敏感数据集对应的特 征向量;
依照指定知识向量集, 对每一第一敏感数据集的特征向量进行更新, 生成向量为所述
指定知识向量 集的知识向量;
确定与每一第 一敏感数据集的知识向量对应的局部描述内容, 作为每一第 一敏感数据
集内的局部描述内容。
9.一种基于数据共享的数据安全处理系统, 其特征在于, 包括互相之间通信的处理器
和存储器, 所述处理器用于从所述存储器中读取计算机程序并执行, 以实现权利要求 1‑8任
一项所述的系统。权 利 要 求 书 2/2 页
3
CN 115514564 A
3
专利 基于数据共享的数据安全处理方法及系统
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 16:42:37上传分享