专利 基于数据共享的数据安全处理方法及系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211159444.0 (22)申请日 2022.09.22 (71)申请人窦彦彬地址 136000 吉林省四平市铁西区卫校路 26号 (72)发明人窦彦彬　周鸿韬　 (51)Int.Cl. H04L 9/40(2022.01) G06K 9/62(2022.01) G06N 5/02(2006.01) (54)发明名称基于数据共享的数据安全处理方法及系统 (57)摘要本申请提供的基于数据共享的数据安全处理方法及系统，从第一身份认证标签中确定出若干个第一敏感数据集，进而通过每一第一敏感数据集的屏蔽向量确定各第一敏感数据集间的干扰向量，由于各第一敏感数据集的第一干扰向量是基于每一第一敏感数据集的屏蔽向量确定所得到的，因此，第一敏感数据集间的干扰向量涵盖了第一局部网络数据中的屏蔽信息，在使用第一干扰向量对第一敏感知识要素进行调试的过程既相当于基于第一网络数据中的屏蔽信息对每一第一敏感数据集的第一敏感知识要素进行调试，从而可以削弱由屏蔽导致的第一局部网络数据中涵盖的与屏蔽相关噪声数据，提高数据识别的精确性。权利要求书2页说明书9页附图2页 CN 115514564 A 2022.12.23 CN 115514564 A 1.一种基于数据共享的数据安全处理方法，其特征在于，所述方法至少包括：获得需要进行解析的所述网络数据中第一身份认证标签的局部特征向量；通过所获得的局部特征向量，从所述第一身份认证标签中确定若干个第一敏感数据集，并筛选每一第一敏感数据集的第一敏感知识要素；确定所述第一身份认证标签中被屏蔽的屏蔽窗口，并通过所确定的屏蔽窗口，确定每一第一敏感数据集被屏蔽的第一屏蔽向量；获得通过统计得到的第一屏蔽向量确定的每一第一敏感数据集间的第一干扰向量；通过所获得第一干扰向量调试每一第一敏感知识要素，将调试后的第一敏感知识要素与第二敏感知识要素进行比较，得到所述第一身份认证标签的数据擦除结果，其中，所述第二敏感知识要素为：通过每一第二干扰向量对每一第二敏感数据集的敏感知识要素进行调试所得到的重要内容，每一第二敏感数据集为：通过局部网络数据中指定的第二身份认证标签内与每一第一敏感数据集相对应的特征向量。 2.如权利要求1所述的方法，其特征在于，所述将调试后的第一敏感知识要素与第二敏感知识要素进行比较，得到所述第一身份认证标签的数据擦除结果，包括：确定每一第一敏感数据集调试后的第一敏感知识要素与所对应的第二敏感知识要素的共享性特征向量，作为每一第一敏感数据集对应的共享性特征向量；基于每一第一敏感数据集的第一屏蔽向量，确定每一第一敏感数据集的第一敏感知识要素针对所述第一身份认证标签的特征的置信度；通过所确定的置信度，对各第一敏感数据集对应的共享性特征向量进行融合处理，得到融合处理结果，作为所述第一身份认证标签与所述第二身份认证标签的共享性特征向量；通过所得到的共享性特征向量，确定所述第一身份认证标签的数据擦除结果。 3.如权利要求2所述的方法，其特征在于，所述基于每一第一敏感数据集的第一屏蔽向量，确定每一第一敏感数据集的第一敏感知识要素针对所述第一身份认证标签的特征的置信度，包括：基于每一第一敏感数据集的第一屏蔽向量和与所对应的第二敏感数据集的第二屏蔽向量，确定每一第一敏感数据集的第一敏感知识要素针对所述第一身份认证标签的特征的置信度。 4.如权利要求1所述的方法，其特征在于，所述将调试后的第一敏感知识要素与第二敏感知识要素进行比较，得到所述第一身份认证标签的数据擦除结果，包括：通过各第一敏感数据集的第一屏蔽向量，对各第一敏感数据集的第一敏感知识要素进行拼接处理，得到第一拼接处理向量，并通过各第二敏感数据集的第二屏蔽向量，对各第二敏感数据集的第二敏感知识要素进行拼接处理，得到第二拼接处理向量；确定所述第一拼接处理向量和所述第二拼接处理向量的共享性特征向量；通过确定所得到的共享性特征向量，确定所述第一身份认证标签的数据擦除结果。 5.如权利要求1 ‑4中任一项所述的方法，其特征在于，依照以下表达式确定第一干扰向量： Pro＝ max(屏蔽向量 masking vector， target value)x(1 ‑屏蔽向量 masking vector)其中， Pro为第一敏感数据集Sensitive Data中的第一干扰向量，屏蔽向量masking vector表示第一敏感数据集Sensitive Data中的屏蔽向量， target value为指定的目标值。 6.如权利要求1所述的方法，其特征在于，所述通过所获得第一干扰向量调试每一第一权　利　要　求　书 1/2 页 2 CN 115514564 A 2敏感知识要素，并将调试后的第一敏感知识要素与第二敏感知识要素进行比较，得到所述第一身份认证标签的数据擦除结果，包括：将每一第一敏感知识要素、每一第一敏感数据集间的第一干扰向量、每一第二敏感数据集的敏感知识要素、每一第二敏感数据集间的第二干扰向量加载至在先配置的人工智能先线程，以使得所述人工智能先线程基于每一第一干扰向量对每一第一敏感知识要素进行调试，得到调试后的第一敏感知识要素，并基于每一第二干扰向量对每一第二敏感数据集的敏感知识要素进行调试，得到第二敏感知识要素，以及比较所述调试后的第一敏感知识要素与所述第二敏感知识要素进行比较，输出数据擦除结果；获取所述人工智能先线程输出的所述数据擦除结果。 7.如权利要求1所述的方法，其特征在于，所述通过所获得的局部特征向量，从所述第一身份认证标签中确定若干个第一敏感数据集，包括：通过所获得的局部特征向量的重要种类，以及指定的局部特征向量种类与第一敏感数据集的特征向量种类之间的匹配情况，确定各个局部特征向量所属的特征向量种类；针对各个特征向量种类，基于属于该特征向量种类的局部特征向量的定位数据，获得属于该特征向量种类的敏感数据集的基准定位，并确定属于该特征向量种类的敏感数据集的基准定位与靠近敏感数据集的基准定位之间的特征向量间差异，通过所确定的特征向量间差异，确定属于该特征向量种类的敏感数据集的特征向量向量；基于所获得的基准定位和确定所得的特征向量向量，确定各个基准定位所属的第一敏感数据集。 8.如权利要求1所述的方法，其特征在于，所述筛选每一第一敏感数据集内的局部描述内容，包括：筛选所述需要进行解析的网络数据中第一身份认证标签的全部知识向量集；基于每一第一敏感数据集在所述第一身份认证标签中所处的定位，确定所述全部知识向量集中与每一第一敏感数据集对应的特征向量；依照指定知识向量集，对每一第一敏感数据集的特征向量进行更新，生成向量为所述指定知识向量集的知识向量；确定与每一第一敏感数据集的知识向量对应的局部描述内容，作为每一第一敏感数据集内的局部描述内容。 9.一种基于数据共享的数据安全处理系统，其特征在于，包括互相之间通信的处理器和存储器，所述处理器用于从所述存储器中读取计算机程序并执行，以实现权利要求 1‑8任一项所述的系统。权　利　要　求　书 2/2 页 3 CN 115514564 A 3

专利 基于数据共享的数据安全处理方法及系统

专利基于数据共享的数据安全处理方法及系统