(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210842886.9
(22)申请日 2022.07.18
(71)申请人 北京大学
地址 100871 北京市海淀区颐和园路5号
(72)发明人 田永鸿 倪铭坚 陈光耀 郑侠武
彭佩玺 袁粒
(74)专利代理 机构 北京辰权知识产权代理有限
公司 11619
专利代理师 谷波
(51)Int.Cl.
G06V 10/74(2022.01)
G06V 10/82(2022.01)
G06V 10/40(2022.01)
(54)发明名称
基于层间特征相似性网络稀疏化方法、 装
置、 介质及设备
(57)摘要
本公开涉及一种基于层间特征相似性的网
络稀疏化方法、 装置、 介质及设备, 所述方法包
括: 采集并存储图像数据集, 提取所述图像数据
集中的样 本; 将所述图像数据集中的样本输入神
经网络进行前向传播, 在前向传播的过程中通过
神经网络每一层对所述图像数据集中的样本进
行特征提取并存储; 计算神经网络不同层的特征
之间的相似度; 通过基于中心核对齐的层间相似
性降低方法降低所述神经网络的层间相似性。 本
公开是首个通过降低网络层间相似性间接提升
网络稀疏性的方法。 该方法在神经网络预训练、
神经网络剪枝、 神经网络稀 疏训练等领域进行了
应用, 并皆取得了性能的提升。 由于该方法提升
了网络的稀疏性, 其 促进了网络的加速与压缩。
权利要求书2页 说明书9页 附图3页
CN 115424042 A
2022.12.02
CN 115424042 A
1.一种基于层间特 征相似性的网络稀疏化方法, 其特 征在于, 包括:
采集并存 储图像数据集, 提取 所述图像数据集中的样本;
将所述图像数据集中的样本输入神经网络进行前向传播, 在前向传播的过程中通过神
经网络每一层对所述图像数据集中的样本进行 特征提取并存 储;
计算神经网络不同层的特 征之间的相似度;
通过基于中心核对齐的层间相似性降低方法降低所述神经网络的层间相似性。
2.根据权利要求1所述的方法, 其特征在于, 所述计算神经网络不同层的特征之间的相
似度具体包括:
利用基于中心核对齐的方法计算神经网络不同层之间的特 征相似性。
3.根据权利要求2所述的方法, 其特征在于, 所述利用基于 中心核对齐的方法计算神经
网络不同层之间的特 征相似性具体包括:
对于计算神经网络 中不同层的特征图X和特征图Y, 基于 中心核对齐的特征相似性计算
器给定其相似性计算公式为:
其中, CKAL(X,Y)是基于中心核对齐的特征相似性, ||C||F表示C的Frobenius范数, 其
中, C为YTX、 XTX或YTY, XT为特征图X的转置, YT为特征图Y的转置 。
4.根据权利要求3所述的方法, 其特征在于, 所述通过基于 中心核对齐的层间相似性降
低方法降低所述神经网络的层间相似性具体包括:
利用引入了基于 中心核对齐的稀疏正则化项的损失函数进行反向传播, 调 整神经网络
的参数;
其中, 将计算出的层间特 征相似性引入所述损失函数的计算中, 计算公式为:
其中,
是正则化项,
是稀疏正则化项, 而β 是
的权重, S是网络中的阶段总数, s表
示当前的阶段 数, s=1, 2, ……, S;
当S=1时, Ns是层的总数;
当S>1时, Ns是每一阶段s的层数, wij是第i层和第j层的层间特 征的相似性度量的权 重;
i, j表示层数为自然数;
Xi和Xj分别表示第i层和第j层的特 征图。
5.根据权利 要求1~4任一项中所述的方法, 其特征在于, 所述神经网络包括: ResNet或
Vision Transformer;
所述图像数据集包括: CIFAR 10、 CIFAR 100或ImageNet。
6.一种基于层间特 征相似性的网络稀疏化装置, 其特 征在于, 包括:
数据采集模块, 用于采集并存 储图像数据集, 提取 所述图像数据集中的样本;
特征提取模块, 用于将所述图像数据集中的样本输入神经网络进行前向传播, 在前向权 利 要 求 书 1/2 页
2
CN 115424042 A
2传播的过程中通过神经网络每一层对所述图像数据集中的样本进行 特征提取并存 储;
计算模块, 用于计算神经网络不同层的特 征之间的相似度;
调整模块, 用于通过基于 中心核对齐的层间相似性降低方法降低所述神经网络的层间
相似性。
7.根据权利要求6所述的装置, 其特 征在于, 所述计算模块具体用于:
对于计算神经网络 中不同层的特征图X和特征图Y, 基于 中心核对齐的特征相似性计算
器给定其相似性计算公式为:
其中, CKAL(X,Y)是基于中心核对齐的特征相似性, ||C||F表示C的Frobenius范数, 其
中, C为YTX、 XTX或YTY, XT为特征图X的转置, YT为特征图Y的转置 。
8.根据权利要求7 所述的装置, 其特 征在于, 所述调整模块具体用于:
利用引入了基于 中心核对齐的稀疏正则化项的损失函数进行反向传播, 调 整神经网络
的参数;
其中, 将计算出的层间特 征相似性引入所述损失函数的计算中, 计算公式为:
其中,
是正则化项,
是稀疏正则化项, 而β 是
的权重, S是网络中的阶段总数, s表
示当前的阶段 数, s=1, 2, ……, S;
当S=1时, Ns是层的总数;
当S>1时, Ns是每一阶段s的层数, wij是第i层和第j层的层间特 征的相似性度量的权 重;
i, j表示层数为自然数;
Xi和Xj分别表示第i层和第j层的特 征图。
9.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算
机程序, 处理器执行计算机程序时实现权利要求 1~5任一项中所述的基于层间特征相似性
的网络稀疏化方法对应的步骤。
10.一种计算机存储介质, 其上存储有计算机程序指令, 其特征在于, 所述程序指令被
处理器执行时用于实现权利要求1~5任一项中所述的基于层 间特征相似性的网络稀疏化
方法对应的步骤。权 利 要 求 书 2/2 页
3
CN 115424042 A
3
专利 基于层间特征相似性网络稀疏化方法、装置、介质及设备
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:32:04上传分享