说明:收录90万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210624115.2 (22)申请日 2022.06.02 (71)申请人 华侨大学 地址 362000 福建省泉州市城华北路269号 华侨大学 申请人 厦门亿联网络技 术股份有限公司 (72)发明人 朱建清 赵倩倩 涂美霞 曾焕强 黄诚惕 廖昀 冯万健 杜吉祥 蔡灿辉 (74)专利代理 机构 泉州市文华专利代理有限公 司 35205 专利代理师 陈雪莹 (51)Int.Cl. G06V 10/74(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种基于结构相似度的非局部注意力学习 方法 (57)摘要 本发明提供一种基于结构相似度的非局部 注意力学习方法, 可广泛应用于机器视觉领域, 例如图像分割、 图像分类、 图像识别等。 现有非局 部注意力方法简单计算不同空域位置的两个信 号内积作为二者的相似度度量, 并不完全符合人 类视觉感知特点。 针对这一问题, 本发明提出利 用结构相似度衡量不同空域位置的信号之间的 相似度, 在非局部注意力学习方法中充分考虑人 类视觉对信号感知三个重要因素, 即亮度、 对比 度和结构。 其次, 本发明进一步提出多尺度结构 相似度度量策略, 在不同尺度上更为全面地进行 信号相似度度量。 因此, 本发明能够取得比现有 非局部注意力方法更好 地注意力学习效果。 权利要求书1页 说明书4页 附图3页 CN 114972812 A 2022.08.30 CN 114972812 A 1.一种基于结构相似度的非局部注意力学习方法, 其特征在于: 用于构建单尺度结构 相似度非局部注意力模块, 所述方法包括: 步骤1、 利用3个1 ×1卷积层对输入信号进行降维 并生成g、 和 θ三个特征图; 特征图g用 于表示各位置 输入信号的值, 特 征图 和 θ用于表示表示输入信号的查询和键; 步骤2、 利用高斯核对特 征图 和 θ进行计算均值和方差, 如下式: 其中, 表示卷积运算, ⊙表示点乘运算, wk×k为高斯核, 其尺度大小为k ×k; 表 示 θ在各通道上的均值; 表示 θ在各通道上方差; 表示 θ二者点乘结果 在各通道上的方差; 步骤3、 计算特征图 和 θ不同空域位置信号之间的在k ×k尺度上的结构相似度, 用于刻 画不同空域 位置信号之间的相似度, 如下式: 其中, c表示信号的通道数; r1>0、 r2>0是小常数, 用于避免除零; 步骤4、 对所述结构相似度进行按行归一化处理后, 将其与特征图g进行矩阵乘法, 得到 k×k尺度上的非局部注意力响应yk×k; 步骤5、 对所述非局部注意力响应yk×k利用1×1卷积进行升维处理, 使其通道数和输入 信号的通道数相等, 再将升维后的非局部注意力响应与输入信号相加, 获得单尺度结构相 似度非局部注意力模块的最终输出。 2.一种基于结构相似度的非局部注意力学习方法, 其特征在于: 用于构建多尺度结构 相似度非局部注意力模块, 所述方法包括: 步骤1、 利用3个1 ×1卷积层对输入信号进行降维并生成g、 和 θ 三个特征图; 特征图g用 于表示各位置 输入信号的值, 特 征图 和 θ用于表示表示输入信号的查询和键; 步骤2、 利用给定n个尺度的高斯核 分别对特征图 和 θ计算各 个尺度下的非局部注意力响应 步骤3、 融合所述各个尺度下的非局部注意力响应 获得多尺度 非局部注意力响应y, 如下式: 步骤4、 对所述非局部注意力响应y利用1 ×1卷积进行升维处理, 使其通道数和输入信 号的通道数相等, 再将升维后的非局部注意力响应与输入信号相加, 获得多尺度结构相似 度非局部注意力模块的最终输出。权 利 要 求 书 1/1 页 2 CN 114972812 A 2一种基于结构相似度的非局部注意力学习方 法 技术领域 [0001]本发明涉及机器视觉技术领域, 特别涉及 一种基于结构相似度的非局部注意力学 习方法。 背景技术 [0002]卷积神经网络在人工智能领域中图像检测、 分割、 分类和识别具有广泛的应用。 但 是, 卷积运算是一个局部算子, 往往只能学习图像局部区域内的特征信息, 无法学习局部区 域之间的相互关系, 造成其特 征学习能力受限。 [0003]现有的非局部注意力学习方法利用不同空间位置信号之间的内积运算能够捕获 长距离空间相关性, 可以提升卷积神经网络的特征学习能力。 但是, 这种不同空间位置信号 之间的内积运算本质是以不用空域位置上两个信号相关运算作为二者的相似度度量, 并未 充分考虑图像信号在空域上 结构特性, 并不完全符合人类视 觉感知。 发明内容 [0004]本发明要解决的技术问题, 在于提供一种基于结构相似度的非局部注意力学习方 法, 采用结构相似度来衡量不同空域位置信号之间的相似度, 构建单尺度或多尺度结构相 似度非局部注意力模块, 实现更为符合人类视 觉特点的注意力学习。 [0005]第一方面, 本发明提供了一种基于结构相似度的非局部注意力学习方法, 用于构 建单尺度结构相似度非局部注意力模块, 所述方法包括: [0006]步骤1、 利用3个1 ×1卷积层对输入信号进行降维并生成g、 和 θ三个特征图; 特征 图g用于表示各位置 输入信号的值, 特 征图 和 θ用于表示表示输入信号的查询和键; [0007]步骤2、 利用高斯核对特 征图 和 θ进行计算均值和方差; [0008] [0009] [0010] [0011] [0012] [0013]其中, 表示卷积运算, ⊙表示点乘运算, wk×k为高斯核, 其尺度大小为k ×k; 表示 θ在各通道上的均值; 表示 θ在各通道上方差; 表示 θ二 者点乘结果在各通道上的方差; [0014]步骤3、 计算特征图 和θ不同空域位置信号之间的在k ×k尺度上的结构相似度, 用于刻画不同空域 位置信号之间的相互关系, 如下式: [0015] 说 明 书 1/4 页 3 CN 114972812 A 3
专利 一种基于结构相似度的非局部注意力学习方法
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:32:44
上传分享
举报
下载
原文档
(725.7 KB)
分享
友情链接
GB-T 38204-2019 岩土工程仪器 测斜仪.pdf
T-CASMES 176—2023 智慧城市管家运营服务规范.pdf
GB-T 34960.4-2017信息技术服务治理第4部分审计导则.pdf
CSA 医疗健康网络安全手册.pdf
ISO IEC 27001-2013 - 中英对照.pdf
GB-T 16649.15-2010 识别卡 集成电路卡 第15部分:密码信息应用.pdf
TB-T 1842.3-2016 受电弓滑板 第3部分:碳滑板.pdf
ISO 31101 2023 Robotics — Application services provided by service robots — Safety man.pdf
青海省节能监察办法.pdf
DB14-T 2736—2023 池塘养殖尾水处理规范 山西省.pdf
T-CSCA 120028—2019 “上海品牌”评价认证依据: 公众物业管理服务认证要求.pdf
GB-T 9634.8-2018 铁氧体磁心 表面缺陷极限导则 第8部分:PQ型磁心.pdf
GB-T 30043-2013 煤炭直接液化 液化残渣软化点的测定 环球法.pdf
CREST 应急响应指南 CSIR-Procurement-Guide 英文版.pdf
GB-T 36629.1-2018 信息安全技术 公民网络电子身份标识安全技术要求 第1部分:读写机具安全技术要求.pdf
郭启全:贯彻网络安全等级保护制度和关键信息基础设施安全保护制度的指导意见.pdf
GB-T 26766-2019 城市公共汽电车车载智能终端.pdf
GB-T 38626-2020 信息安全技术 智能联网设备口令保护指南.pdf
T-SSITS 2001—2022 低速无人车移动底盘通用技术条件.pdf
SL-T 534-2023 生态清洁小流域建设技术规范.pdf
1
/
9
评价文档
赞助2.5元 点击下载(725.7 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。