说明:收录90万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210756204.2 (22)申请日 2022.06.29 (71)申请人 中国人民解 放军火箭军工程大 学 地址 710025 陕西省西安市灞桥区同心路2 号 (72)发明人 朱晨豪 叶霞 陆琪多 杨章平 罗承天 徐翰涛 (74)专利代理 机构 北京高沃 律师事务所 1 1569 专利代理师 杜阳阳 (51)Int.Cl. G06V 30/262(2022.01) G06V 10/82(2022.01) G06N 3/08(2006.01) G06N 3/04(2006.01) G06F 40/30(2020.01) (54)发明名称 一种基于额外语义空间的图像描述生成方 法及系统 (57)摘要 本发明公开了一种基于额外语义空间的图 像描述生 成方法及系统, 涉及图像描述生成技术 领域, 方法包括: 按照实体对目标图像进行划分, 得到多个实体图像向量; 将每个实体图像向量输 入到训练好的区域解码器中, 得到对应的语义信 息向量; 将每个实体图像向量和对应的语义信息 向量输入到语义空间解码器中, 得到目标图像的 描述。 和传统的图像描述生成方法相比, 本发明 根据待测试的图像获取多个待测试的图像向量 和多个相应的语义信息向量, 从而得到描述, 提 高了生成描述的准确性。 权利要求书2页 说明书5页 附图2页 CN 115131798 A 2022.09.30 CN 115131798 A 1.一种基于额外语义空间的图像描述 生成方法, 其特 征在于, 所述方法包括: 按照实体对目标图像进行划分, 得到多个实体图像向量; 将每个实体图像向量输入到训练好的区域 解码器中, 得到对应的语义信息向量; 将每个实体图像向量和对应的语义信 息向量输入到语义空间解码器中, 得到所述目标 图像的描述。 2.根据权利要求1所述的基于额外语义空间的图像描述生成方法, 其特征在于, 所述按 照实体对目标图像进行划分, 得到多个实体图像向量, 具体包括: 使用Fast ‑RCNN算法对目标图像进行目标检测, 得到多个目标实体; 将每个目标实体输入到图像编码器中, 得到对应的实体图像向量。 3.根据权利要求1所述的基于额外语义空间的图像描述生成方法, 其特征在于, 所述训 练后的区域 解码器的确定方法为: 获取训练图像文本向量对; 所述训练图像文本向量对包括: 多个训练图像向量和对应 的训练语义信息向量; 将所述训练图像文本向量对输入到区域解码器中, 根据交叉熵损失函数和强化学习方 法获得所述训练好的区域 解码器。 4.根据权利要求1所述的基于额外语义空间的图像描述生成方法, 其特征在于, 所述将 每个实体图像向量和对应的语义信息向量输入到语义空间解码器中, 得到所述目标图像的 描述, 具体包括: 将每个实体图像向量对应的语义信 息向量调整到 固定长度, 并将每个实体图像向量和 对应的调整到固定长度的语义信息向量输入到语义空间解码 器中, 得到所述目标图像的描 述。 5.根据权利要求3所述的基于额外语义空间的图像描述生成方法, 其特征在于, 所述获 取训练图像文本向量对, 具体包括: 使用Fast ‑RCNN算法对训练图像进行目标检测, 得到训练图像实体; 将所述训练图像实体输入到图像编码器中, 得到多个训练图像向量; 将与所述训练图像对应的训练文本输入到文本编码器中, 得到多个训练语义信息向 量; 利用相似度得分矩阵来匹配训练图像向量和训练语义信息向量得到所述训练图像文 本向量对。 6.一种基于额外语义空间的图像描述 生成系统, 其特 征在于, 包括: 目标图像划分模块, 用于按照实体对目标图像进行划分, 得到多个实体图像向量; 语义信息向量获取模块, 用于将每个实体图像向量输入到训练好的区域解码器中, 得 到对应的语义信息向量; 图像描述生成模块, 用于将每个实体图像向量和对应的语义信 息向量输入到语义空间 解码器中, 得到所述目标图像的描述。 7.根据权利要求6所述的基于额外语义空间的图像描述生成系统, 其特征在于, 所述目 标图像划分模块, 具体包括: 目标检测子模块, 用于使用Fast ‑RCNN算法对目标图像进行目标检测, 得到多个目标实 体;权 利 要 求 书 1/2 页 2 CN 115131798 A 2实体图像向量生成子模块, 用于将每个目标实体输入到 图像编码器中, 得到对应的实 体图像向量。 8.根据权利要求6所述的基于额外语义空间的图像描述生成系统, 其特征在于, 所述语 义信息向量获取模块包括: 区域解码器确定子模块; 所述区域解码器确定子模块具体包括 为: 训练图像文本向量对获取单元, 用于获取训练图像文本向量对; 所述训练图像文本向 量对包括: 多个训练图像向量和对应的训练语义信息向量; 区域解码器确定单元, 用于将所述训练图像文本向量对输入到区域解码器中, 根据交 叉熵损失函数和强化学习方法获得 所述训练好的区域 解码器。 9.根据权利要求6所述的基于额外语义空间的图像描述生成系统, 其特征在于, 所述图 像描述生成模块, 具体包括: 图像描述生成单元, 用于将每个实体图像向量对应的语义信息向量调整到固定长度, 并将每个实体图像向量和对应的调整到固定长度的语义信息 向量输入到语义空间解码器 中, 得到所述目标图像的描述。 10.根据权利要求8所述的基于额外语义空间的图像描述生成系统, 其特征在于, 所述 训练图像文本向量对获取 单元, 具体包括: 训练图像实体获取子单元, 用于使用Fast ‑RCNN算法对训练图像进行目标检测, 得到训 练图像实体; 训练图像向量获取子单元, 用于将所述训练图像实体输入到 图像编码器中, 得到多个 训练图像向量; 训练语义信 息向量获取子单元, 用于将与 所述训练图像对应的训练文本输入到文本编 码器中, 得到多个训练语义信息向量; 训练图像文本向量对获取子单元, 用于利用相似度得分矩阵来匹配训练图像向量和训 练语义信息向量得到所述训练图像文本向量对。权 利 要 求 书 2/2 页 3 CN 115131798 A 3
专利 一种基于额外语义空间的图像描述生成方法及系统
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:08:45
上传分享
举报
下载
原文档
(525.1 KB)
分享
友情链接
GB-T 42583-2023 信息安全技术 政务网络安全监测平台技术规范.pdf
T-QGCML 302—2022 能源企业数字化转型1+6管理体系.pdf
JR-T 0185—2020 《商业银行应用程序接口安全管理规范》.pdf
DB33-T 2495-2022 中华蜜蜂饲养技术规范 浙江省.pdf
商用密码应用安全性评估“十问十答”.pdf
GB-T 42013-2022 信息安全技术 快递物流服务数据安全要求.pdf
DB11-T 715-2018 公共汽电车场站功能设计要求 北京市.pdf
GB-T 26463-2011 羰基合成脂肪醇.pdf
GB-T 32922-2016 信息安全技术 IPSec VPN安全接入基本要求与实施指南.pdf
GB-T 20985.1-2017 信息技术 安全技术 信息安全事件管理 第1部分:事件管理原理.pdf
GB-T 16451-2017 天然脂肪醇.pdf
信通院 5G+云+AI:数字经济新时代的引擎.pdf
T-CZRX 001—2021 注塑机烘料桶智能节能伺服器.pdf
GB-T 33770.2-2019信息技术服务外包第2部分数据保护要求.pdf
YD-T 4246-2023 电信网和互联网数据异常行为监测技术要求与测试方法.pdf
GB-T 21063.3-2007 政务信息资源目录体系 第3部分:核心元数据.pdf
信通院 数据清洗、去标识化、匿名化业务规程 试行.pdf
GB-T 32234.8-2015 个人浮力设备 第8部分:附件 安全要求和试验方法.pdf
T-CCTAS 18—2021 固化剂混合料设计与施工技术指南.pdf
CSA 零信任商业价值综述.pdf
1
/
3
10
评价文档
赞助2.5元 点击下载(525.1 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。