说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221084746 3.6 (22)申请日 2022.07.19 (71)申请人 山东千面科技有限公司 地址 261000 山东省潍坊市综合保税区创 新创业中心三层3 008-53室 (72)发明人 张善源 卢宪凯 黄泽锋 李姝颖  魏惠贤  (74)专利代理 机构 济南光启专利代理事务所 (普通合伙) 37292 专利代理师 衣明春 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/74(2022.01) (54)发明名称 一种基于动量更新的视频目标分割方法和 系统 (57)摘要 本发明公开了一种基于动量更新的视频目 标分割方法和系统, 所述方法包括: 获取目标帧 图像与参考帧图像, 参考帧图像为目标帧之前的 所有图像, 将目标帧图像放入目标帧编码器, 得 到相应的输出特征嵌入, 同理得到参考帧图像相 应的特征嵌入, 计算目标帧与参考帧特征嵌入不 同像素点间的相似度, 构成相似度矩阵, 再将其 与参考帧的真实图像进行相乘相加操作, 重构当 前帧, 完成对视频目标的分割。 该发明提出使用 目标帧之前的所有帧来完成对目标帧的分割。 且 在训练过程中目标帧编码器采用标准的反向传 播算法、 参考帧编码器使用动量更新方法更新模 型的参数, 这样既可解决目标消失与再现问题, 又不增加训练模 型占用的存储空间, 从而提高视 频目标分割的效果。 权利要求书3页 说明书9页 附图1页 CN 115376040 A 2022.11.22 CN 115376040 A 1.一种基于动量更新的视频目标分割方法, 其特 征在于, 包括以下步骤: 步骤1: 构造视频目标分割的数据集, 对视频进行抽帧预处理, 对图像通道进行随机舍 弃; 步骤2: 将目标帧图像放入目标帧编码器中, 得到其对应的输出 特征嵌入; 步骤3: 将目标帧之前的所有图像分别放入参考帧编码器 中, 分别得到它们对应的特征 嵌入; 步骤4: 计算目标帧特征嵌入与参考帧特征嵌入不同像素点之间的相似度, 构 成相似度 矩阵; 步骤5: 使用相似度矩阵与参考帧的真实图像进行相乘相加操作, 完成对目标帧图像的 重构; 步骤6: 使用目标帧真实图像与得到的重构图像 计算损失函数; 步骤7: 使用反向传播 算法对目标帧编码器进行参数 更新; 步骤8: 使用动量更新方法对参 考帧编码器进行参数 更新。 2.如权利要求1所述的一种基于动 量更新的视频目标分割方法, 其特征在于, 所述步骤 1中数据集的构造方法为: 视频每五帧抽出一帧, 如果帧间隔过小的话会导致目标变化较 小, 而且会造成不必 要的计算, 将取出的帧从RGB空间转换到Lab空间, 将转换后的图像随机 舍弃其中的一个通道, 舍弃 的一个通道图像是灰度图, 我们使用舍弃 的这个灰度图当作每 一帧的真实图像, 原先的lab空间3通道图像放到编码器中进行特征提取并计算相似度矩 阵, 舍弃的灰度图像当作图像的真实图像用于与关系矩阵相乘, 重构当前帧。 3.如权利要求2所述的一种基于动 量更新的视频目标分割方法, 其特征在于, 所述步骤 2中目标帧特 征嵌入的获取 方法为: Q=Φ(Iq, θq) 其中: Iq代表目标帧的三 通道Lab图像; Φ代表将目标帧图像放入目标帧编码器中进行计算, 使用的目标帧编码器是Resnet 18 舍弃最后全连接层之后的网络; θq代表目标帧编码器的模型参数; Q代表得到的目标帧图像的特 征嵌入。 4.如权利要求3所述的一种基于动 量更新的视频目标分割方法, 其特征在于, 所述步骤 3中参考帧特征嵌入的获取 方法为: R=Φ(Ir, θr) 其中: Ir代表参考帧的三 通道Lab图像; Φ代表将参考帧图像放入参考帧编码器中进行计算, 使用的参考帧编码器是Resnet 18 舍弃最后全连接层之后的网络; θr代表参考帧编码器的模型参数; R代表得到的参 考帧图像的特 征嵌入。 5.如权利要求4所述的一种基于动 量更新的视频目标分割方法, 其特征在于, 所述步骤 4中相似度矩阵的计算方法为:权 利 要 求 书 1/3 页 2 CN 115376040 A 2其中: Qi代表目标帧图像的特 征嵌入中第i个 像素点的特 征向量; 代表第k个参 考帧图像的特 征嵌入中第j个邻居像素点的特 征向量; p代表目标帧图像的特征嵌入中第i个像素点在参考帧图像的特征嵌入中的所有邻居 像素点; n代表所有的参 考帧图像, 即目标帧之前的所有图像; Ak代表目标帧图像与第k个参 考帧图像不同像素点之间的相似度矩阵; 代表目标帧图像中第i个 像素点与第k个参考帧图像中第j个邻居像素点之间的相似 度。 6.如权利要求5所述的一种基于动 量更新的视频目标分割方法, 其特征在于, 所述步骤 5中目标帧的重构方法为: 其中: 代表目标帧图像中第i个 像素点与第k个参考帧图像中第j个邻居像素点之间的相似 度; Vk代表第k个参 考帧的真实图像, 即舍弃的灰度图像; 代表第k个参 考帧的真实图像中第j个邻居像素点的颜色值; p代表目标帧图像的特征嵌入中第i个像素点在参考帧图像的特征嵌入中的所有邻居 像素点; n代表所有的参 考帧图像, 即目标帧之前的所有图像; 代表目标帧的重构图像; 代表目标帧的重构图像中第i个 像素点的预测值。 7.如权利要求6所述的一种基于动 量更新的视频目标分割方法, 其特征在于, 所述步骤 6中损失的计算方法为: 其中: 其中: i代表目标帧图像中的第i个 像素点; num代表目标帧图像中像素点的总数;权 利 要 求 书 2/3 页 3 CN 115376040 A 3

PDF文档 专利 一种基于动量更新的视频目标分割方法和系统

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于动量更新的视频目标分割方法和系统 第 1 页 专利 一种基于动量更新的视频目标分割方法和系统 第 2 页 专利 一种基于动量更新的视频目标分割方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:32:02上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。