(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 20221078590 0.6
(22)申请日 2022.07.04
(71)申请人 腾讯科技 (北京) 有限公司
地址 100080 北京市海淀区海淀大街38号
银科大厦16层16 01-1608室
(72)发明人 徐鲁辉 熊鹏飞 高洵
(74)专利代理 机构 广州三环 专利商标代理有限
公司 44202
专利代理师 贾允
(51)Int.Cl.
G06F 16/783(2019.01)
G06F 40/279(2020.01)
G06F 40/30(2020.01)
G06V 20/40(2022.01)
G06V 20/62(2022.01)G06V 10/74(2022.01)
G06V 10/774(2022.01)
G06N 20/00(2019.01)
(54)发明名称
视频封面确定方法、 装置、 设备、 存储介质及
产品
(57)摘要
本申请公开了一种视频封面确定方法、 装
置、 设备、 存储介质及产品, 属于计算机技术领
域。 所述方法包括: 获取目标视频和目标视频对
应的视频文本; 对视频文本进行文本含义检测处
理, 得到检测结果; 基于检测结果和至少两个图
像帧, 确定目标视频对应的内容特征序列; 根据
内容特征序列进行视频封面预测处理, 得到至少
两个图像帧对应的预测数据; 基于预测数据, 确
定目标视频对应的视频封面。 本申请实施例提供
的技术方案, 通过对视频文本进行含义检测, 得
到表征文本与视频之间语义关联程度的检测结
果, 将其与视频的图像帧结合可以确定内容特征
序列并进行封面预测, 得到能够表征图像帧与视
频之间内容契合程度的预测数据, 从而确定与视
频内容契合的封面。
权利要求书2页 说明书16页 附图7页
CN 115129935 A
2022.09.30
CN 115129935 A
1.一种视频封面确定方法, 其特 征在于, 所述方法包括:
获取目标视频和所述目标视频对应的视频文本, 所述目标视频包括至少两个图像帧;
对所述视频文本进行文本含义检测 处理, 得到检测结果, 所述检测结果表征所述视频
文本与所述目标视频之间的语义关联程度;
基于所述检测结果和所述至少两个图像帧, 确定所述目标视频对应的内容特 征序列;
根据所述内容特征序列进行视频封面预测处理, 得到所述至少两个图像帧对应的预测
数据, 所述预测数据表征 所述至少两个图像帧与所述目标视频之间的内容契合 程度;
基于所述预测数据, 确定所述目标视频对应的视频封面。
2.根据权利要求1所述的方法, 其特征在于, 所述对所述视频文本进行文本含义检测处
理, 得到检测结果, 包括:
将所述视频文本输入文本含义检测模型进行文本含义检测处理, 得到所述视频文本对
应的文本含义分;
其中, 所述文本含义分与所述语义关联程度呈正相关, 所述检测结果包括所述文本含
义分, 所述文本含义检测模型是基于样本视频对应的样本视频文本和标签信息进 行训练得
到的机器学习模型, 所述标签信息表征所述样本视频文本与所述样本视频之间的内容相关
度。
3.根据权利要求2所述的方法, 其特征在于, 所述基于所述检测结果和所述至少两个图
像帧, 确定所述目标视频对应的内容特 征序列, 包括:
在所述文本含义分大于或等于预设阈值的情况下, 基于所述视频文本和所述至少两个
图像帧, 生成所述内容特 征序列。
4.根据权利要求3所述的方法, 其特征在于, 所述基于所述检测结果和所述至少两个图
像帧, 确定所述目标视频对应的内容特 征序列, 还 包括:
在所述文本含义分小于所述预设阈值的情况下, 基于所述至少两个图像帧, 生成所述
内容特征序列。
5.根据权利要求1所述的方法, 其特征在于, 所述预测数据包括所述至少两个图像帧对
应的内容契合分, 所述根据所述内容特征序列进行视频封面预测处理, 得到所述至少 两个
图像帧对应的预测数据, 包括:
将所述内容特征序列输入封面预测模型进行视频封面预测处理, 输出所述内容契合
分, 所述封面预测模型是基于样本视频和标签数据进行训练得到的机器学习模型, 所述标
签数据表征所述样本视频中的样本图像帧与所述样本视频对应的样本封面之间的对应关
系;
所述基于所述预测数据, 确定所述目标视频对应的视频封面, 包括:
对所述内容契合分进行降序排序, 得到排序结果;
根据所述 排序结果确定所述视频封面。
6.根据权利要求5所述的方法, 其特 征在于, 所述封面预测模型的训练过程包括:
获取所述样本 视频和所述样本 封面, 所述样本 视频包括样本图像帧;
确定所述样本图像帧与所述样本 封面之间的图像相似度;
基于所述图像相似度, 确定所述标签数据;
根据所述样本图像帧和所述标签数据对待训练的封面预测模型进行训练, 得到所述封权 利 要 求 书 1/2 页
2
CN 115129935 A
2面预测模型。
7.根据权利要求6所述的方法, 其特征在于, 所述根据所述样本图像帧和所述标签数据
对待训练的封面预测模型进行训练, 得到所述封面预测模型, 包括:
将所述样本图像帧输入所述待训练 的封面预测模型进行视频封面预测处理, 输出所述
样本图像帧对应的样本预测数据;
基于所述样本预测数据和所述标签数据, 生成第一损 失信息和第二损 失信息, 所述第
一损失信息是以所述样本预测数据作为预测信息并以所述标签数据作为真实信息确定的
交叉熵损失信息, 所述第二损失信息是以所述标签数据作为预测信息并以所述样本预测数
据作为真实信息确定的对称交叉熵损失信息;
对所述第一损失信息和所述第二损失信息进行融合处 理, 得到融合损失信息;
基于所述融合损 失信息, 对所述待训练的封面预测模型进行模型参数调整处理, 得到
所述封面预测模型。
8.根据权利要求1至7任一项所述的方法, 其特 征在于, 所述方法还 包括:
对所述至少两个图像帧进行图像内容检测处理, 得到所述至少两个图像帧对应的图像
检测结果, 所述图像 检测结果表征 所述至少两个图像帧的图像内容质量;
所述基于所述预测数据, 确定所述目标视频对应的视频封面, 包括:
基于所述预测数据和所述图像 检测结果, 确定所述视频封面。
9.一种视频封面确定装置, 其特 征在于, 所述装置包括:
视频获取模块, 用于获取目标视频和所述目标视频对应的视频文本, 所述目标视频包
括至少两个图像帧;
文本检测模块, 用于对所述视频文本进行文本含义检测处理, 得到检测结果, 所述检测
结果表征 所述视频文本与所述目标视频之间的语义关联程度;
内容特征确定模块, 用于基于所述检测结果和所述至少两个图像帧, 确定所述目标视
频对应的内容特 征序列;
封面预测模块, 用于根据所述内容特征序列进行视频封面预测 处理, 得到所述至少两
个图像帧对应的预测数据, 所述预测数据 表征所述至少两个图像帧与所述目标视频之 间的
内容契合 程度;
封面确定模块, 用于基于所述预测数据, 确定所述目标视频对应的视频封面。
10.一种计算机设备, 其特征在于, 所述计算机设备包括处理器和存储器, 所述存储器
中存储有至少一条指令、 至少一段程序、 代码集或指令集, 所述至少一条指令、 所述至少一
段程序、 所述代码集或指 令集由所述处理器加载并执行以实现如权利要求 1至8任一项所述
的视频封面确定方法。
11.一种计算机可读存储介质, 其特征在于, 所述存储介质中存储有至少一条指令、 至
少一段程序、 代码集或指令集, 所述至少一条指令、 所述至少一段程序、 所述代码集或指令
集由处理器加载并执 行以实现如权利要求1至8任一项所述的视频封面确定方法。
12.一种计算机程序产品, 其特征在于, 所述计算机程序产品包括计算机指令, 所述计
算机指令存储在计算机可读存储介质中, 计算机设备的处理器从计算机可读存储介质读取
所述计算机指令, 所述处理器执行所述计算机指令, 使得所述计算机设备执行以实现如权
利要求1至8任一项所述的视频封面确定方法。权 利 要 求 书 2/2 页
3
CN 115129935 A
3
专利 视频封面确定方法、装置、设备、存储介质及产品
文档预览
中文文档
26 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:32:16上传分享