说明:收录90万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210856045.3 (22)申请日 2022.07.08 (71)申请人 腾讯科技 (北京) 有限公司 地址 100080 北京市海淀区海淀大街38号 银科大厦16层16 01-1608室 (72)发明人 陈世哲 白俊杰 (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 贾允 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/74(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 视频分类模型训练方法、 装置、 电子设备及 存储介质 (57)摘要 本发明公开了一种视频分类模 型训练方法、 装置、 电子设备及存储介质, 该方法包括: 获取当 前标注视频样本数据集, 基于当前标注视频样本 数据集进行分类任务训练得到当前视频分类模 型; 基于当前视频分类模型获取目标分类处理信 息; 基于目标分类处理信息从剩余未标注视频样 本数据中选取目标剩余未标注视频样本数据作 为新增的待标注视频样本数据; 目标剩余未标注 视频样本数据与当前标注视频样本数据集之间 的差异程度大于未被选取的剩余未标注视频样 本数据; 基于新增的待 标注视频样 本数据更新当 前标注视频样本数据集, 直至满足预设训练结束 条件得到目标视频分类模型。 本发 明不仅节省了 标注成本, 而且训练方法的稳定性强, 提升了模 型的迭代效率。 权利要求书3页 说明书17页 附图4页 CN 115187910 A 2022.10.14 CN 115187910 A 1.一种视频分类模型训练方法, 其特 征在于, 所述方法包括: 获取当前标注视频样本数据集, 基于所述当前标注视频样本数据集进行分类任务训练 得到当前视频分类模型; 所述当前标注视频样本数据集中的标注视频样本数据为对待标注 视频样本数据进 行标注处理得到, 所述待标注视频样本数据为从未标注视频样本数据集中 选取的未 标注视频样本数据; 将所述标注视频样本数据和剩余未标注视频样本数据分别输入至所述当前视频分类 模型进行分类处理, 获取所述标注视频样本数据和所述剩余未标注视频样本数据分别对应 的目标分类处理信息; 所述剩余未标注视频样本数据是指所述未标注视频样本数据集中未 被选取为所述待标注视频样本数据的未 标注视频样本数据; 基于所述标注视频样本数据和所述剩余未标注视频样本数据分别对应的目标分类处 理信息, 从所述剩余未标注视频样本数据中选取第一预设数量的目标剩余未标注视频样本 数据作为新增的待标注视频样本数据; 所述目标剩余未标注视频样本数据与所述当前标注 视频样本数据集之间的差异程度大于未被选取的所述剩余未标注视频样本数据与所述当 前标注集之间的差异程度; 基于所述新增的待标注视频样本数据 更新所述当前标注视频样本数据集, 直至满足预 设训练结束条件结束训练; 其中, 训练结束时的所述当前视频分类模型作为 目标视频分类 模型。 2.根据权利要求1所述的方法, 其特征在于, 所述目标分类处理信 息为所述分类处理过 程中进行特征提取得到的特征; 所述基于所述标注视频样本数据和所述剩余未标注视频样 本数据分别对应的目标分类处理信息, 从所述剩余未标注视频样本数据中选取第一预设数 量的目标剩余未 标注视频样本数据作为 新增的待标注视频样本数据, 包括: 确定当前第一特征集和当前第二特征集; 其中, 第一特征集中的第一特征包括所述标 注视频样本数据对应的提取特征, 第二特征集中的第二特征为所述剩余未标注视频样本数 据对应的提取 特征; 确定所述当前第二特征集中每个第二特征与所述当前第一特征集之间的第一相似程 度; 确定最小所述第 一相似程度对应的目标第 二特征, 选取所述目标第 二特征对应的剩余 未标注视频样本数据为所述目标剩余未 标注视频样本数据; 基于所述目标第 二特征更新所述当前第 一特征集和所述当前第 二特征集, 直至得到第 一预设数量的所述 目标剩余未标注视频样本数据; 其中, 更新后的当前第一特征集中包括 所述目标第二特征并将所述目标第二特征作为第一特征, 更新后的当前第二特征集中不包 括所述目标第二特 征; 将第一预设数量的所述目标剩余未标注视频样本数据作为新增的待标注视频样本数 据。 3.根据权利要求2所述的方法, 其特征在于, 所述确定所述当前第 二特征集中每个第 二 特征与所述当前第一特 征集之间的第一相似程度, 包括: 针对所述当前第 二特征集中的每个第 二特征, 确定所述第 二特征与 所述当前第 一特征 集中各第一特 征之间的第二相似程度; 将最大所述第二相似程度, 作为所述第二特征与所述第一特征集之间的第一相似程权 利 要 求 书 1/3 页 2 CN 115187910 A 2度。 4.根据权利要求1所述的方法, 其特 征在于, 所述获取当前 标注视频样本数据集, 包括: 获取所述未标注视频样本数据集; 所述未标注视频样本数据集包括至少一个预设视频 类别分别对应的未 标注视频样本数据; 从每个所述预设视频类别对应的未标注视频样本数据中分别选取未标注视频样本数 据作为待标注视频样本数据, 得到初始待标注视频样本数据集; 所述初始待标注视频样本 数据集中待标注视频样本数据的总数量小于所述未标注视频样本数据集中未标注视频样 本数据的总数量; 对所述初始待标注视频样本数据集中的待标注视频样本数据进行标注 处理, 得到所述 当前标注视频样本数据集。 5.根据权利要求4所述的方法, 其特征在于, 所述获取所述未标注视频样本数据集, 包 括: 获取样本视频集; 所述样本视频集包括所述至少一个预设视频类别分别对应的样本视 频; 确定每个所述样本视频对应的多模态数据; 所述多模态数据包括相应样本视频的视频 帧、 音频数据和文本数据; 将每个所述样本视频对应的多模态数据作为未标注视频样本数据, 得到所述未标注视 频样本数据集。 6.根据权利要求1~5中任一项所述的方法, 其特征在于, 所述分类任务包括二分类任 务、 多分类任务、 多标签分类任务中的任意 一种。 7.一种视频分类模型训练装置, 其特 征在于, 所述装置包括: 当前视频分类模型训练模块, 用于获取当前标注视频样本数据集, 基于所述当前标注 视频样本数据集进行分类任务训练得到 当前视频分类模型; 所述当前标注视频样本数据集 中的标注视频样本数据为对待标注视频样本数据进行标注处理得到, 所述待标注视频样本 数据为从未 标注视频样本数据集中选取的未 标注视频样本数据; 分类处理信 息获取模块, 用于将所述标注视频样本数据和剩余未标注视频样本数据分 别输入至所述当前视频分类模型进行分类处理, 获取所述标注视频样本数据和所述剩余未 标注视频样本数据分别对应的目标分类处理信息; 所述剩余未标注视频样本数据是指所述 未标注视频样本数据集中未被选取为所述待标注视频样本数据的未 标注视频样本数据; 目标未标注视频样本数据选取模块, 用于基于所述标注视频样本数据和所述剩余未标 注视频样本数据分别对应的目标分类处理信息, 从所述剩余未标注视频样本数据中选取第 一预设数量的目标剩余未标注视频样本数据作为新增的待标注视频样本数据; 所述目标剩 余未标注视频样本数据与所述当前标注视频样本数据集之间的差异程度大于未被选取的 所述剩余未 标注视频样本数据与所述当前 标注集之间的差异程度; 标注视频样本数据集更新模块, 用于基于所述新增的待标注视频样本数据更新所述当 前标注视频样本数据集, 直至满足预设训练结束 条件结束训练; 其中, 训练结束时的所述当 前视频分类模型作为目标视频分类模型。 8.一种电子设备, 其特征在于, 包括处理器和存储器, 所述存储器中存储有至少一条指 令或者至少一段程序, 所述至少一条指令或者所述至少一段程序由所述处理器加载并执行权 利 要 求 书 2/3 页 3 CN 115187910 A 3
专利 视频分类模型训练方法、装置、电子设备及存储介质
文档预览
中文文档
25 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:32:11
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
GB-T 35122-2017 制造过程物联的数字化模型信息表达规范.pdf
YD-T 3763.3-2021 研发运营一体化(DevOps)能力成熟度模型 第3部分:持续交付.pdf
GB-T 37046-2018 信息安全技术 灾难恢复服务能力评估准则.pdf
飞驰云联 企业数据防泄密产品选型指南 2021.pdf
T-CEC 694—2022 变电站二次系统数字化设计编码规范.pdf
T-CIE 052—2018 数据中心设施运维管理指南.pdf
GB-T 37416-2019 洁净机器人通用技术条件.pdf
T-SSCI 002—2021 学校室外运动场地合成材料面层 铺装技术规程.pdf
GB-T 35679-2017 固体材料微波频段使用波导装置的电磁参数测量方法.pdf
GB-T 26300-2020 镍钴锰三元素复合氢氧化物.pdf
GB-T 23022-2022 信息化和工业化融合管理体系 生产设备运行管理规范.pdf
GB-T 36441-2018 硬件产品与操作系统兼容性规范.pdf
GB-T 21054-2023 信息安全技术 公钥基础设施 PKI系统安全测评方法.pdf
T-WHDQHX 004—2022 电气成套设备制造业数字化车间 通用要求.pdf
SANS 应急响应处理手册 incident-handlers-handbook 英文版.pdf
DB4403-T 339-2023 城市级实景三维数据规范 深圳市.pdf
GB-T 38408-2019 皮革 材质鉴别 显微镜法.pdf
重点网络安全:“3保1评”(分保、等保、关保、密评).pptx
GB-T 41780.1-2022 物联网 边缘计算 第1部分:通用要求.pdf
GM-T 0065-2019 商用密码产品生产和保障能力建设规范.pdf
1
/
25
评价文档
赞助2.5元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。