说明:收录90万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210572357.1 (22)申请日 2022.05.24 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 王书培 刘攀 (74)专利代理 机构 深圳翼盛智成知识产权事务 所(普通合伙) 44300 专利代理师 李玉婷 (51)Int.Cl. G06F 16/735(2019.01) G06F 16/783(2019.01) G06V 10/74(2022.01) G10L 15/26(2006.01) (54)发明名称 语料生成方法、 装置、 电子设备和计算机可 读存储介质 (57)摘要 本发明实施例公开了一种语料生 成方法、 装 置、 电子设备和计算机可读存储介质; 本发明实 施例在获取至少一个候选视频, 并对候选视频的 视频帧进行文本识别, 得到候选视频的字幕内容 后, 在候选视频中提取出音频内容, 并将音频内 容转换为文本内容, 然后, 计算字幕内容和文本 内容之间的相似度, 得到候选视频的文本相似 度, 然后, 根据文本相似度, 在候选视频中筛选出 目标语言的至少一个目标视频, 基于目标视频的 音频内容和字幕内容, 生成目标语言对应的语 料; 该方案可以大大提升语音识别中的语料生成 的准确性。 权利要求书3页 说明书15页 附图7页 CN 114996506 A 2022.09.02 CN 114996506 A 1.一种语料生成方法, 其特 征在于, 包括: 获取至少一个候选视频, 并对所述候选视频的视频帧进行文本识别, 得到所述候选视 频的字幕内容; 在所述候选视频中提取 出音频内容, 并将所述音频内容 转换为文本内容; 计算所述字幕内容和所述文本内容之间的相似度, 得到所述 候选视频的文本相似度; 根据所述文本相似度, 在所述 候选视频中筛 选出目标语言的至少一个目标视频; 基于所述目标视频的音频内容和字幕内容, 生成所述目标语言对应的语料。 2.根据权利要求1所述的语料生成方法, 其特征在于, 所述计算所述字幕内容和所述文 本内容之间的相似度, 得到所述 候选视频的文本相似度, 包括: 在所述字幕内容中识别出字幕字符串, 并在所述文本内容中识别出文本 字符串; 计算所述字幕字符串与所述文本字符串之间的转换操作次数, 得到字幕字符串与文本 字符串之间的类编辑距离; 基于所述字幕字符串、 文本 字符串和类编辑距离, 确定所述 候选视频的文本相似度。 3.根据权利要求2所述的语料生成方法, 其特征在于, 所述基于所述字幕字符串、 文本 字符串和类编辑距离, 确定所述 候选视频的文本相似度, 包括: 将所述字幕字符串与文本 字符串进行融合, 得到 字符串距离; 计算所述类编辑距离与字符串距离之间的距离 差值; 计算所述距离 差值与所述字符串距离之间的比值, 得到所述 候选视频的文本相似度。 4.根据权利要求1至3任一项所述的语料生成方法, 其特征在于, 所述对所述候选视频 的视频帧进行文本识别, 得到所述 候选视频的字幕内容, 包括: 对所述候选视频进行分帧, 并在分帧后的视频帧中筛 选出关键 视频帧; 在所述关键 视频帧中定位出目标位置区域, 得到所述 候选视频的字幕区域; 在所述视频帧中识别出 所述字幕区域对应的文本, 得到所述 候选视频的字幕内容。 5.根据权利要求4所述的语料生成方法, 其特征在于, 所述在 分帧后的视频帧中筛选出 关键视频帧, 包括: 对分帧后的视频帧进行文本识别, 得到所述视频帧的视频帧文本; 基于所述视频帧文本, 对所述视频帧进行分类, 得到每一视频帧文本对应的视频帧集 合; 根据所述视频帧对应的播放时间, 对所述视频帧集合中的视频帧进行排序, 并基于排 序结果, 在所述视频帧集 合中筛选出关键 视频帧。 6.根据权利要求4所述的语料生成方法, 其特征在于, 所述在所述关键视频帧中定位出 目标位置区域, 得到所述 候选视频的字幕区域, 包括: 在所述视频帧文本 中筛选出所述关键视频帧的至少一个关键视频帧文本, 并在所述关 键视频帧中识别出每一所述关键 视频帧文本的文本位置信息; 基于所述关键 视频帧文本, 在所述文本位置信息中筛 选出目标位置信息; 在所述关键视频帧中定位出所述目标位置信 息对应的位置区域, 得到所述候选视频的 字幕区域。 7.根据权利要求1至3所述的语料生成方法, 其特征在于, 所述获取至少一个候选视频, 包括:权 利 要 求 书 1/3 页 2 CN 114996506 A 2根据预设 关键词, 获取目标语言的基础视频集 合; 在所述基础视频集 合中识别出每一视频的视频类型和所述视频类型的置信度; 基于所述视频类型和置信度, 在所述基础视频集 合中筛选出至少一个候选 视频。 8.根据权利要求7所述的语料生成方法, 其特征在于, 所述在所述基础视频集合中识别 出每一视频的视频类型和所述视频类型的置信度, 包括: 对所述基础视频集合中的每一视频的音频帧进行音频检测, 得到所述音频帧的音频类 型; 对所述视频进行静音检测, 并基于检测结果, 对所述视频进行音频切割, 得到至少一个 音频片段; 对所述音频片段进行特征提取, 并基于提取出的音频特征和音频类型, 确定所述视频 的视频类型和所述视频类型的置信度。 9.根据权利要求8所述的语料生成方法, 其特征在于, 所述基于提取出的音频特征和音 频类型, 确定所述视频的视频类型和所述视频类型的置信度, 包括: 根据所述音频类型和音频特征, 确定所述音频片段的语音类型和所述语音类型的分类 信息; 获取所述音频片段的音频时长, 并基于所述音频时长, 确定所述语音类型的分类权 重; 根据所述分类权重和分类信息, 将所述视频的音频片段对应的语音类型进行融合, 以 得到所述视频的视频类型和所述视频类型的置信度。 10.根据权利要求1至3任一项所述的语料生成方法, 其特征在于, 所述基于所述目标视 频的音频内容和字幕内容, 生成所述目标语言对应的语料, 包括: 在所述字幕内容中筛 选出所述目标视频的目标字幕内容; 并在所述目标视频中提取 出所述目标字幕内容对应的时间轴; 将所述目标视频的音频内容、 目标字幕内容和时间轴作为初始语料, 并将所述初始语 料发送至校验服 务器进行 校验, 以得到所述目标语言的语料。 11.一种语料生成装置, 其特 征在于, 包括: 获取单元, 用于获取至少一个候选视频, 并对所述候选视频的视频帧进行文本识别, 得 到所述候选视频的字幕内容; 转换单元, 用于在所述候选视频中提取出音频内容, 并将所述音频内容转换为文本内 容; 计算单元, 用于计算所述字幕内容和所述文本内容之间的相似度, 得到所述候选视频 的文本相似度; 筛选单元, 用于根据所述文本相似度, 在所述候选视频中筛选出目标语言的至少一个 目标视频; 生成单元, 用于基于所述目标视频的音频内容和字幕内容, 生成所述目标语言对应的 语料。 12.一种电子设备, 其特征在于, 包括处理器和存储器, 所述存储器存储有应用程序, 所 述处理器用于运行所述存储器内的应用程序, 以执行权利要求1至10任一项所述的语料生 成方法中的步骤。 13.一种计算机程序产品, 包括计算机程序/指令, 其特征在于, 该计算机程序/指令被权 利 要 求 书 2/3 页 3 CN 114996506 A 3
专利 语料生成方法、装置、电子设备和计算机可读存储介质
文档预览
中文文档
26 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:32:54
上传分享
举报
下载
原文档
(997.1 KB)
分享
友情链接
GB-T 17729-2023 长途客车内空气质量要求及检测方法.pdf
绿盟 2015绿盟科技云安全解决方案.pdf
GB-T 37319-2019 电梯节能逆变电源装置.pdf
T-CACE 087.1—2023 基于项目的温室气体减排量评估技术规范 互联网平台闲置物品交易 通用要求.pdf
DB37-T 4074—2020 山东省美丽村居建设标准 山东省.pdf
DB3302-T 1122-2021 数字化车间 智能工厂评估规范 宁波市.pdf
T-CCTAS 24—2021 互联网货运平台安全运营规范.pdf
GB-T 37472-2019 潜水器母船升沉补偿系统通用要求.pdf
DB51-T 2798-2021 公路旅游标志设置规范 四川省.pdf
数据资产管理制度.pdf
GM-T 0015-2023 数字证书格式.pdf
JY-T 0583-2020 聚焦离子束系统分析方法通则.pdf
GB-T 25647-2010 电子政务术语.pdf
GB-T 38318-2019 电力监控系统网络安全评估指南.pdf
民航 MH-T 1076.1-2023 民航旅客行李全流程跟踪系统 第1部分:机场端建设规范.pdf
DB31-T 1363-2022 口腔综合治疗台水路卫生管理要求 上海市.pdf
GB-Z 29830.1-2013 信息技术 安全技术 信息技术安全保障框架 第1部分:综述和框架.pdf
DB45-T 2760-2023 电子政务外网网络技术规范 广西壮族自治区.pdf
T-CECS G:D60-02—2023 公路超高性能混凝土 UHPC 桥梁技术规程.pdf
GB-T 10801.2-2018 绝热用挤塑聚苯乙烯泡沫塑料(XPS).pdf
1
/
26
评价文档
赞助2.5元 点击下载(997.1 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。