说明:收录90万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211061420.1 (22)申请日 2022.08.31 (71)申请人 用友网络科技股份有限公司 地址 100094 北京市海淀区北清路68号 (72)发明人 贺旭 于洪江 何鑫 张宇 刘志强 (74)专利代理 机构 北京友联知识产权代理事务 所(普通合伙) 11343 专利代理师 马静 (51)Int.Cl. G06K 9/62(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01) G06F 16/215(2019.01) G06F 16/25(2019.01)G06F 16/28(2019.01) (54)发明名称 目标数据 的分类方法、 装置、 可读存储介质 及电子设备 (57)摘要 本发明提供了一种目标数据的分类方法、 装 置、 可读存储介质及电子设备, 目标数据的分类 方法包括: 获取目标数据集合, 目标数据集合内 包括同一数据格式的多个目标数据, 目标数据的 数据格式包括结构化数据格式、 图片数据格式以 及文本数据格式中的任一种; 根据数据格式确定 目标数据的第一处理方式; 根据第一处理方式对 目标数据进行第一处理, 得到第一处理数据; 根 据目标数据的数据类别, 将多个第一处理数据分 类为多个数据集。 权利要求书2页 说明书16页 附图10页 CN 115438730 A 2022.12.06 CN 115438730 A 1.一种目标 数据的分类方法, 其特 征在于, 所述分类方法包括: 获取目标数据集合, 所述目标数据集合内包括同一数据格式的多个目标数据, 所述目 标数据的所述数据格式包括结构化数据格式、 图片数据格式以及文本数据格式中的任一 种; 根据所述数据格式确定所述目标 数据的第一处 理方式; 根据所述第一处 理方式对所述目标 数据进行第一处 理, 得到第一处 理数据; 根据所述目标 数据的数据类别, 将多个所述第一处 理数据分类为多个数据集。 2.根据权利要求1所述的目标数据的分类方法, 其特征在于, 所述根据 所述目标数据的 所述数据类别, 将多个所述第一处 理数据分类为所述多个数据集, 具体包括: 确定所述多个数据集的数据比例, 所述数据比例用于指示每个数据集应分配的所述第 一处理数据的数量的比例; 根据所述数据类别, 将多个所述第 一处理数据按照所述数据比例分类为所述多个数据 集。 3.根据权利要求1所述的目标数据的分类方法, 其特征在于, 所述根据 所述数据格 式确 定所述目标 数据的所述第一处 理方式, 具体包括: 在所述数据格 式为所述结构化数据格式的情况下, 确定所述第 一处理方式为对多个所 述目标数据进行 数据排列, 将数据排列后的多个所述目标 数据进行 数据清洗处 理; 在所述数据格 式为所述图片数据格 式, 和/或所述文本数据格式的情况下, 确定所述第 一处理方式为对所述目标 数据进行 数据切分处 理。 4.根据权利要求1所述的目标数据的分类方法, 其特征在于, 所述根据 所述目标数据的 所述数据类别, 将多个所述第一处 理数据分类为所述多个数据集前, 所述分类方法还 包括: 根据所述目标 数据的类别标注确定所述数据类别; 所述类别标注的标注方式包括自定义标注和数据表格标注。 5.根据权利要求1至4中任一项所述的目标数据的分类方法, 其特征在于, 所述根据所 述第一处 理方式对所述目标 数据进行 所述第一处 理前, 所述分类方法还 包括: 将所述目标 数据集合根据数据字节拆分为多个子集 合; 所述数据字节用于指示所述目标 数据集合占用的内存大小。 6.根据权利要求5所述的目标数据的分类方法, 其特征在于, 所述根据 所述第一处理方 式对所述目标 数据进行 所述第一处 理, 得到所述第一处 理数据, 所述分类方法具体包括: 依次加载 所述多个子集 合中任一子集 合; 根据所述第一处 理方式对加载后的所述子集 合中的所述目标 数据进行 所述第一处 理。 7.根据权利要求1至4中任一项所述的目标数据的分类方法, 其特征在于, 所述根据所 述数据格式确定所述目标 数据的所述第一处 理方式前, 所述分类方法还 包括: 识别所述目标数据集合中的所述目标数据, 根据 所述目标数据的数据内容确定所述目 标数据集合的数据格式。 8.一种目标 数据的分类装置, 其特 征在于, 所述分类装置包括: 获取模块, 用于获取目标数据集合, 所述目标数据集合内包括同一数据格式的多个目 标数据, 所述 目标数据的所述数据格式包括结构化数据格式、 图片数据格式 以及文本数据 格式中的任一种;权 利 要 求 书 1/2 页 2 CN 115438730 A 2处理模块, 用于根据所述数据格式确定所述目标 数据的第一处 理方式; 处理模块还用于, 根据所述第一处理方式对所述目标数据进行第一处理, 得到第一处 理数据; 分类模块, 用于根据所述目标数据的数据类别, 将多个所述第一处理数据分类为多个 数据集。 9.一种可读存储介质, 其上存储有程序或指令, 其特征在于, 所述程序或指令被处理器 执行时实现如权利要求1至7中任一项所述的目标 数据的分类方法的步骤。 10.一种电子设备, 其特 征在于, 包括: 如权利要求8所述的目标 数据的分类装置; 和/或 如权利要求9所述的可读存 储介质。权 利 要 求 书 2/2 页 3 CN 115438730 A 3
专利 目标数据的分类方法、装置、可读存储介质及电子设备
文档预览
中文文档
29 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 16:43:41
上传分享
举报
下载
原文档
(1.2 MB)
分享
友情链接
GB-T 31464-2022 电网运行准则.pdf
GB-T 32950-2016 鲜活农产品标签标识.pdf
专利 一种水循环温控系统.PDF
GB-T 26225-2010 信息技术 移动存储 闪存盘通用规范.pdf
T-JYBZ 002—2018 教育用音视频录播系统.pdf
GB-Z 41358-2022 土壤健康综合表征的生物测试方法.pdf
GB-T 17710-2008 信息技术 安全技术 校验字符系统.pdf
DB31-T 1242-2020 数据中心节能设计规范 上海市.pdf
GB-T 35749-2017 锦纶66弹力丝.pdf
GB-T 41267-2022 网络关键设备安全技术要求 交换机设备.pdf
tc260 大数据安全标准化白皮书 2017版.pdf
GB/T 5824-2021 建筑门窗洞口尺寸系列.pdf
GB-T 3621-2007 钛及钛合金板材.pdf
GB-T 9254.1-2021 信息技术设备、多媒体设备和接收机 电磁兼容 第1部分:发射要求.pdf
GB-T 28726-2012 气体分析 氦离子化气相色谱法.pdf
信通院 人工智能数据安全白皮书.pdf
数据安全事件管理办法.pdf
爱分析 2023大模型厂商全景报告 .pdf
GB-T 33018.1-2016 炭素企业节能技术规范 第1部分:浸渍.pdf
GB-T 38224.1-2019 重金属废水处理与回用技术评价 第1部分:程序和方法.pdf
1
/
3
29
评价文档
赞助2.5元 点击下载(1.2 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。