(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210553554.9
(22)申请日 2022.05.20
(71)申请人 杭州福柜科技有限公司
地址 310000 浙江省杭州市滨江区西兴街
道西兴路1819号80 5
(72)发明人 庞明锋 李攀星 庞楼阳
(74)专利代理 机构 天津垠坤知识产权代理有限
公司 12248
专利代理师 江洁 赵玉琴
(51)Int.Cl.
G06Q 30/06(2012.01)
G06V 10/77(2022.01)
G06V 10/764(2022.01)
G06V 10/74(2022.01)
G06N 20/00(2019.01)
(54)发明名称
一种基于物品相似分析的方法
(57)摘要
本发明提供一种基于物品相似分析的方法,
涉及物品相似分析技术领域, 包括以下步骤: S1、
商品相似度计算; S2、 设置互斥规则库; S3、 动态
GPU资源分配, 本申请中, 操作流程是使用深度卷
积网络来提取商品的特征, 根据特征判断商品之
间的相似度, 利用商品之间的相似度和容易识别
错误的经验库作为商品规则库, 来约束补货时的
操作, 从而可以避免因柜内出现大量相似商品而
导致识别错误, 之后根据柜内商品相似度计算平
均相似度, 并结合视频长度来预测算法处理订单
视频的时间, 根据整体的待处理视频的时间来动
态调整GPU资源。
权利要求书2页 说明书6页 附图6页
CN 114897580 A
2022.08.12
CN 114897580 A
1.一种基于物品相似分析的方法, 其特 征在于, 包括以下步骤:
S1、 商品相似度计算;
S2、 设置互斥规则库;
S3、 动态GPU资源分配。
2.根据权利要求1所述的一种基于物品相似分析的方法, 其特征在于, 包括以下步骤:
根据S1中的操作步骤, 商品相似度计算的方法为:
S11、 相似度计算是使用resnet50进行训练, 训练数据是选用的是实际中的商品共1000
种类, 每个种类共有40 0张图片, 每一张图像是320 ×320分辨率大小;
S12、 采用图像增强方法, 并沿着中心、 左上、 左下、 右上、 右下以256*256的大小进行裁
剪, 并对裁剪 之后的进行水平翻转、 以60度、 30度进行旋转, 加入随机噪声、 颜色扰动和随机
加入噪声, 之后从增强的数据中随机抽取10 00类别的10 00张图像, 训练分类识别初始模型。
3.根据权利要求1所述的一种基于物品相似分析的方法, 其特征在于, 包括以下步骤:
根据S2中的操作步骤, 规则库指的是比较相似的商品是不允许放在同一个柜子中, 规则库
分为相似互斥和经验库。
4.根据权利要求1所述的一种基于物品相似分析的方法, 其特征在于, 包括以下步骤:
根据S3中的操作步骤, 算法处理订单视频的耗时与商品复杂度和视频的长短密切相关, 其
中商品复杂度可定义 为柜内整体识别复杂度(相似度):
柜内整体识别复杂度是计算柜内商品的相互之间的相似度, 并对其求和取平均, 假设
柜内商品数量 为M, 计算如下:
其中i≠j, n =(M‑1)*M/2;
其中v代表特征向量, i≠j, i和 j表示不同的特征向量, n为无人货柜内商品之间计算相
似度的次数, 计算公式为 n=(M‑1)*M/2, fθ为点积计算公式;
算法处理时间的预测 是根据历史数据中获取到柜内的平均复杂度θm、 视频的时长tv和
实际算法处理时间tp的数据3000条, 记平均复杂度 θm、 视频的时长tv为变量X={x1, x2}, 实际
处理时间tp为Y={tp}, 对历史数据进行非线性拟合, 预测Y, 预测采用常用的非线性回归, 选
用二次方进行回归预测, 预测模型为:
Tp(x1, x2)为预测模型二次方的通用公式, 其中x1, x2分别为输入的平均 复杂度θm、 视频
的时长tv的两个变量, 其中 a, b, c, d, f, e为 二次项的系数;
非线性回归通常转化为线性回归, 再按照线性回归求解, 线性回归通常采用给定的函
数值与模型预测值之差的平方和最小为损失函数, 并使用最小二乘法和梯度下降法来计算
最终的拟合 参数, 模型求 解采用的是机器学习sk learn库进行求 解;
输入视频长度tv和柜内商品的复杂度 θm到函数Tp(x1, x2), 即可计算出 所需时间:
tp=Tp( θm, tv)
设当前队列中待识别订单的数量为N, 当前在用的GPU实例的数量为k, 计算当前待识别
订单的预测时间的总和为:权 利 要 求 书 1/2 页
2
CN 114897580 A
2待识别订单的数量为N, i指当前待识别订单中的某一单, T是计算当前待识别订单的预
测时间的总和;
一个订单最大的等待时间t不超过40s, 计算待识别订单 所需要的GPU实例数m:
T是计算当前待识别订单的预测时间的总和, t为最大等待时间40s, m就是需要的GPU实
例的个数;
根据待识别订单所需要的GPU实例数m和实际在线的GPU实例的数量为k, 来计算是否要
新增或减少GPU实例数, 公式如下:
计算出来需要新增或减少的GPU实例。
5.根据权利要求2所述的一种基于物品相似分析的方法, 其特征在于, 包括以下步骤:
根据S12中的操作步骤, 训练参数为:
优化器选择SGD, 损失函数采用的交叉熵损失, 初始化学习率为0.1, 递减衰减系数为
0.1, 训练之后保存训练模型;
修改模型去掉softmax层, 并添加PCA降维将维度为1000的特征向量, 降维为512个维
度;
既最终的特 征向量, 如下:
v=fv(x)=fpca(fcnn(x))
其中x代表输入的图像像素, fcnn代表经过resnet50卷积层输出的1*1000维的特征向量
v′, 经过fpca降维处理后变为1* 512维的特 征向量v;
相似度计算方法采用两个特 征向量点乘:
θ =fθ(v1, v2)
其中v1, v2为两个特征向量, fθ为将两个特征向量点乘, 输出的结果θ, 即为两个特征向
量的相似度。
6.根据权利要求3所述的一种基于物品相似分析的方法, 其特 征在于,
相似互斥就是根据商品相似度计算来判断, 当商品库新增商品的时候, 会对该商品进
行特征提取, 并与库存商品进行商品相似度计算, 当相 似度大于0.85的时候就标记该库存
商品为相似互斥商品;
经验库是根据售后的记录来统计分析哪些商 品容易识别错误, 会纳入到经验规则库当
中, 经验规则库主要是考虑到实际在场景中, 两个商品的商标特征不明显, 但是颜色相同,
或者是原本不相似的两个商品因为遮挡导致的剩余的部 分商品的特征相似的情况, 主要 是
记录下售后中每一个商品容易被识别错的商品的种类和次数当超过了一定的阈值N(设定
为50)时, 会自动加入到经验规则库中。权 利 要 求 书 2/2 页
3
CN 114897580 A
3
专利 一种基于物品相似分析的方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:32:58上传分享