说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210683090.3 (22)申请日 2022.06.17 (65)同一申请的已公布的文献号 申请公布号 CN 114780781 A (43)申请公布日 2022.07.22 (73)专利权人 中船重工 (武汉) 凌久高科有限公 司 地址 430000 湖北省武汉市洪山区关山 街 珞瑜路718号 (72)发明人 刘鑫 杨志祥 丁雪峰 程佳斌  余将其 皮辉 杨小涛 熊筠轲  谈俊 郭朝霞 许雷 范俊甫  蔡烨彬 谢倩 (74)专利代理 机构 武汉泰山北斗专利代理事务 所(特殊普通 合伙) 42250 专利代理师 董佳佳 (51)Int.Cl. G06F 16/583(2019.01) G06F 16/55(2019.01) G06V 10/74(2022.01) G06V 10/762(2022.01) G06K 9/62(2022.01) 审查员 郭坚 (54)发明名称 一种基于模糊聚类和非对称距离计算的乘 积量化方法 (57)摘要 本发明适用于计算机视觉和大数据领域, 提 供一种基于模糊聚类和非对称距离计算的乘积 量化方法, 本发 明方法首先对于原始向量集进行 初聚类, 计算其残差向量集, 通过对残差子向量 模糊聚类, 得到隶属度矩阵; 然后根据隶属度进 行子向量分类; 对于查询向量按照相应方式进行 加权距离计算, 统计每个子段距离排名序号的 和。 本发明在乘积量化索引子空间向量聚类中应 用了模糊聚类方法, 避免了硬划分因样本类别分 布不均匀造成的误差, 使向量的聚类更客观; 在 相似度度量中采用了加权非对称距离计算和距 离排名统计方法, 避免了因向量某 一段距离计算 过大而产生的检索误差。 本发明方法对比原始乘 积向量方法在复杂背景图片的检索中精度更高。 权利要求书2页 说明书8页 附图5页 CN 114780781 B 2022.09.23 CN 114780781 B 1.一种基于模糊聚类和非对称距离计算的乘积量化方法, 其特征在于, 所述方法包括 下述步骤: 步骤S1、 对原始向量集进行初聚类, 每个簇类分别计算其残差向量集, 将残差向量集中 残差向量切分多段, 对每段残差 子向量进行模糊聚类, 输出 隶属度矩阵; 步骤S2、 根据所述隶属度矩阵, 取每个残差子向量关于每个簇类的最大若干个隶属度 进行子向量分类; 步骤S3、 针对查询向量, 将其划分到所属的初聚类簇类 中并计算残差向量, 然后将残差 向量划分为若干 子段, 通过加权计算每子段到向量子空间所有聚类中心的加权距离; 步骤S4、 计算查询向量所在的簇类中所有子段的加权距离, 统计每个子段距离排名序 号的和, 其中最大的Q个值对应的样本即查询向量的Q近邻样本; 所述步骤S1具体过程如下: 将图片库中的m张图片均转换成n维向量形成原始向量集, 将原始向量集中的m个样本 向量进行初聚类, 划分为g个簇类, 簇中心向量 为 ; 对于划分的g个簇类中的每 个样本向量, 计算 其残差向量, 形成残差向量 集; 将n维的残差向量平均切分为s段, 每段残差 子向量的维度为 ; 针对每段残差子向量进行模糊聚类, 聚类分为k类, 得到k个聚类 中心, 每段残差子向量 属 于 某 一 类 的 隶 属 度 为 ,设 定 一 个 模 糊 聚 类 的 目 标 函 数 ,其 中 , 约束条件为 , m是隶属度因子, 表示残差 子向量 到聚类中心 的欧氏距离; 当前残差子向量的隶属度矩阵是一个h*k的矩阵, 其中h为簇类中残差向量数量, 聚类 开始时, 随机生 成一个满足约束 条件的隶属度, 通过隶属度 矩阵迭代以及聚类中心迭代, 当 目标函数 的取值趋于稳定时, 停止迭代, 得到最终的隶属度矩阵, 其中矩阵的每一行代表 一个样本, 共有h个样本, 矩阵的每一列每个值代表属于每个聚类的隶属度, 共有k列; 具体 的, 隶属度 的迭代公式为 , 聚类中心 的迭代公式为 , 停止迭代的条件为 , 其中 取一个极 小的常数作为 误差的阈值, t为迭代的轮数。 2.如权利要求1所述基于模糊聚类和非对称距离计算的乘积量化方法, 其特征在于, 所 述步骤S2具体过程如下: 根据残差子向量的隶属度矩阵, 把每个残差子向量关于每个簇类的隶属度按从小到大 排序, 取最大的若干个隶属度进行子向量分类;权 利 要 求 书 1/2 页 2 CN 114780781 B 2将每个簇类中的每 个残差向量用数字id表示进行 数字量化编码。 3.如权利要求2所述基于模糊聚类和非对称距离计算的乘积量化方法, 其特征在于, 所 述步骤S3具体过程如下: 对于需要查询的图片, 将其转化为n维向量形成查询向量, 依次计算查询向量到g个簇 类的聚类中心的欧氏距离, 找到距其距离最短的聚类中心; 在查询向量所属的初聚类簇类中计算残差向量, 把残差向量划分为若干子段, 每一子 段计算其到k个聚类中心的欧式距离, 生成距离表。 4.如权利要求3所述基于模糊聚类和非对称距离计算的乘积量化方法, 其特征在于, 所 述步骤S4具体过程如下: 计算查询向量所在的簇类中h个残差向量的每个子段到查询向量对应子段的距离, 形 成h个距离的距离集 合; 把距离集合中的距离按从小到大排序, 得到1到h的共h个排名序号, 以排名序号给距离 对应的子段打标签, 每个残差向量的每个子段都有一个标签, 得到h个排名序号编码的编码 集合; 编码集合中, 计算每个数字编码的数字之和, 值按从小到大排序, 形成新集合, 新集合 中排序前Q个值对应的样本, 即为 查询向量的Q近邻样本 。权 利 要 求 书 2/2 页 3 CN 114780781 B 3

PDF文档 专利 一种基于模糊聚类和非对称距离计算的乘积量化方法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于模糊聚类和非对称距离计算的乘积量化方法 第 1 页 专利 一种基于模糊聚类和非对称距离计算的乘积量化方法 第 2 页 专利 一种基于模糊聚类和非对称距离计算的乘积量化方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:32:31上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。