说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210617355.X (22)申请日 2022.06.01 (71)申请人 阿里巴巴 (中国) 有限公司 地址 311121 浙江省杭州市余杭区五常街 道文一西路969号3幢5层5 54室 (72)发明人 丁威 汤俊 朱远志 姚聪 刘腾  张洁靖 朱雅丽  (74)专利代理 机构 北京清源汇知识产权代理事 务所(特殊普通 合伙) 11644 专利代理师 冯德魁 (51)Int.Cl. G06T 3/40(2006.01) G06T 5/00(2006.01) G06F 7/57(2006.01) G06V 10/74(2022.01) (54)发明名称 滑动扫描图像的拼接方法, 词典笔的文本识 别方法, 装置 (57)摘要 本申请公开一种滑动扫描图像的拼接方法, 词典笔的文本识别方法, 装置; 其中, 所述拼接方 法包括: 基于滑动扫描操作采集的序列扫描图像 中的第一扫描 图像, 确定待匹配区域图像; 根据 待匹配区域图像相对于序列扫描图像中第二扫 描图像的滑动方向, 在第二扫描图像中确定待匹 配区域图像的匹配范围; 在匹配范围内对待匹配 区域图像与选取区域图像进行匹配, 确定待匹配 区域图像在第二扫描图像中的契合点; 选取区域 图像为在匹配范围内, 按照滑动方向选取的与待 匹配区域图像相同尺寸的图像; 根据契合点在第 一扫描图像中确定的第一拼接图像和根据契合 点在第二扫描图像中确定的第二拼接图像进行 拼接; 从而提高拼接的实时性、 准确性。 权利要求书3页 说明书12页 附图5页 CN 115222589 A 2022.10.21 CN 115222589 A 1.一种基于滑动扫描图像的拼接方法, 其特 征在于, 包括: 基于滑动扫描操作采集的序列扫描图像中的第一扫描图像, 确定待匹配区域图像; 根据所述待匹配区域图像相对于所述序列扫描图像中第 二扫描图像的滑动方向, 在所 述第二扫描图像中确定所述待匹配区域图像的匹配范围; 其中, 所述第一扫描图像和所述 第二扫描图像之间具有重叠图像内容, 所述待匹配区域图像包括所述重叠图像内容中的部 分图像内容; 在所述匹配范围内对所述待 匹配区域图像与选取区域图像进行匹配, 确定所述待 匹配 区域图像在所述第二扫描图像中的契合点; 其中, 所述选取区域图像为在所述匹配范围内, 按照所述滑动方向选取的与所述待匹配区域图像相同尺寸的图像; 根据所述契合点在所述第一扫描图像中确定的第一拼接图像和根据所述契合点在所 述第二扫描图像中确定的第二 拼接图像进行拼接 。 2.根据权利要求1所述的基于滑动扫描图像的拼接方法, 其特征在于, 所述在所述匹配 范围内对所述待匹配区域图像与选取区域图像进 行匹配, 确定所述待匹配区域图像在所述 第二扫描图像中的契合 点, 包括: 遍历所述选取区域图像x轴方向的像素值; 其中, 所述x轴方向的像素值包括根据设置 的y轴方向偏移量对应所述x轴方向的偏移像素值; 遍历所述待匹配区域图像x轴方向的像素值; 根据所述选取区域图像x轴方向的像素值和所述偏移像素值, 以及所述待匹配区域图 像x轴方向的像素值, 计算所述待匹配区域与所述选取区域图像的相似度; 将所述相似度最小值的所述选取区域图像在滑动方向上的边侧, 确定为所述契合 点。 3.根据权利要求2所述的基于滑动扫描图像的拼接方法, 其特征在于, 所述根据 所述选 取区域图像x轴方向的像素值和所述偏移像素值, 以及所述待匹配区域图像x轴方向的像素 值, 计算所述待匹配区域与所述选取区域图像的相似度, 包括: 通过预先设置汇编指令集方式, 计算所述待 匹配区域图像与 所述选取区域图像的相似 度。 4.根据权利要求1所述的基于滑动扫描图像的拼接方法, 其特 征在于, 还 包括: 对所述选取区域图像的像素值以及所述待 匹配区域图像的像素值进行行归一化处理, 其中, 所述选取区域图像的像素值包括, 设置的y轴 方向偏移量对应所述选取区域图像x轴 方向的偏移像素值; 所述在所述匹配范围内对所述待匹配区域图像与选取区域图像进行匹配, 确定所述待 匹配区域图像在所述第二扫描图像中的契合 点, 包括: 在所述匹配范围内, 对所述行归一化处理后的选取区域图像的像素值与所述行归一化 处理后的待匹配区域图像的像素值进 行匹配, 确定所述待匹配区域图像在所述第二扫描图 像中的契合 点。 5.根据权利要求4所述的基于滑动扫描图像的拼接方法, 其特征在于, 所述对所述选取 区域图像的像素值进行 行归一化处理, 包括: 对遍历的所述选取区域图像x轴方向的像素值进行 行归一化处理; 当所述偏移像素值为增加偏移量像素值时, 对所述增加偏移量对应的x轴方向像素值 进行行归一化处理。权 利 要 求 书 1/3 页 2 CN 115222589 A 26.根据权利要求 4所述的基于滑动扫描图像的拼接方法, 其特 征在于, 还 包括: 将所述行归一 化处理后像素值的浮 点数据类型转换为定点数据类型。 7.根据权利要求1所述的基于滑动扫描图像的拼接方法, 其特 征在于, 还 包括: 对所述选取区域图像和/或所述待匹配区域图像进行 滤波处理。 8.根据权利要求1所述的基于滑动扫描图像的拼接方法, 其特征在于, 所述基于滑动扫 描操作采集的序列扫描图像中的第一扫描图像, 确定待匹配区域图像, 包括: 在所述第一扫描图像中确定所述待匹配区域图像的选取 范围; 将所述选取 范围的中心区域, 确定为所述待匹配区域图像。 9.根据权利要求8所述的基于滑动扫描图像的拼接方法, 其特征在于, 所述根据 所述待 匹配区域图像相对于所述序列扫描图像中第二扫描图像的滑动方向, 在所述第二扫描图像 中确定所述待匹配区域图像的匹配范围, 包括: 根据所述待匹配区域图像相对于所述序列扫描图像中第 二扫描图像的滑动方向, 在所 述第二扫描图像中选取与所述选取 范围位置和尺寸相同区域; 将选取的所述相同区域确定为所述匹配范围。 10.一种基于滑动扫描图像的拼接装置, 其特 征在于, 包括: 第一确定单元, 用于基于滑动扫描操作采集的序列扫描图像中的第一扫描图像, 确定 待匹配区域图像; 第二确定单元, 用于根据所述待匹配区域图像相对于所述序列扫描图像中第 二扫描图 像的滑动方向, 在所述第二扫描图像中确定所述待匹配区域图像的匹配范围; 其中, 所述第 一扫描图像和所述第二扫描图像之 间具有重叠图像内容, 所述待匹配区域图像为所述重叠 图像内容中的部分图像内容; 第三确定单元, 用于在所述匹配范围内对所述待 匹配区域图像与选取区域图像进行匹 配, 确定所述待匹配区域图像在所述第二扫描图像中的契合点; 其中, 所述选取区域图像为 在所述匹配范围内, 按照所述滑动方向选取的与所述待匹配区域图像相同尺寸的图像; 拼接单元, 用于根据 所述契合点在所述第 一扫描图像中确定的第 一拼接图像和根据 所 述契合点在所述第二扫描图像中确定的第二 拼接图像进行拼接 。 11.一种基于词典笔的文本信息识别方法, 其特 征在于, 包括: 基于词典笔采集的序列扫描图像中的第一扫描图像, 确定待匹配区域图像; 根据所述待匹配区域图像相对于所述序列扫描图像中第 二扫描图像的滑动方向, 在所 述第二扫描图像中确定所述待匹配区域图像的匹配范围; 其中, 所述第一扫描图像和所述 第二扫描图像之间具有重叠图像内容, 所述待匹配区域图像为所述重叠图像内容中的部分 图像内容; 在所述匹配范围内对所述待 匹配区域图像与选取区域图像进行匹配, 确定所述待 匹配 区域图像在所述第二扫描图像中的契合点; 其中, 所述选取区域图像为在所述匹配范围内, 按照所述滑动方向选取的与所述待匹配区域图像相同尺寸的图像; 根据所述契合点在所述第一扫描图像中确定的第一拼接图像和根据所述契合点在所 述第二扫描图像中确定的第二 拼接图像进行拼接; 将所述拼接后的图像作为目标拼接图像与第 三扫描图像执行上述拼接步骤, 直到所述 序列扫描图像的最后一帧扫描图像, 获取拼接全景图像;权 利 要 求 书 2/3 页 3 CN 115222589 A 3

PDF文档 专利 滑动扫描图像的拼接方法,词典笔的文本识别方法,装置

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 滑动扫描图像的拼接方法,词典笔的文本识别方法,装置 第 1 页 专利 滑动扫描图像的拼接方法,词典笔的文本识别方法,装置 第 2 页 专利 滑动扫描图像的拼接方法,词典笔的文本识别方法,装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:32:45上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。