(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210565115.X
(22)申请日 2022.05.23
(71)申请人 郭江华
地址 518100 广东省深圳市龙岗区贝尔路
华为坂田园区H区2座
(72)发明人 郭江华
(51)Int.Cl.
G06V 30/226(2022.01)
G06V 10/74(2022.01)
G06V 10/774(2022.01)
G06V 10/764(2022.01)
G06K 9/62(2022.01)
(54)发明名称
无上下文的手写形似汉字极速准确识别方
法
(57)摘要
本申请采用特征笔画空间距离构建一个初
阶的静态形似汉字集, 大幅减少备选字的数量,
以特征笔画空间的距离远近作为汉字之间的形
似程度; 将初 阶形似汉字集精简化,构建二级分
类器得到 形似汉字组; 利用平移不变聚束学习的
输出置信因子对 备选字排序, 计算首选字与备选
字之间的置信因子熵作为近似度,选择近似度高
的作为形似汉字组, 输出置信因子的计算兼顾频
度计算, 考虑偏离样本中心的特殊样本; 将汉字
识别目标层级特征与平移不变聚束学习相结合,
目标层级特征作为先验知识, 混合梯级特征作为
输入提升识别率; 实验表明, 本申请的稳定性、 可
移植性、 可扩展性和可维护性好, 形似汉字识别
快速准确, 具有巨大的技术优势和广阔的运用前
景。
权利要求书4页 说明书14页 附图6页
CN 114863445 A
2022.08.05
CN 114863445 A
1.无上下文的手写形似汉字极速准确识别方法, 其特征在于, 采用特征笔画空间距离
构建一个初阶的静态形似汉字集, 减少备选字的数量, 以特征笔画空间的距离远近作为汉
字之间的形似程度; 将初阶形似汉字集精简化,构建二级分类器得到形似程度有一定标准
的形似汉字组; 利用平移不变聚束学习的输出置信因子对备选字排序, 计算首选字与备选
字之间的置信因子熵作为近似度的度量,选择近似度高的作为形似汉字组, 平移不变聚束
学习的输出置信因子的计算兼顾频度计算, 考虑偏离样本中心的特殊样本, 并且置信因子
熵作为近似度的度量考虑的是样本的各类特性的综合; 将汉字识别目标层级 特征与平移不
变聚束学习相结合,目标层级特征作为一个先验知识, 混合梯级特征作为输入提升聚束学
习识别率;
本申请首先用粗分类实现形似汉字的判定, 获取近似度足够高的形似汉字组, 然后用
细分类实现对形似汉字的识别:
针对形似汉字判定问题,首先通过基于特征笔画 空间距离近似度的方法进行形似汉字
的初阶判定, 选择距离近似度排名前十的作为形似汉字备选集; 然后利用平移不变聚束学
习输出置信因子, 将频度计算与特征信息综合考虑, 利用置信因子熵作为近似度的度量, 选
择近似度高的作为形似汉字, 近似度低的则剔除, 进一 步精简形似汉字集;
针对形似汉字识别问题, 首先用伸缩形变法扩充样本数量, 提升模型泛化力, 然后采用
平移不变聚束 学习方法实现对形似汉字的识别,最后 将人工提取的特征与平移 不变聚束 学
习相结合, 先验知识有助于平 移不变聚束学习的性能提升 。
2.根据权利要求1所述无上下文的手写形似汉字极速准确识别方法, 其特征在于, 手写
形似汉字集的生 成方法: 基于特征笔画空间距离近似度、 平移 不变聚束 学习输出置信因子、
置信因子熵逐步缩小形似汉字的范围, 最终生成形似程度足够高的汉字集, 以便于形似汉
字的识别;
基于近似度生成形似汉字集: 采用粗分类的方法减少备选类别数量, 然后再用 细分类
实现对形似汉字的准确分类; 对于粗分类, 首先生成待识别汉字的若干形似汉字集, 然后将
这个汉字集作为细分类的备选类, 减少备选字的数量, 提取能够区分微小差异的特征, 提升
对于形似汉字的识别率, 包括: 基于笔画目标向量描述符的近似度计算、 基于近似度生 成形
似汉字集。
3.根据权利要求1所述无上下文的手写形似汉字极速准确识别方法, 其特征在于, 基于
笔画目标向量描述符的近似度计算: 首先采用距离近似度来获取一个初阶形似汉字集,对
于距离形似汉字的计算, 采用特征笔画空间中距离近的若干个汉字作为备选字的形似汉
字, 采用笔画目标向量描述符作为汉字的特 征表达;
笔画目标向量描述符利用图像的局部目标中的表象信息和形态信息通过梯级目标或
边缘目标描述特征,首先将图像分为一个个小的相连区域,然后提取每个相连区域里面的
各个像素点的梯级目标或边缘 目标分布图, 这些分布图的聚合就是笔画目标向量描述符,
笔画目标向量描述符能保持一个图像的几何和光学 形变不变性;
笔画目标向量描述符的提取步骤, 分为:
步骤一: 灰度化手写 汉字图像;
步骤二: 采用Gamma校正法对图像颜色空间归一化, 以调节图像的对比度, 降低阴影及
光照造成的影响, 抑制噪声干扰;权 利 要 求 书 1/4 页
2
CN 114863445 A
2步骤三: 计算每 个像素的梯级大小和目标, 获取手写 汉字图像 轮廓信息;
步骤四: 将图像分为若干个小的单元格, 计算每个单元格的梯级分布图, 得到每个单元
格的特征描述;
步骤五: 将若干个单元格组成一个聚类块, 每个聚类块里面的所有单元格的特征描述
组成一个聚类块的特 征描述;
步骤六: 将所有聚类块的特征描述聚合,便组成该图像的笔画目标向量描述符描述,即
最终的笔画目标向量描述符向量;
本申请采用32*32图像, 采用每8*8个像素组成一个单元格, 每2*2个单元格组成一个聚
类块,每个单元格有9个梯级特征, 每个单元格在梯级目标上的360度分为9块, 每个聚类块
就总共包含9*2*2=36个特征, 在图像的水平目标和竖直目标上, 以每8个像素为补偿, 则对
应的目标上有3个扫描窗口, 每个图像总共就会有36*3*3=324个特征, 即每个笔画目标向
量描述符维度为32 4, 利用得到的笔画目标向量描述符, 计算不同汉字之间的特征笔画空间
距离, 以特 征笔画空间的距离作为 不同汉字之间的近似度。
4.根据权利要求1所述无上下文的手写形似汉字极速准确识别方法, 其特征在于, 基于
近似度生成形似汉字集: 计算两个汉字之间的近似度后,依据不同汉字之间的近似度来判
定他们是否互为形似汉字, 对于一个待识别汉字, 首先计算它与其它3754个汉字之间的近
似度, 之后对这3754个近似度进行排序, 选择排名前九的汉字作为待识别汉字的可能形似
汉字集, 对于不同的汉字都采用这种方法, 通过这种方法便得到一个静态的形似汉字集表,
再需要寻找待识别汉字的形似汉字集 查表即可;
本申请采用手写汉字库HCL2000, 总共有1000套一级汉字样本,每套有3755个一级汉
字, 选取100套汉字样本, 然后每套中选择按拼音首字母排序的前300个汉字,这300个汉字
将计算它们与其它3754个汉字的特征笔画空间距离, 对于一套汉字样本, 计算结果为一个
300行3755列的距离矩阵,将 300套样本的每个距离矩阵相加,得到最终的距离矩阵, 然后对
每一行进行排序, 选取排名前9位所代 表的汉字作为形似汉字 。
5.根据权利要求1所述无上下文的手写形似汉字极速准确识别方法, 其特征在于, 基于
平移不变聚束 学习输出置信因子生成形似汉字集: 首先采用平移不变聚束 学习来对形似汉
字集进行基于频度计算的近似度排序, 实现形似汉字集的进一 步判定;
从前面得到的10个距离形似汉字中, 再用平移不变聚束学习对其进行分类, 对于类K,
选择真实值为K的若干个样本, 将其输入到平移不变聚束学习中进行分类, 对于每一个样
本, 平移不变聚束 学习将输出10个备选者和它与之相对应的置信因子, 对于每一个备选者,
选取在每个样本下 的输出置信因子进行累积,最后通过对输出置信因子的累积排序, 得到
样本真实值对于这些 备选者的形似排名, 然后再 取平均,得到归一 化的置信因子排序;
给定一个手写字符作为输入,每个输出类别的置信因子反应这个分类器将输入识别成
对应类别的可能性, 归一化指数函数回归的输出在此定义为一个置信因子的度量,计算式
如下:
其中xj是指第j个输入样本, φ(xj)是xj在最后的全连接层中的特征向量, yj是xj对应的权 利 要 求 书 2/4 页
3
CN 114863445 A
3
专利 无上下文的手写形似汉字极速准确识别方法
文档预览
中文文档
25 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:32:55上传分享