专利 无上下文的手写形似汉字极速准确识别方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210565115.X (22)申请日 2022.05.23 (71)申请人郭江华地址 518100 广东省深圳市龙岗区贝尔路华为坂田园区H区2座 (72)发明人郭江华　 (51)Int.Cl. G06V 30/226(2022.01) G06V 10/74(2022.01) G06V 10/774(2022.01) G06V 10/764(2022.01) G06K 9/62(2022.01) (54)发明名称无上下文的手写形似汉字极速准确识别方法 (57)摘要本申请采用特征笔画空间距离构建一个初阶的静态形似汉字集，大幅减少备选字的数量，以特征笔画空间的距离远近作为汉字之间的形似程度；将初阶形似汉字集精简化,构建二级分类器得到形似汉字组；利用平移不变聚束学习的输出置信因子对备选字排序，计算首选字与备选字之间的置信因子熵作为近似度,选择近似度高的作为形似汉字组，输出置信因子的计算兼顾频度计算，考虑偏离样本中心的特殊样本；将汉字识别目标层级特征与平移不变聚束学习相结合, 目标层级特征作为先验知识，混合梯级特征作为输入提升识别率；实验表明，本申请的稳定性、可移植性、可扩展性和可维护性好，形似汉字识别快速准确，具有巨大的技术优势和广阔的运用前景。权利要求书4页说明书14页附图6页 CN 114863445 A 2022.08.05 CN 114863445 A 1.无上下文的手写形似汉字极速准确识别方法，其特征在于，采用特征笔画空间距离构建一个初阶的静态形似汉字集，减少备选字的数量，以特征笔画空间的距离远近作为汉字之间的形似程度；将初阶形似汉字集精简化,构建二级分类器得到形似程度有一定标准的形似汉字组；利用平移不变聚束学习的输出置信因子对备选字排序，计算首选字与备选字之间的置信因子熵作为近似度的度量,选择近似度高的作为形似汉字组，平移不变聚束学习的输出置信因子的计算兼顾频度计算，考虑偏离样本中心的特殊样本，并且置信因子熵作为近似度的度量考虑的是样本的各类特性的综合；将汉字识别目标层级特征与平移不变聚束学习相结合,目标层级特征作为一个先验知识，混合梯级特征作为输入提升聚束学习识别率；本申请首先用粗分类实现形似汉字的判定，获取近似度足够高的形似汉字组，然后用细分类实现对形似汉字的识别：针对形似汉字判定问题,首先通过基于特征笔画空间距离近似度的方法进行形似汉字的初阶判定，选择距离近似度排名前十的作为形似汉字备选集；然后利用平移不变聚束学习输出置信因子，将频度计算与特征信息综合考虑，利用置信因子熵作为近似度的度量，选择近似度高的作为形似汉字，近似度低的则剔除，进一步精简形似汉字集；针对形似汉字识别问题，首先用伸缩形变法扩充样本数量，提升模型泛化力，然后采用平移不变聚束学习方法实现对形似汉字的识别,最后将人工提取的特征与平移不变聚束学习相结合，先验知识有助于平移不变聚束学习的性能提升。 2.根据权利要求1所述无上下文的手写形似汉字极速准确识别方法，其特征在于，手写形似汉字集的生成方法：基于特征笔画空间距离近似度、平移不变聚束学习输出置信因子、置信因子熵逐步缩小形似汉字的范围，最终生成形似程度足够高的汉字集，以便于形似汉字的识别；基于近似度生成形似汉字集：采用粗分类的方法减少备选类别数量，然后再用细分类实现对形似汉字的准确分类；对于粗分类，首先生成待识别汉字的若干形似汉字集，然后将这个汉字集作为细分类的备选类，减少备选字的数量，提取能够区分微小差异的特征，提升对于形似汉字的识别率，包括：基于笔画目标向量描述符的近似度计算、基于近似度生成形似汉字集。 3.根据权利要求1所述无上下文的手写形似汉字极速准确识别方法，其特征在于，基于笔画目标向量描述符的近似度计算：首先采用距离近似度来获取一个初阶形似汉字集,对于距离形似汉字的计算，采用特征笔画空间中距离近的若干个汉字作为备选字的形似汉字，采用笔画目标向量描述符作为汉字的特征表达；笔画目标向量描述符利用图像的局部目标中的表象信息和形态信息通过梯级目标或边缘目标描述特征,首先将图像分为一个个小的相连区域,然后提取每个相连区域里面的各个像素点的梯级目标或边缘目标分布图，这些分布图的聚合就是笔画目标向量描述符，笔画目标向量描述符能保持一个图像的几何和光学形变不变性；笔画目标向量描述符的提取步骤，分为：步骤一：灰度化手写汉字图像；步骤二：采用Gamma校正法对图像颜色空间归一化，以调节图像的对比度，降低阴影及光照造成的影响，抑制噪声干扰；权　利　要　求　书 1/4 页 2 CN 114863445 A 2步骤三：计算每个像素的梯级大小和目标，获取手写汉字图像轮廓信息；步骤四：将图像分为若干个小的单元格，计算每个单元格的梯级分布图，得到每个单元格的特征描述；步骤五：将若干个单元格组成一个聚类块，每个聚类块里面的所有单元格的特征描述组成一个聚类块的特征描述；步骤六：将所有聚类块的特征描述聚合,便组成该图像的笔画目标向量描述符描述,即最终的笔画目标向量描述符向量；本申请采用32*32图像，采用每8*8个像素组成一个单元格，每2*2个单元格组成一个聚类块,每个单元格有9个梯级特征，每个单元格在梯级目标上的360度分为9块，每个聚类块就总共包含9*2*2＝36个特征，在图像的水平目标和竖直目标上，以每8个像素为补偿，则对应的目标上有3个扫描窗口，每个图像总共就会有36*3*3＝324个特征，即每个笔画目标向量描述符维度为32 4，利用得到的笔画目标向量描述符，计算不同汉字之间的特征笔画空间距离，以特征笔画空间的距离作为不同汉字之间的近似度。 4.根据权利要求1所述无上下文的手写形似汉字极速准确识别方法，其特征在于，基于近似度生成形似汉字集：计算两个汉字之间的近似度后,依据不同汉字之间的近似度来判定他们是否互为形似汉字，对于一个待识别汉字，首先计算它与其它3754个汉字之间的近似度，之后对这3754个近似度进行排序，选择排名前九的汉字作为待识别汉字的可能形似汉字集，对于不同的汉字都采用这种方法，通过这种方法便得到一个静态的形似汉字集表, 再需要寻找待识别汉字的形似汉字集查表即可；本申请采用手写汉字库HCL2000，总共有1000套一级汉字样本,每套有3755个一级汉字，选取100套汉字样本，然后每套中选择按拼音首字母排序的前300个汉字,这300个汉字将计算它们与其它3754个汉字的特征笔画空间距离，对于一套汉字样本，计算结果为一个 300行3755列的距离矩阵,将 300套样本的每个距离矩阵相加,得到最终的距离矩阵，然后对每一行进行排序，选取排名前9位所代表的汉字作为形似汉字。 5.根据权利要求1所述无上下文的手写形似汉字极速准确识别方法，其特征在于，基于平移不变聚束学习输出置信因子生成形似汉字集：首先采用平移不变聚束学习来对形似汉字集进行基于频度计算的近似度排序，实现形似汉字集的进一步判定；从前面得到的10个距离形似汉字中，再用平移不变聚束学习对其进行分类，对于类K, 选择真实值为K的若干个样本，将其输入到平移不变聚束学习中进行分类，对于每一个样本，平移不变聚束学习将输出10个备选者和它与之相对应的置信因子，对于每一个备选者, 选取在每个样本下的输出置信因子进行累积,最后通过对输出置信因子的累积排序，得到样本真实值对于这些备选者的形似排名，然后再取平均,得到归一化的置信因子排序；给定一个手写字符作为输入,每个输出类别的置信因子反应这个分类器将输入识别成对应类别的可能性，归一化指数函数回归的输出在此定义为一个置信因子的度量,计算式如下：其中xj是指第j个输入样本， φ(xj)是xj在最后的全连接层中的特征向量， yj是xj对应的权　利　要　求　书 2/4 页 3 CN 114863445 A 3

专利 无上下文的手写形似汉字极速准确识别方法

专利无上下文的手写形似汉字极速准确识别方法