专利 一种基于细粒度的文本情感抽取方法及相关产品

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210815895.9 (22)申请日 2022.07.12 (71)申请人重庆邮电大学地址 400000 重庆市南岸区南山街道崇文路2号 (72)发明人夏书银　陈涛　戴大伟　王国胤　 (74)专利代理机构成都行之专利代理事务所 (普通合伙) 51220 专利代理师喻英 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/289(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种基于细粒度的文本情感抽取方法及相关产品 (57)摘要本发明公开了一种基于细粒度的文本情感抽取方法及相关产品，涉及自然语言处理技术领域，包括以下步骤：基于字粒度对输入文本进行语义特征提取并获得第一语义向量，基于词粒度对输入文本进行语义特征提取并获得第二语义向量；将第一语义向量与第二语义向量采用拼接的方式进行叠加，获得深层次语义表征；利用降维线性层和非线性函数对深层次语义表征进行特征提取，获的方面特征和观点特征；构建双向二维矩阵，对方面特征和观点特征进行情感依赖解析，获得字级别的情感依赖信息；将字级别的情感依赖信息与方面特征及观点特征结合，得到跨度级别的情感依赖信息。本发明能深度挖掘出文本的深层次语义信息，同时有效解决元素重叠的问题。权利要求书3页说明书8页附图4页 CN 115204180 A 2022.10.18 CN 115204180 A 1.一种基于细粒度的文本情感抽取方法，其特征在于，包括以下步骤：基于字粒度对输入文本进行语义特征提取并获得第一语义向量，基于词粒度对输入文本进行语义特征提取并获得第二语义向量；将所述第一语义向量与第二语义向量采用拼接的方式进行叠加，获得深层次语义表征；利用降维线性层和非线性函数对所述深层次语义表征进行特征提取，获的方面特征和观点特征；构建双向二维矩阵，对所述方面特征和观点特征进行情感依赖解析，获得字级别的情感依赖信息；将所述字级别的情感依赖信息与所述方面特征及所述观点特征结合，得到跨度级别的情感依赖信息。 2.根据权利要求1所述的一种基于细粒度的文本情感抽取方法，其特征在于,在基于字粒度对输入文本进行语义特征提取并获得第一语义向量中，包括：对所述输入文本进行预处理，将所述输入文本中的每个字都作为模型的输入，映射为高维的字向量；利用BILSTM网络对所述字向量进行特征提取，得到所述第一语义向量。 3.根据权利要求1所述的一种基于细粒度的文本情感抽取方法，其特征在于,在基于词粒度对输入文本进行语义特征提取并获得第二语义向量中，包括：对所述输入文本进行预处理，将整个输入文本用jieba分词工具进行分词，得到整个输入文本的所有分词集合；利用Word2Vec算法将所述所有分词集合映射至高维向量空间，获得高维的词向量；将所述词向量输入至卷积神经网络的输入层，利用卷积神经网络的卷积层用多个滤波器进行特征提取，接着在卷积神经网络的池化层对提取的特征在宽度上进行最大池化，然后通过全连接层对其特征进行连接，最后得到包含整体的第二语义向量。 4.根据权利要求1所述的一种基于细粒度的文本情感抽取方法，其特征在于，在利用降维线性层和非线性函数对所述深层次语义表征进行特征提取中，特征提取的计算公式为：其中，和是方面特征和观点特征的表示，与为模型的权重，与为模型的偏置项， f( ·)表示非线性函数。 5.根据权利要求1所述的一种基于细粒度的文本情感抽取方法，其特征在于，在构建双向二维矩阵，对所述方面特征和观点特征进行情感依赖解析中，包括：将所述输入文本中的所有字进行配对，形成基于方面推导观点的二维矩阵，其中，该二维矩阵的横轴代表观点，竖轴代表方面，当该二维矩阵解析到观点特征 ‑方面特征对之间的情感依赖时，在一个观点的最后一个特征词坐标和一个方面的最后一个特征词坐标上填充对应的情况极性；将所述输入文本中的所有字进行配对，形成基于观点推导方面的二维矩阵，其中，该二权　利　要　求　书 1/3 页 2 CN 115204180 A 2维矩阵的横轴代表方面，竖轴代表观点，当该二维矩阵解析到方面特征 ‑观点特征对之间的情感依赖时，在一个方面的最后一个特征词坐标和一个观点的最后一个特征词的坐标上填充对应的情况极性。 6.根据权利要求5所述的一种基于细粒度的文本情感抽取方法，其特征在于，进行二维矩阵解析的公式为：其中，代表观点推导方面方向上方面特征 ‑观点特征对(wi,wj)的第k个依赖类型的分数, 代表观点推导方面方向上方面特征 ‑观点特征对(wi,wj)分数的概率，代表方面推导观点方向上观点特征 ‑方面特征对(wi,wj)的第k个依赖类型的分数, 代表方面推导观点方向上观点特征 ‑方面特征对(wi,wj)分数的概率,wk和bk是产生第k个分数的权重和偏差。 7.根据权利要求5所述的一种基于细粒度的文本情感抽取方法，其特征在于,在获得最终预测结果后，还包括：对所述跨度级别的情感依赖信息进行解析，获得文本情感解析结果集合；基于文本情感解析结果，结合类平衡交叉熵损失函数来训练网络，通过梯度下降算法和反向传播算法，不断优化损失函数。 8.根据权利要求7所述的一种基于细粒度的文本情感抽取方法，其特征在于,在获得文本情感解析结果集合中：若方面推导观点的二维矩阵中得到的解析结果无法在观点推导方面的二维矩阵中求得，则将此结果添加至所述文本情感解析结果集合中；若观点推导方面的二维矩阵中得到的解析结果无法在方面推导观点的二维矩阵中求得，则将此结果添加至所述文本情感解析结果集合中；若在方面推导观点的二维矩阵和观点推导方面的二维矩阵中，针对于同一个方面和观点对预测出不同的情感依赖，则通过两个矩阵模型预测出的最大感情依赖概率进行判断，将有最大情感依赖概率的结果添加至所述最终预测结果的集合。 9.一种基于细粒度的文本情感抽取方法的系统，其特征在于，包括：语义向量提取层，用于基于字粒度对输入文本进行语义特征提取并获得第一语义向量，基于词粒度对输入文本进行语义特征提取并获得第二语义向量；全连接层，用于将所述第一语义向量与第二语义向量采用拼接的方式进行叠加，获得深层次语义表征；方面‑观点提取层，用于利用降维线性层和非线性函数对所述深层次语义表征进行特征提取，获的方面特征和观点特征；双向二维矩阵层，用于对所述方面特征和观点特征进行情感依赖解析，获得字级别的权　利　要　求　书 2/3 页 3 CN 115204180 A 3

专利 一种基于细粒度的文本情感抽取方法及相关产品

专利一种基于细粒度的文本情感抽取方法及相关产品