说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210602851.8 (22)申请日 2022.05.30 (71)申请人 福州数据技 术研究院有限公司 地址 350000 福建省福州市长乐区数字福 建产业园东湖路3 3号6#楼 (72)发明人 闾海荣 王天亨 李艳 石顺中  (74)专利代理 机构 福州市景弘专利代理事务所 (普通合伙) 35219 专利代理师 魏小霞 (51)Int.Cl. G06F 40/14(2020.01) G06F 40/30(2020.01) G06F 17/16(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06N 5/04(2006.01) (54)发明名称 一种基于邻接矩阵的文档级别关系抽取方 法和存储设备 (57)摘要 本申请涉及 文档级别关系抽取技术领域, 特 别涉及一种基于邻接矩 阵的文档级别关系抽取 方法和存储设备。 所述一种基于邻接矩阵的文档 级 别 关 系 抽 取 方 法 ,包 括 步 骤 :通 过 Transformer ‑XL模型对文档级别的长文本进行 建模; 对具有关系的实体对分别进行建模为一个 依赖树; 根据所述依赖树生 成具有一定关系实体 对的邻接矩阵; 通过加权注意对与目标关系特征 有关联的关系特征进行融合; 根据融合后的特征 矩阵生成实体对对应的关系的概率。 上述方法中 采用Transformer ‑XL模型对文档中的长文本序 列进行建模, 保证各个分段之间的文本具有语义 联系, 并且 对于建模 文本长度没有上限。 权利要求书2页 说明书9页 附图3页 CN 115081392 A 2022.09.20 CN 115081392 A 1.一种基于邻接矩阵的文档级别关系抽取 方法, 其特 征在于, 包括 步骤: 通过Transformer ‑XL模型对文档级别的长文本进行建模; 构建实体对关系特 征矩阵; 对具有关系的实体对分别建模为 一个路径 依赖树; 根据所述依赖树 生成具有一定关系实体对之间的邻接矩阵; 根据所述邻接矩阵计算可 见矩阵; 通过自注意力机制对与目标实体对关系特 征有关联的关系特 征进行融合; 根据融合后的特 征矩阵计算实体对 对应的关系的概 率。 2.根据权利要求1所述的一种基于邻 接矩阵的文档级别关系抽取方法, 其特征在于, 所 述根据所述邻接矩阵计算可 见矩阵, 还 包括: 重复利用n‑1阶矩阵计算n阶邻接矩阵的步骤, 直至n阶邻接矩阵中元素为1的两个关系 特征之间符合预设条件; 根据前n阶邻接矩阵计算得 可见矩阵V: V=A+A2+...+An 其中A代表一阶矩阵, A2代表二阶矩阵, An代表n阶矩阵,n的取值 为大于等于2的自然数。 3.根据权利要求1所述的一种基于邻 接矩阵的文档级别关系抽取方法, 其特征在于, 所 述通过加权注意对与目标关系特 征有关联的关系特 征进行融合, 还 包括: 根据不同的关系特 征之间的步数不同确定不同的权 重, 步数越长, 权 重越小。 4.根据权利要求1所述的一种基于邻 接矩阵的文档级别关系抽取方法, 其特征在于, 所 述依赖树的根节点为对应的实体对, 第一层节点表示邻接矩阵中横向与纵向和该实体对直 接联系的实体对关系特 征表示。 5.根据权利要求1所述的一种基于邻 接矩阵的文档级别关系抽取方法, 其特征在于, 所 述构建关系特征矩阵, 还 包括: 计算文档中所有的实体嵌入表示, 根据所述嵌入表示构建 关系特征矩阵。 6.一种存 储设备, 其中存 储有指令集, 其特 征在于, 所述指令集用于执 行: 通过Transformer ‑XL模型对文档级别的长文本进行建模; 构建实体对关系特 征矩阵; 对具有关系的实体对分别建模为 一个路径 依赖树; 根据所述依赖树 生成具有一定关系实体对之间的邻接矩阵; 根据所述邻接矩阵计算可 见矩阵; 通过自注意力机制对与目标实体对关系特 征有关联的关系特 征进行融合; 根据融合后的特 征矩阵计算实体对 对应的关系的概 率。 7.根据权利要求6所述的一种存储设备, 其特征在于, 所述指令集还用于执行: 所述根 据所述邻接矩阵计算可 见矩阵, 还 包括: 重复利用n‑1阶矩阵计算n阶邻接矩阵的步骤, 直至n阶邻接矩阵中元素为1的两个关系 特征之间符合预设条件; 根据前n阶邻接矩阵计算得 可见矩阵V: V=A+A2+...+An 其中A代表一阶矩阵, A2代表二阶矩阵, An代表n阶矩阵,n的取值 为大于等于2的自然数。权 利 要 求 书 1/2 页 2 CN 115081392 A 28.根据权利要求6所述的一种存 储设备, 其特 征在于, 所述指令集还用于执 行: 所述通过加权注意对与目标关系特 征有关联的关系特 征进行融合, 还 包括: 根据不同的关系特 征之间的步数不同确定不同的权 重, 步数越长, 权 重越小。 9.根据权利要求6所述的一种 存储设备, 其特征在于, 所述依赖树的根节点为对应的实 体对, 第一层节点表示邻接矩阵中横向与纵向和该实体对直接联系的实体对关系特征表 示。 10.根据权利要求6所述的一种存 储设备, 其特 征在于, 所述指令集还用于执 行: 所述构建 关系特征矩阵, 还 包括: 计算文档中所有的实体嵌入表示, 根据所述嵌入表示构建 关系特征矩阵。权 利 要 求 书 2/2 页 3 CN 115081392 A 3

.PDF文档 专利 一种基于邻接矩阵的文档级别关系抽取方法和存储设备

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于邻接矩阵的文档级别关系抽取方法和存储设备 第 1 页 专利 一种基于邻接矩阵的文档级别关系抽取方法和存储设备 第 2 页 专利 一种基于邻接矩阵的文档级别关系抽取方法和存储设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:08:40上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。