说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210911352.7 (22)申请日 2022.07.30 (71)申请人 黄竑僖 地址 510000 广东省广州市越秀区越秀北 二横道2号之一402房 (72)发明人 黄竑僖  (74)专利代理 机构 深圳知帮办专利代理有限公 司 44682 专利代理师 王艺欢 (51)Int.Cl. G06F 16/23(2019.01) G06F 16/242(2019.01) G06F 16/27(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种机器学习人工智能翻译SQL数据库的更 新方法 (57)摘要 本发明公开了机器学习人工智能翻译SQL数 据库的更新方法, 通过接收输入信息并进行单层 LSTM网络对所述输入信息的当前句子进行编码 和双层LSTM网络对当前句子之前的对话历史进 行编码, 采用注意力机制得到当前句子向量和上 文语境句子向量融合生成SQL语句, 将SQL语句输 入翻译模型中训练, 设定生 成器参数并使用生成 器生成的样本和真实样本训练判别器, 设定判别 器参数并使用判别结果作为奖励指导训练生成 器, 直到翻译模型收敛得到抽象语法树, 将抽象 语法树通过树解析器转换成预设语法习惯的自 然语言, SQL翻译能将SQL转换为自然语言, 使得 用户或管理员能够快速发现SQL语句中可能存在 的风险, 避免出现数据库安全问题。 权利要求书3页 说明书8页 附图1页 CN 115114313 A 2022.09.27 CN 115114313 A 1.一种机器学习人工智能翻译SQ L数据库的更新方法, 其特 征在于, 包括以下步骤: 接收输入信息并进行单层LSTM网络对所述输入信息的当前句子进行编码和双层LSTM 网络对当前句子之前的对话历史进行编码, 其中, 单层LSTM网络根据单词级别对上文中所 有的句子进行编码, 编码得到的输出结果作为双层LSTM网络的输入, 双层LSTM网络基于句 子的级别对 政哥哥上文对话段进行编码; 采用单向信息流的图注意力机制将得到的当前句子向量和上文语境句子向量进行融 合, 对向量进行解码, 将得到一个根据上文语境从当前语句中生成SQ L语句; 将SQL语句输入翻译模型中训练, 翻译模型包括生成器和判别器, 设定生成器参数并使 用生成器生成的样本和真实样本训练判别器, 更新判别器参数; 设定判别器参数并使用判别器的判别结果作为奖励指导训练生成器, 并更新生成器参 数, 直到翻译模型收敛得到抽象语法树, 将抽象语法树通过树解析器转换成预设语法习惯 的自然语言。 2.根据权利要求1所述的机器学习人工智能翻译SQL数据库的更新方法, 其特征在于, 设定判别器参数并使用判别器的判别结果作为奖励指导训练生成器, 包括: . 使用训练词向量表表示自然语言问题和相关联的数据表, 采用q=[q1,q2,q3...qn]表示 自然语言问题部分的输入; 设定问题相 关联的数据表使用 “||”连接不同的数据表单元, 数据表单元包括SQL关键 字、 表中的列名和具体的值, 其表示为 其中 表示第k个数据表中的单 元; 对数据表输入和自然语言问题输入分别编码并将编码的输出输入双层LSTM网络 中, 在 第一层的双向LSTM网络中, 数据表侧和自然语言问题侧分别进行计算, 其白表达式为 将第一层双向LSTM网络的输出 继续 输入第二层双向LSTM网络中, 其表达式为 对 于问题侧将两个方向的编码 拼接得到最终问题的编码表示, 即 对于数据表 侧将 和 拼接得到 作为第k个数据表单元 的表 示。 3.根据权利要求2所述的机器学习人工智能翻译SQL数据库的更新方法, 其特征在于, 还包括: 使用注意力机制获得与数据表中每个单元最相关的自然语言问题编码, 数据表单元 关于自然语言问题编码 的注意力分数ak,i, 其表达式为 其中e(*)为一层全连接神经网络, 且 之后通过 得到新的数 据表单元表示代替之前的 使用注意力的LSTM网络解码器在每个时间步骤t从输入序列中选择要复制的单元, 在 第t时间步长输入序列中选择第i单元ui的概率由表达式 权 利 要 求 书 1/3 页 2 CN 115114313 A 2其中St表示在第t时间步长的解码器隐藏状态, 表示数据表单元ui通过编码后的隐藏状 态, Wa表示需要训练的模型参数。 4.根据权利要求3所述的机器学习人工智能翻译SQL数据库的更新方法, 其特征在于, 注意力机制的网络模型构建过程包括: 根据对原始句子的排序结果构造图G, 预设顶点集V为n个句子的集合, 边的集合E是句 子之间的关系, 通过句子相似度计算来对句子之间的关系进行建模, 用 表示邻 接矩阵, 通过递归使用图上的全局信息来计算句子的重要性分数, 其表达式为f(t+1)=λ WD‑1f(t)+(1‑λ )y,, 其中 表示n个句子的等级分数, f(t)表示第t次迭代 后的等级分数, D表示 一个对角矩阵, 其中(i,i)元 素的值等于邻接矩阵W的第i列的和; 若采用hi作为句子si的向量, 且 其中M为需要学习的参数矩阵, λ表示 一个阻尼因子, 且所有的元素都等于1/n, 从而f的值可用表达式f=(1 ‑λ )(i‑λWD ‑1)‑1y, 句子si的重要性分数由hi与其他所有句子之间的关系进行确定 。 5.根据权利要求1所述的机器学习人工智能翻译SQL数据库的更新方法, 其特征在于, 设定生成器参数并使用生成器生成的样本和真实样本训练判别器, 更新判别器参数, 包括: 使用训练词向量将输入判别器的SQL查询语句转换为连续向量形式的语义表示x1, ...xT, 将T个词拼接到一起得到ε1:T, 其表达式为 其中 为 k维的词向量表示, 表示拼接操作, 表示一个T ×k维度的矩阵, 然后使用卷 积核 对窗口大小为l的词进行卷积操作得到新的特征图 , 其表达式为 其中 表示卷积操作, 等于每部分分别相乘之后的和, b是偏置项, P表示非线性 函数, 使用不同窗口大小的不同数量的卷积核来 提取不同的特 征。 6.根据权利要求1所述的机器学习人工智能翻译SQL数据库的更新方法, 将抽象语法树 通过树解析器转换成预设语法习惯的自然语言, 包括: 根据语法抽象树对应的数据库建模表和数据库 方法表将翻译结果中的方法名、 字段名 和表名翻译成 中文, 其中, 翻译时判断出被翻译的内容的类型, 并查找相应的数据 表以完成 剩下的英文部分翻译成中文。 7.根据权利要求6所述的机器学习人工智能翻译SQL数据库的更新方法, 翻译过程需要 调整语序, 语序的调整使用栈实现, 将需要调整语序的句子放入栈中返回时从栈中取出, 采 用树解析器完成翻译过程。 8.根据权利要求1所述的机器学习人工智能翻译SQL数据库的更新方法, 抽象语法树以 一棵树的形式表示输入, 并以树的形式被解析器解析, 用于传达句法信息, 句法信息包括关 键字、 字段、 表和方法名。 9.根据权利要求1所述的机器学习人工智能翻译SQL数据库的更新方法, 将模型生成的 SQL语句查询由树 解析器进行解析, 解析SQ L查询的过程包括: 获取生成的SQL查询语句, 将SQL关键字和数据表单元分为若干组并将每组进行标记, 按照预设规则将其组合成新的单元得到数据 表结构, 其中数据表结构包括表列关系和列单 元关系, 表列关系用于标识列是否属于表, 列单元关系表示是否属于列, 子查询在 满足表列权 利 要 求 书 2/3 页 3 CN 115114313 A 3

PDF文档 专利 一种机器学习人工智能翻译SQL数据库的更新方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种机器学习人工智能翻译SQL数据库的更新方法 第 1 页 专利 一种机器学习人工智能翻译SQL数据库的更新方法 第 2 页 专利 一种机器学习人工智能翻译SQL数据库的更新方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:43:06上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。