说明:收录90万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210576890.5 (22)申请日 2022.05.25 (71)申请人 华中农业大 学 地址 430070 湖北省武汉市洪山区狮子山 街1号 (72)发明人 沙灜 曹浩 吴明民 葛星 (74)专利代理 机构 北京金智普华知识产权代理 有限公司 1 1401 专利代理师 张晓博 (51)Int.Cl. G06F 40/30(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) (54)发明名称 一种幽默文本自动生 成方法、 系统、 介质、 设 备及终端 (57)摘要 本发明属于幽默文本生 成技术领域, 公开了 一种幽默文本自动生成方法、 系统、 介质、 设备及 终端, 提出新的幽默文本生成任务; 构建基于生 成对抗网络的幽默文本生成模型AMQ ‑GAN; 采用 双判别器, 分别提取语义特征和幽默特征; 采用 基于对比学习的数据增强技术, 并采用p rompt设 置特定的幽默文本训练模板, 使生成的文本突出 幽默的特征。 本发明设计AMQ ‑GAN模型, 通过 SimCSE技术、 pro mpting技术、 语义特征判别和幽 默特征判别器, 有效指导生 成器生成了具有语义 特征和幽默特征的开放式文本。 实验结果表明, 本发明提出的A MQ‑GAN模型在一定程度上 实现了 开放性幽默文本的要求。 权利要求书4页 说明书16页 附图3页 CN 114896985 A 2022.08.12 CN 114896985 A 1.一种幽默文本自动 生成方法, 其特征在于, 所述幽默文本自动生成方法包括: 根据获 取的新的幽默文本生成任务, 输入上半句, 自动生成对所述上半句 翻转的下半句; 构建基于 生成对抗网络的幽默文本生成模型AMQ ‑GAN; 采用双判别器, 分别提取语义特征和幽默特 征, 由语义特征判别器指导语义通顺、 主题一致的语句生 成, 由幽默特征判别器指导具有不 一致性、 歧义性和双关语的幽默特征 的语句的生成; 利用基于对比学习的数据增强以及结 合prompt设置特定的幽 默文本训练模板, 使生成的文本突出幽 默的特征。 2.如权利要求1所述的幽默文本自动生成方法, 其特征在于, 所述幽默文本自动 生成方 法包括以下步骤: 步骤一, 采用基于SimCSE对比学习的数据增强技术, 对同一个句子生成多个不同的句 向量; 步骤二, 采用prompti ng技术, 添加对文本幽 默效果进行评判的第三句; 步骤三, 在生成对抗的过程中, 采用语义特征判别器和幽默特征判别器, 对生成的句子 分别进行语义判别和幽 默判别。 3.如权利要求2所述的幽默文本自动生成方法, 其特征在于, 所述步骤三中的语义特征 判别器用于负责判别前后语句语义、 主题是否一 致以及是否通 顺; 所述幽默特征判别器用于通过不一致性、 双关、 谐音的幽默特征判别文本的幽默质量, 两个判别器的输出 得分经加权共同指导 生成器文本的生成。 4.如权利要求1所述的幽默文本自动生成方法, 其特征在于, 所述幽默文本自动 生成方 法还包括: 给定一个长度为m的前半句作为输入: s=[w1,…, wi,…, wm], 通过模型自动生成出一个 长度为n的后半句s ′=[w′1,…, w′j,…, w′n], 使s与s ′构成的整个文本形成一个颠覆原有认 知, 达到反差、 讽刺效果的笑话; 前后两句话构成一种毒鸡汤文, 通过模型输出的笑点句产 生幽默的效果。 5.如权利要求1所述的幽默文本自动生成方法, 其特征在于, 所述AMQ ‑GAN模型由预训 练、 对抗训练、 语义特 征和幽默特征提取三部分组成; (1)预训练部分 预训练包括对生成器G、 语义特征判别器和幽默特征判别器的预训练; 生成器采用GPT ‑ 2模型, 使用50万条常见的对话语句对生成器进行预训练, 使生成器根据输入生成通顺、 流 畅的一般性回复; 采用语义特征判别器和幽默特征器, 通过预训练生成器生成的文本分别 与常见对话和幽默文本加入标签构建数据集, 前者构建为语义数据集训练语义特征判别 器, 后者构建为幽 默数据集训练幽 默特征判别器; (2)对抗训练部分 采用的最优化目标函数如下式所示: 其中, x表示服从真实数据分布的真实样本, D(x)表示判别器对样本x判别为真实样本 的概率, G(z)是生 成器生成的虚假样 本; 对生成器的优化就是最小化log(1 ‑D(G(z))), 使生 成器生成的样本能够欺骗判别器, 对判别器的优化则是最大化log(D(x))+log(1 ‑D(G (z))), 使判别器能够有效区分真实样本和虚假样本, 通过生成器和判别器的训练迭代, 促权 利 要 求 书 1/4 页 2 CN 114896985 A 2进生成器生成能够欺骗判别器的真实样本; 引入双判别器对文本的语义特征和幽默特征分 别判别; (3)语义特 征和幽默特征提取 引入语义特征和幽默特征提取模块, 用于指导生成器生成具有幽默特征和语义特征的 文本; 对生成器的语句分别从语义上和幽 默性上进行 单词级别的计算, 以得到奖励分数: 1)语义特 征提取 主要通过话题一 致性、 语义通顺程度和普遍性判别生成文本的语义特 征。 ①话题一致性 前后两句组成的句向量词义距离较近则讨论的话题比较一 致: q1=cos(s, s ′)。 ②语义通顺程度 语义通顺程度是评价文本的语义基础指标, 通过计算给定文本主体句s生成笑点句s ′ 的前向概率, 以及给定笑点句s ′生成主体句的后向概率来评估生成幽默文本的语义通顺程 度: q2=logP(s′|s)+logPbackward(s|s′); ③普遍性 利用50w大规模语料数据集进行作为常见词语集, 通过计算笑点句中的词语出现在常 见词语集的概 率计算该笑点句的普遍性: q3=logP(wi)。 2)幽默特征提取 幽默特征判别器根据目标幽默特征提取模块来判断文本幽默的质量, 提取的幽默特征 如下: ①歧义性 歧义是产生笑话的重要条件之一, 因此歧义特征可以作为笑话的一个重要组成部分; 通过计算 生成文本中的歧义词数量 来评价该文本的好笑程度; 其中ambiguities(wi)表示笑话中第i个词具有不同义项的数量; ②语音相似性 押韵使两个不同的字音调、 韵母相同, 产生笑点; 通过计算主体句和笑点句中押 韵词的 个数, 来评价 生成文本的语音相似性; 其中rhymes(s, s ′)表示主体句与笑点句中押韵词的个数, N代表幽默文本中主体句与 笑点句的总词数; ③不一致性 分析前半句和后半句组成的词语集Vs和Vs′, 如果其中的两个词语之间的相似度较小, 则认为前后语句构成笑话; q6=min{cos(Vs, Vs′)}。 6.如权利要求5所述的幽 默文本自动生成方法, 其特 征在于, 所述对抗训练部分包括:权 利 要 求 书 2/4 页 3 CN 114896985 A 3
专利 一种幽默文本自动生成方法、系统、介质、设备及终端
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:08:56
上传分享
举报
下载
原文档
(851.9 KB)
分享
友情链接
DB43-T 2424-2022 水土保持监测技术规程 湖南省.pdf
ISO 11551 2019 Optics and photonics — Lasers and laser-related equipment — Test method for absorptance of optical laser components.pdf
DB14-T 2624—2022 五角枫播种育苗技术规程 山西省.pdf
T-GDCKCJH 058—2022 汽车域控制器(DCU)自动化测试线通用要求.pdf
GB 4793.1-2007 测量、控制和实验室用电气设备的安全要求 第1部分:通用要求.pdf
GB-T 38319-2019 建筑及居住区数字化技术应用 智能硬件技术要求.pdf
GBJ 93-86 工业自动化仪表施工验收.pdf
GB-T 43681-2024 生态系统评估 区域生态系统调查方法.pdf
GB-T 42716-2023 电化学储能电站建模导则.pdf
GM-T 0027-2014 智能密码钥匙技术规范.pdf
GB-T 41581-2022 核电厂应急撤离时间估算.pdf
GB-T 39944-2021 筒子纱数字化染色成套装备 通用技术条件.pdf
TB-T 2231.2-2018 铁道车辆制动系统 第2部分:货车.pdf
GB-T 20394-2019 体育用人造草.pdf
上海市公共数据开放暂行办法.pdf
拐点 站在AI颠覆世界的前夜 万维钢.pdf
GB-T 40060-2021 液氢贮存和运输技术要求.pdf
GB-T 35274-2017 信息安全技术 大数据服务安全能力要求 .pdf
DB37-T 3160-2018 渔港安全管理规范 山东省.pdf
CREST 应急响应指南 CSIR-Procurement-Guide 英文版.pdf
1
/
3
24
评价文档
赞助2.5元 点击下载(851.9 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。