魏县网站建设推广,网站跳出率高还是低,一个网站可以做多少个小程序,洛阳建网站公司链接#xff1a; https://arxiv.org/pdf/1911.05889.pdf动机虽然最近几年通过利用社交网络上大量人人交互数据训练开放域对话模型取得了很大的成功#xff0c;但是这些数据驱动的对话系统仍然无法很自然的与人类对话#xff0c;其中的一个主要问题就是对话系统缺乏一致的角色… 链接 https://arxiv.org/pdf/1911.05889.pdf动机虽然最近几年通过利用社交网络上大量人人交互数据训练开放域对话模型取得了很大的成功但是这些数据驱动的对话系统仍然无法很自然的与人类对话其中的一个主要问题就是对话系统缺乏一致的角色特征。图1中的例子展示了角色一致性是如何影响对话的质量。提高对话系统角色一致性的一个实用方法是明确定义一组描述对话系统角色信息persona的描述性文本并以此为基础学习生成体现出预先定义角色信息的回复。尽管编码器-解码器框架在基于角色信息的对话生成模型中得到了成功的应用但存在的问题是这些生成模型普遍缺乏对于一致性信息的建模。一方面近几年自然语言推理技术Natural Language Inference相关技术有了长足的进步。有研究工作表明回复和角色文本的一致性检测问题可以被建模为角色信息回复之间的自然语言推理技术问题。如何在基于角色信息的对话生成模型中利用这种检测方法建模并提高角色的一致性是一个值得探索的问题。亮点论文亮点主要包括1提出了一个用于角色一致对话生成的RL框架解决了在基于角色的对话模型中区分训练目标的挑战。2这是第一项用NLI技术来增强角色一致性对话生成的工作。3实验结果表明提出的模型优于强基准尤其是在角色一致性方面。概念及模型目标是学习一个生成模型G以生成角色信息一致的对话。形式化定义如下给定输入X角色信息的集合P{P1,P2...,Pn},目标是生成一个回复Y,即YG(X,P)。此外附加一个自然语言推理模型NLI生成的回复需要满足NLI(P,Y)∈{E,N},其中E表示一致N表示中立。图1 一致性对于回复质量的影响图2 模型总体结构图如图2所示该文所提出的一致性对话生成框架由两部分组成一个序列生成器GGenerator和一个评估器EvaluatorE。其中评估器E由两个子模块组成分别是一致性检测模块一致中立矛盾和自然度检测模块自然不自然。在本文的任务中一个理想的回复应该是看起来很自然并且与给定的角色信息保持一致的即自然度模块 EN是一个二分类器用于判断给定的回复来自模型生成还是训练数据。论文把输入的回复通过双向GRU编码为向量表示然后通过多层感知器网络及SoftMax函数输出二分类概率。EN的训练目标是最小化预测结果和真实标签之间的交叉熵损失。来自EN的奖励定义R1为EN将给定回复预测为来自训练数据的概率。一致性模块 EC是一个NLI的分类器。EC被训练来预测角色信息回复之间的一致性关系共有一致中立和矛盾三种情况。由于首次尝试使用该方法来建模一致性为了更好的探索自然语言推理技术模型对于提高回复一致性的帮助作用论文使用了2个效果有明显差别的自然语言推理技术模型Base模型和BERT模型以观察对最终效果的影响。其中Base模型为GRUInteractionMLP的典型NLI模型BERT模型实在BERT_base的基础上进一步微调得到的。最终来自一致性模块EC的奖励定义为E 是回复与角色信息一致的置信度C 是回复与角色信息矛盾的置信度。通过该奖励函数希望鼓励模型尽可能生成一致的回复并减少不一致回复的生成。生成器 G 是一个用GRU作为基本单元使用Seq2Seq的结构的生成模型。角色信息文本作为了输入的一部分。此外在生成过程中的每一步都使用了展开rollout的方式来获取对于当前位置更为精确的奖励估计。最后用于优化 G 的奖励函数为R 0.4R1 0.6R2实验论文在公开的PersonaChat数据集上进行了实验。实验评价主要考虑两个方面1.回复的一致性。考虑到有限样本的情况下人工标注难以得到足够的一致类别的样本论文主要使用自然语言推理技术模型DIIN对生成的回复进行分类。结果如表1所示。其中论文的方法缩写为RCDG即Reinforcement Learning based Consistent Dialogue Generation。Entail.表示回复与角色信息一致的比例值越高越好Contr.表示回复与角色信息相矛盾的比例值越低越好。同时论文也给出了测试数据的相关比例。可以发现PersonaChat中并非所有对话都与角色信息相关。此外论文也的确在数据集中发现了极个别存在的矛盾回复。2. 回复的质量。对回复质量的评价按照惯例进行包括了客观指标表2和主观评价表3两部分。客观指标包括衡量流畅性的困惑度ppl衡量语义相似度的embedding metricsAve., Grd., Ext.以及衡量多样性的Distinct-2Dst.。主观评价使用了0-2的总体质量打分方式。表1 角色一致性评价结果表2 对话质量自动指标结果总结在该项工作中论文探索了利用自然语言推理技术来建模开放域对话生成中人物角色一致性的问题。为此论文将该任务转化为一个强化学习问题并在生成模型中利用自然语言推理技术信号提高回复的一致性。通过在PersonaChat数据集上的实验论文证明了论文的方法相比于基线模型获得了有效提升。 OpenKG开放知识图谱简称 OpenKG旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。点击阅读原文进入 OpenKG 网站。