当前位置: 首页 > news >正文

微信上做网站编辑布吉建网站

微信上做网站编辑,布吉建网站,优化设计四年级上册数学答案,微信公众号运营策划规则引导的知识图谱联合嵌入方法 人工智能技术与咨询 本文来自《计算机研究与发展》 #xff0c;作者姚思雨等 摘 要 近年来#xff0c;大量研究工作致力于知识图谱的嵌入学习#xff0c;旨在将知识图谱中的实体与关系映射到低维连续的向量空间中.且所学习到的嵌入表示已…规则引导的知识图谱联合嵌入方法 人工智能技术与咨询  本文来自《计算机研究与发展》 作者姚思雨等 摘 要 近年来大量研究工作致力于知识图谱的嵌入学习旨在将知识图谱中的实体与关系映射到低维连续的向量空间中.且所学习到的嵌入表示已被成功用于缓解大规模知识图谱的计算效率低下问题.然而大多数现有嵌入学习模型仅考虑知识图谱的结构信息.知识图谱中还包含有丰富的上下文信息和文本信息它们也可被用于学习更准确的嵌入表示.针对这一问题提出了一种规则引导的知识图谱联合嵌入学习模型基于图卷积网络将上下文信息与文本信息融合到实体与关系的嵌入表示中.特别是针对上下文信息的卷积编码通过计算单条上下文信息的置信度与关联度来度量其重要程度.对于置信度定义了一个简单有效的规则并依据该规则进行计算.对于关联度提出了一种基于文本表示的计算方法.最后在2个基准数据集上进行的实验结果证明了模型的有效性. 关键词 知识图谱表示学习图卷积网络上下文信息文本信息 近年来由于具有表达能力强、歧义性低、模式统一、且支持推理等优点知识图谱已被广泛用于组织和发布各领域的结构化数据.通常知识图谱由实体、实体所具有的属性以及实体间的关系所组成.例如其中可能包含有实体中国、关系首都以及实体属性“China”. 如图1所示知识图谱的基础构成则是描述2个实体之间的关系或实体及其属性之间关系的三元组如(中国首都北京)、(中国英语标签“China”). Fig. 1 Several triples which contain the entity Beijing and the related literals 图1 包含实体“北京”的若干三元组及文本信息 目前知识图谱已被广泛应用在智能问答[1]、推荐系统[2]和信息检索[3]等任务中其突出表现在学术与工业界均获得了广泛关注[4].但是受益于知识图谱所包含丰富信息的同时其庞大的规模与数据稀疏性问题也给知识图谱的应用带来了挑战.例如Freebase[5], Yago[6]和Dbpedia[7]等开放领域知识图谱中通常包含有数百万个实体以及上亿条描述实体关系的三元组.将子图匹配等传统图算法应用在这些大规模知识图谱上往往存在计算低效性问题.为此研究人员提出了知识图谱嵌入学习模型(knowledge graph embedding learning model)将知识图谱映射到低维、连续的向量空间中学习实体与关系的嵌入表示[8]. 通过设计特定的表示学习机制知识图谱的结构和语义等信息可被编码在所学习到的嵌入表示中.一方面原本需要对大规模知识图谱进行频繁访问的操作例如结构化查询构建(structured query construction)[9]、逻辑查询执行(logical query pro-cessing)[10]和查询放缩(query relaxation)[11]均可在所学习到的嵌入表示空间中通过数值计算完成极大地提高了效率.另一方面知识图谱的嵌入学习提供了一种抽取并高效表示知识图谱特征信息的方法类似于自然语言处理领域中被广泛应用的词嵌入(word embedding)知识图谱的嵌入表示也为基于知识图谱的深度学习工作提供了极大的便利. 现有知识图谱嵌入学习模型大多仅关注知识图谱中以三元组表示的结构信息.例如Bordes等人提出了基于翻译机制(translation mechanism)的TransE模型[12]其目标任务为链接预测(link prediction)与三元组分类(triple classification)概括而言就是判断知识图谱中给定的2个实体之间是否存在某个关系.因此TransE模型仅关注所学习到的嵌入表示对单条三元组结构信息的编码其在嵌入学习过程中将知识图谱简化为互不相关的三元组的有限集合.因此TransE及其后续改进模型[13-16]对知识图谱中上下文信息的编码能力非常弱很难应用于语义相关的任务.针对这一问题相继有一些基于上下文信息的嵌入表示模型被提出如GAKE[17] RDF2Vec[18].但是它们仍然仅关注知识图谱中由子图、路径等结构所表示的上下文信息.例如在学习图1中实体北京的嵌入表示时上述方法仅关注(中国首都北京)与(北京位于华北)等描述实体间关系的三元组而忽略了北京的简介、英文标签等文本信息.显然文本信息的缺失限制了所学到嵌入表示对语义信息的表达. 为解决这一问题本文提出了一种规则引导的知识图谱联合嵌入学习模型.受Vashishth等人[19]所提出的图卷积网络启发模型首先通过多关系型图卷积将实体在知识图谱中的上下文信息编码到实体的嵌入表示中.与Vashishth等人的工作所不同的是本文认为实体的多条上下文信息应该具有不同的重要程度并且某条上下文信息的重要程度取决于2个因素该条上下文信息的置信度以及其相对于实体的关联度.为此本文提出了一条简单有效的规则引导上下文信息置信度的计算并基于知识图谱中的文本信息表示提出了实体与其上下文信息之间关联度的计算方法.最后模型将图卷积网络所编码的嵌入表示与文本信息的向量表示整合以链接预测任务的结果作为训练目标学习知识图谱中实体与关系的嵌入表示. 本文贡献主要体现在3个方面 1) 基于图卷积网络创新地提出了一种联合考虑知识图谱中上下文信息与文本信息由规则引导的嵌入表示学习模型. 2) 针对上下文信息在图卷积中的重要程度提出了应用规则以及知识图谱中文本信息来计算单条上下文信息置信度与关联度的新方法. 3) 在基准数据集上进行了充分的实验并与相关的知识图谱嵌入学习方法进行了对比实验结果验证了本文模型的有效性. 1 相关工作 本节对与本文工作较相关的知识图谱嵌入学习模型进行介绍由于本文所提出的模型是基于图神经网络的因此分别介绍基于图神经网络的知识图谱嵌入学习模型和其他非图神经网络的嵌入学习模型. 1.1 基于图神经网络的模型 基于图神经网络的模型主要包括R-GCN[20], W-GCN[21], CompGCN[19]等.该类模型通常将图卷积网络作为编码器对图结构数据进行编码并结合对应的解码器进行知识图谱上的链接预测、节点分类等任务.在R-GCN中每层网络中节点与关系的特征利用权重矩阵进行计算并通过领域聚合的方式传递至后续网络层.具体而言R-GCN利用基分解和块对角分解构造特定关系的权重矩阵以处理不同类型的邻居关系将其与邻居节点信息进行融合并传递到目标实体上进行更新.W-GCN在图卷积网络聚合过程中为每个权重矩阵分配可学习的权重参数使模型获得更优的实体嵌入表示.CompGCN则提出了针对中心节点的领域信息聚合方法在理论上使用多种“实体-关系”组合算法对当前主流的基于多关系的图卷积网络模型进行了概括. 1.2 非图神经网络的模型 非图神经网络的嵌入学习模型类别较多主要包括基于翻译机制的模型如TransE[12]及其后续改进模型包括TransH[13]TransR[14]TransD[15]TransAH[16],基于上下文信息的模型如GAKE[17]RDF2Vec[18]基于张量分解的模型如ComplEx[22]RESCAL[23]. 其中基于翻译机制的模型应用较为广泛.该类模型通常仅关注知识图谱的结构信息将实体之间的关系表示为嵌入向量空间中的某种翻译操作(translation operation).以TransE为例其将知识图谱中的实体与关系都表示在同一个低维欧几里得空间中以向量表示一个实体或关系.具体而言对于知识图谱中的一条三元组(h,r,t)TransE 将其中的关系r看作在欧几里得空间中从头实体h到尾实体t的平移操作即其期望头实体所对应的向量h经过关系所对应的向量r的平移操作后可以非常逼近尾实体所对应的向量t即hr≈t. TransE的翻译机制较为简单因此可以高效地应用于大规模知识图谱但同时又限制了其模型的表达能力使其难以处理一对多、多对一以及多对多类型的复杂关系[14].为解决这一问题TransE之后相继有一些翻译机制更加复杂的模型被提出.例如TransH[15]相对于所给定三元组中关系的超平面空间设计翻译机制TransR[16]则针对知识图谱中的每一个关系额外学习一个矩阵借助该矩阵将头、尾实体通过线性变换映射到相应的关系向量空间中然后再计算其翻译机制的损失值. 2 联合嵌入表示学习 本节首先对知识图谱嵌入学习问题进行形式化定义介绍相关概念的符号表示然后详细介绍所提出的规则引导的联合嵌入学习模型. 2.1 问题定义 本文将知识图谱表示为 其中 分别代表知识图谱中的实体与关系集合.对于某个三元组 其中头尾实体均属于实体集合即 其中关系属于关系集合即 知识图谱的嵌入学习问题在于学习给定知识图谱 中任意实体 与任意关系 的向量表示e,r∈ d其中为d嵌入表示的维度.本文通过链接预测任务评价所学习到的嵌入表示该任务可能包括2种情形给定实体 与关系 基于它们的嵌入表示e,r∈ d预测另外一个实体 使得存在三元组 或 或者给定2个实体 基于它们的嵌入表示e,e′∈ d预测一个关系 使得存在三元组 或 对于任意实体 与关系 本文将它们所对应的文本信息表示为le与lr.对于实体 本文将其所有邻居三元组的集合 视为e的上下文,具体而言 为集合 与集合 的并集且对于 中任意邻居三元组本文认为其表达了节点e的一条上下文信息. 与Vashishth等人[19]的做法类似本文也对知识图谱的关系集合进行扩充 其中 为逆关系集合.具体而言对于任意三元组 本文在关系集合中增加一条逆关系r-1并相应地将三元组(et,r-1,eh)添加到知识图谱 中即 代表自环关系集合即对于任意实体 在知识图谱 中添加自环三元组即 此外本文使用 代表实体e周围邻居实体的集合 代表实体e周围邻居关系的集合例如对于图1中的实体北京其邻居实体集合为{华北中国…}邻居关系集合为{位于首都简介英文标签…}. 2.2 模型整体架构 本文基于知识图谱的上下文信息与文本信息联合学习实体与关系的嵌入表示.图2展示了模型的整体架构针对节点eh其上下文信息 由包括三元组(eh,ri,eti)在内的所有邻居三元组表达.本文模型利用图卷积网络基于 将eh的上下文信息编码到其嵌入表示中.并且本文认为eh的不同邻居三元组所各自表达的上下文信息具有不同的重要程度通过计算单条上下文信息的置信度与关联度对其重要程度进行度量. 对于置信度计算本文针对上下文信息中所包含的关系提出一条简单有效的规则并基于该规则在嵌入学习之前预先计算特定于一对关系的置信度矩阵C并在图卷积过程中利用该矩阵计算某条上下文信息的置信度如图2中标有置信度计算的虚线所示. Fig. 2 An overview of the core part of the model 图2 模型核心部分框架图 对于关联度计算本文首先利用预训练语言模型对知识图谱中实体与关系的文本信息进行编码.如图2所示对于实体eh与关系ri的文本leh与lri它们的文本向量分别记为Leh与Lri.本文基于实体与关系的文本向量表示计算单条上下文信息与其对应实体之间的关联度如图2中标有关联度计算的虚线所示. 值得一提的是本文所提出的模型采用“编码器-解码器”框架(encoder-decoder).上述基于图卷积网络的上下文信息编码即为编码器的主要内容.除此之外编码器还将上述过程学习到的实体与关系的嵌入表示与它们的文本表示相结合.本文模型的解码器则主要基于ConvE模型[24]实现.下面对模型的细节进行详细的介绍. 2.3 编码器 规则引导的置信度计算. 知识图谱中的关系并非相互独立.对于一个实体 当e拥有一条邻居关系 时这可能暗示其还同时拥有另一条邻居关系 例如当某个实体的一条邻居关系为首都时其很可能拥有另外一个邻居关系市长.因为显然只有城市才可能是“首都”并且其往往拥有“市长”这一上下文信息.本文认为这种关系间的联系可用于对上下文信息的置信度进行估算.因此本文提出以下规则对于实体 当其某条上下文信息中包含有关系 并且 中同时存在关系r2r1≠r2.此时对于知识图谱中任意实体 出现 的概率越高相对于e而言包含r1的上下文信息置信度越高.例如当某个实体拥有一条包含有关系市长的上下文信息时如果该实体同时拥有关系首都那么包含有市长的上下文信息置信度较高因为首都与市长通常同时出现在实体的上下文中. 基于上述规则本文在进行图卷积网络的训练前首先计算置信度矩阵C∈ 表示集合的大小.对于矩阵中的任意参数Ci,j0≤i,j≤ 其计算如下 (1) 其中,分母表示知识图谱中拥有邻居关系ri的实体的个数分子表示同时拥有邻居关系ri与rj的实体的个数i与j在此表示关系ri与rj在关系集合 中的索引. 对于图2中实体eh当利用其邻居三元组 通过图卷积编码其向量表示eh时模型会首先基于置信度矩阵C评价eh的各个邻居三元组.例如图2中邻居三元组(eh,ri,eti)的置信度可以通过式(2)来计算 (2) 其中 代表实体eti邻居关系集合id(·)表示关系在 中的索引.值得一提的是在本文模型的实现中置信度计算被整合到了关联度计算中对其进行详细介绍. 基于文本信息的关联度计算.考虑到知识图谱中实体与其不同上下文信息之间关联度的差异在进行实体嵌入表示的卷积编码时关联度高的上下文信息应该获得更多的关注.为此本文借助实体和关系的文本描述作为辅助信息计算实体与其单条上下文信息之间的关联度用于后续图卷积网络中实体嵌入表示的更新.本文首先将知识图谱中实体和关系的文本描述输入到预训练的BERT[25]语言模型中得到它们所对应的初始文本表示然后再分别利用实体文本转换矩阵与关系文本转换矩阵计算它们的最终文本表示.具体而言对于任意实体 与关系 其对应文本分别为le与lr它们通过BERT得到的初始文本表示为 与 转换后的最终文本表示为Le与Lr其中 本文利用实体与关系的文本表示计算对于某一实体而言其单条上下文信息的关联度.如图2所示实体eh的一条邻居三元组为(eh,ri,eti)本文计算参数βi与γi来度量该条邻居三元组所表示的上下文信息与eh之间的关联度具体公式为 (3) 其中Lej与Leh分别为实体ej与eh的文本表示 为实体eti的邻居实体集合. (4) 其中Lrj与Lri分别为关系rj与ri的文本表示 为实体eti的邻居关系集合Cid(ri),id(rj)如式(2)所定义. 基于图卷积网络的嵌入更新.本文采用Vashishth等人所提出的CompGCN[19]模型作为图卷积网络的架构对知识图谱上下文信息进行编码. 初始状态下对于任意实体 与关系 其嵌入表示为随机向量e0与r0且e0,r0∈ d.以图2中的实体eh为例其嵌入表示通过以下图卷积过程进行更新 (5) 其中, 表示实体eh的邻居三元组集合 或 针对包含有邻居关系ri与邻居节点eti的一条上下文信息αi基于置信度计算与关联度计算度量该条上下文信息的重要程度具体如下 αiλ1βiλ2γi, (6) 其中βi由式(3)计算得到γi则由式(4)计算得到Wt(ri)为CompGCN[19]中定义的关系类别矩阵由于知识图谱中被加入了逆关系与自环关系Wt(ri)∈ d′×d可能为3种不同的表示具体为 (7) 其中函数f(·)表示循环关联操作(circular correla-tion)[26]可以将2个向量x,y∈ d进行融合得到x∘y∈ d每个维度的数值计算为 (8) 遵循CompGCN框架在对实体进行图卷积编码的同时本文通过转换矩阵Wr∈ d′×d更新关系的嵌入表示 (9) 最后本文将任意实体 与关系 的文本表示加入到其嵌入表示中具体为 eeLe, (10) rrLr. (11) 2.4 解码器 本文采用ConvE[24]模型作为解码器基于所学习到的嵌入表示进行链接预测通过提高链接预测的表现更新模型参数.当知识图谱经过编码器编码后对于某个任意构成的三元组(eh,r,et)可知其头尾实体eh与et的嵌入表示为eh与et关系r的嵌入表示为r.ConvE模型首先将eh与r转换成二维形式即 与 然后计算该三元组的分数值 sc(eh,r,et) (12) 其中,[·]表示相连接ω表示卷积过滤器vec(·)为ConvE所定义的维度变换Wcov为参数矩阵f′(·)为非线性函数.当式(12)计算得到的分数值越高(eh,r,et)越有可能是正确的三元组. 3 实 验 本节首先对实验所使用的数据集、对比模型和评价指标等进行说明然后介绍本文所提模型的实验结果并与其他基准模型进行比较与分析. 3.1 数据集及对比模型介绍 本文在2个广泛使用的数据集上进行试验分别是FB15K-237[27]和WN18[12]其统计数据如表1所示: Table 1 Summary Statistics of Knowledge Graphs 表1 数据集的统计信息 为验证所提模型的有效性本文广泛选取了当前被应用较多的知识图谱嵌入学习模型作为对比方法具体包括TransE[11],DistMult[28],ComplEx[22],R-GCN[20],KBGAN[29],ConvE[24],ConvKB[30],SACN[21],HypER[31],RotatE[32],ConvR[33],VR-GCN[34],CompGCN[19].其中TransE[11]为基于翻译机制的嵌入学习模型上文已对其进行了详细介绍.DistMult[28]将实体表示为通过神经网络学习到的低维向量将关系表示为双线性或线性映射函数.ComplEx[22]与RESCAL[23]模型类似属于基于矩阵/张量分解进行链接预测的模型.R-GCN[20],VR-GCN[34]与CompGCN[19]属于基于图卷积网络的嵌入表示模型以R-GCN[20]为例其将知识图谱中的关系编码为矩阵通过关系矩阵传递相邻实体的嵌入信息并采用了多层图卷积网络.KBGAN则应用了对抗生成网络(generative adversarial network, GAN)在训练过程中生成更具迷惑性的负例来提高嵌入表示的训练效果.本文应用了ConvE[24]模型作为解码器在第2节中对其进行了详细介绍.ConvKB[30],ConvR[33],SACN[21]与HypER[31]均是基于卷积神经网络的方法.以HypER[31]为例其可以生成简化的与关系相关的卷积过滤器且可被构造为张量分解.RotatE[32]与TransE[11]等基于翻译机制的模型类似其将实体之间的关系表示为向量空间中从头实体到尾实体的旋转. 3.2 评价方法说明 本文通过链接预测任务来对模型的有效性进行评价.在实验中针对被事先去掉头实体或尾实体的测试三元组本文基于学习到的嵌入表示推测其被去掉的头实体或尾实体.具体对于每个测试三元组本文选取知识图谱中的任意实体作为可能的预测结果并计算利用该实体补全测试三元组后的分数值如式(12)所示最后对分数值进行排序.在此以缺失头实体的预测为例对于测试集中每个三元组(eh,r,et)事先删除其头实体eh然后试图使用G中的任意实体 补齐该测试三元组从而产生候选三元组集合 最后基于所学习到的嵌入表示计算候选三元组的分数值并进行排序分数值越高表明学习到的模型即嵌入表示认为该结果更可靠通过与真实结果进行比较从而判段所学习嵌入表示的优劣. 最后采用MR(mean rank),MRR(mean reciprocal rank)和Hitk作为评价指标[12].其中MR与MRR均为预测结果平均排名的指标Hitk则指预测结果排在前k名中的比例本文具体采用Hit10Hit3和Hit1.总之越好的预测结果其MR值越低、MRR值越高、Hitk也越高. 3.3 实验设置 本文实验代码使用Python实现在配置Ubuntu 16.04.6 LTS操作系统的服务器上完成其CPU配置为16核Intel Core i7-6900K 3.20 GHz 内存128 GBGPU配置为4张GeForce GTX 1080 GPU卡. 对于实体和关系文本表示向量的编码本文借助pretrained-bert-base-uncased预训练模型(1)https://github.com/google-research/bert文本向量初始维度为768转换后的维度为200.在图卷积网络中实体和关系的初始化向量维度为100即d100GCN的维度为200即d′200.解码器中维度转换的高度和宽度分别为10和20卷积过滤器的大小为7×7数量为200.利用Adam优化器对整体模型进行训练批大小(batch size)为256学习率(learning rate)为0.001. 本文对TransE模型进行了复现其余模型则引用对比模型论文中所报告的结果. 3.4 实验结果分析 表2报告了本文模型与对比模型在链接预测任务中的实验结果. 通过表2可观察到如下结果 1) 本文模型在各个评价指标上显著优于TransE,DistMult和ComplEx等基准模型与SACN,HypER和CompGCN等最新提出的模型十分接近由此可证明本文模型的有效性.对于FB15K-237数据集本文在Hit10指标上排名第一. 2) 在Hit1和Hit3指标上也与CompGCNConvRSACN相差极小.具体在Hit1指标上仅比最高的CompGCN低1.51%在MRR指标上与CompGCN相比仅低0.8%.而对于WN18数据集本文模型在MR指标上排名第一在Hit10和Hit3指标上也与第一名差距微小.具体在Hit10指标上比RotatE低0.2%在Hit3指标上比ConvR和HypER仅低0.9%. 3) 基于图神经网络的嵌入学习方法的表现普遍优于TransE等仅关注结构化信息的模型.就本文模型而言由于其基于图卷积网络对知识图谱的上下文信息与文本信息进行了联合嵌入表示显著提高了在链接预测任务中的表现. Table 2 Link Prediction Results on FB15K-237 and WN18 表2 链接预测在FB15K-237和WN18上的结果 Note: The best performance is in bold. 4 总 结 现有多数知识图谱嵌入学习方法仅考虑由三元组表示的知识图谱结构信息而忽视了知识图谱中丰富的上下文信息与文本信息限制了嵌入表示在链接预测等任务中的表现.针对现有方法的这一局限性本文提出一种利用图卷积神经网络结合知识图谱的上下文信息与文本信息学习嵌入表示的方法.为了对上下文信息的重要程度进行细粒度分析本文提出一条简单有效的规则来计算上下文信息的置信度并基于文本信息的向量表示提出计算上下文信息关联度的方法加强了对上下文信息的约束和引导.最后通过在2个广泛使用的基准数据集上进行对比实验验证了本文模型的有效性. 关注微信公众号人工智能技术与咨询。了解更多咨询
http://wiki.neutronadmin.com/news/297914/

相关文章:

  • 官方网站怎样做旅游网站开发的需求分析
  • 橱柜网站建设公司汽车是怎么做的视频网站
  • 东莞网站建设php方案网站建设2017排名
  • 头像设计制作网站石家庄做网站最好的公司
  • 能够做外贸的网站有哪些织梦手机网站教程
  • 口碑好的天津网站建设公司介绍简历模板
  • led网站模板危险网站怎么解除
  • 怎么仿做网站海外网络推广平台
  • 南通网站排名优化做药的文献一般在哪些网站查找
  • 广州网站制作怎样asp网站建设下载
  • 柳城网站制作百元便宜建站
  • 网站宣传标语seo快速排名关键词
  • 大良营销网站建设如何东阿县城市建设局网站
  • 南海网站建设如何宣传推广自己的店铺
  • 陕西做网站的企业网站建站元素
  • 网站制作方案和主要内容安徽网站建设的基本步骤
  • 沈阳网站建设公司建设淘宝优惠券网站
  • 这么做3d网站搭建网站是什么专业
  • 顶呱呱网站做的怎么样代理品牌
  • 医疗做网站外贸网站推广方式
  • 做服务网站网站策划设计招聘
  • 毕业设计拼车网站的建设雨实现深圳建设工程交易服务网官网龙岗
  • 网站建成后 再添加小功能麻烦吗WordPress怎么文章分类
  • app网站设计制作广州公司注册名称核名查询系统网页版
  • 广东省建设厅投诉网站首页有做网站维护的
  • 创意经济型网站建设网站建设销售怎么做
  • 潍坊网站建设500关于加强政务网站建设的通知
  • 南江移动网站建设seo 能提高网站速度吗
  • html5网站制作教程有哪些网站是拐角型
  • 网站制作有哪些方面网站架构建设