当前位置: 首页 > news >正文

然后做网站wordpress的wiki主题

然后做网站,wordpress的wiki主题,织梦系统做的网站怎么样,如何给自己做的网站加上域名文章目录abstract1.introduction1.2 条件模型2.标签偏差问题3.CRF提出条件随机场CRF abstract 我们提出了条件随机场#xff0c;这是一个建立概率模型来分割和标记序列数据的框架。相对于隐马尔可夫模型和随机语法#xff0c;条件随机场在这类任务中有几个优势#xff0c;… 文章目录abstract1.introduction1.2 条件模型2.标签偏差问题3.CRF提出条件随机场CRF abstract 我们提出了条件随机场这是一个建立概率模型来分割和标记序列数据的框架。相对于隐马尔可夫模型和随机语法条件随机场在这类任务中有几个优势包括能够放松这些模型中做出的强独立性假设。条件随机域也避免了最大熵马尔可夫模型(MEMMs)和其他基于有向图模型的判别马尔可夫模型的基本限制这些模型可能会偏向于后继状态较少的状态。我们提出了条件随机场的迭代参数估计算法并将得到的模型在合成和自然语言数据上与HMMs和MEMMs的性能进行了比较。 1.introduction 对序列进行分割和标记的需求出现在许多不同的问题中。隐马尔可夫模型(HMMs)和随机语法stochastic grammars 是这类问题的常用概率模型。 生成模型赋予成对观测序列和标记序列一个联合概率;参数最大化似然估计MLE观察序列单词–x标注词性/ner类型–y困难表示多个相互作用的特征或观测的长期依赖关系是不实际的 解决条件模型 为了定义观察和标记序列的联合概率生成模型需要枚举所有可能的观察序列通常需要一个表示其中的观察是适合任务的原子实体如单词或核苷酸。特别是表示多个相互作用的特征或观测的长期依赖关系是不实际的因为此类模型的推理问题是棘手的。 这种困难是将条件模型作为备选方案的主要动机之一。条件模型指定给定观测序列的可能标签序列的概率。因此它不会在观测上花费建模工作因为在测试时观测是固定的。此外标签序列的条件概率可以依赖于观察序列的任意的、非独立的特征而不必强迫模型考虑这些依赖项的分布。所选的特性可能表示同一观察的不同粒度级别的属性(例如英语文本中的单词和字符)或者观察序列的聚合属性(例如文本布局)。标签之间转换的可能性不仅取决于当前的观察而且取决于过去和未来的观察(如果可能的话)。与此相反生成模型必须对观测结果做出非常严格的独立性假设例如给出标签的条件独立性以达到可处理性。 1.2 条件模型 条件模型条件模型指定给定观测序列的可能标签序列的概率。 观测在测试时是固定的—x标签序列的条件概率可以依赖于观察序列的任意的、非独立的特征而不必强迫模型考虑这些依赖项的分布特性 可以是不同粒度的也可以是聚合属性 转移依赖于过去/未来/x无严格的独立性假设 最大熵马尔可夫模型(MEMMs) 是一种条件概率序列模型它实现了上述所有优点(McCallum et al. 2000)。在MEMMs中每个源state1都有一个指数模型该模型以观测特征为输入并输出可能的下一个状态的分布。采用适当的迭代标度法对MEMMs的这些指数模型进行训练提高了回忆率比HMM高一倍 MEMMs和其他基于下一状态分类器的非生成有限状态模型如判别性马尔科夫模型(Bottou, 1991) 弱点都有一个我们称之为标签偏差问题的弱点:离开给定状态的转换只会相互竞争而不是与模型中的所有其他转换竞争。 在概率术语中转换分数是给定当前状态和观察序列的可能下一状态的条件概率。这种每个国家过渡分数的标准化意味着分数质量的守恒(Bottou, 1991)因此到达一个国家的所有质量必须分配给可能的继承国。一个观测可以影响哪个目的地状态得到质量但不影响传递的总质量。这导致了对输出转换较少的状态的偏爱。在极端情况下具有单个传出转换的状态实际上忽略了观察结果。在这些情况下与HMMs不同Viterbi解码不能根据分支点之后的观察下调一个分支并且具有状态转换结构的模型有稀疏连接的状态链没有得到适当的处理。MEMMs中的马尔可夫假设和类似的状态条件模型将一个状态下的决策与未来的决策隔离开来但这种方式与连续状态之间的实际依赖关系并不匹配。 CRFs 条件模型解决标签偏差问题区别 MEMM使用每个状态的指数模型来表示给定当前状态下的下一个状态的条件概率而CRF使用单个指数模型来表示给定观察序列的整个标签序列的联合概率。因此不同状态下不同特征的权重可以相互抵消。 训练最大似然或MAP估计进行训练损失函数是凸的保证收敛到全局最优可用于随机上下文无关语法有限状态模型具有未归一化的转移概率 我们也可以认为CRF是一个有限状态模型具有未归一化的转移概率。然而与其他一些加权有限状态方法(LeCun et al. 1998)不同的是CRFs在可能的标签上分配了一个定义良好的概率分布通过最大似然或MAP估计进行训练。此外损失函数是凸的保证收敛到全局最优。CRFs还可以很容易地推广到随机上下文无关语法的类似物这将在RNA二级结构预测和自然语言处理等问题中很有用。提出了该模型描述了两种训练方法并给出了收敛性证明。我们还给出了合成数据的实验结果表明CRFs解决了标签偏差问题的经典版本更重要的是当真实数据分布具有比模型更高的阶依赖性时CRFs的性能优于HMMs和MEMMs这在实践中经常出现。最后我们通过在词性标注任务中对状态结构相同的HMMs、MEMMs和CRFs进行评价证实了这些结果以及条件模型的优势。 本文成果 提出CRF解决标签偏差两种训练方式及收敛性证明 2.标签偏差问题 存在此问题的经典的概率自动机(Pa经典的概率自动机(Paz, 1971)判别马尔科夫模型(Bottou, 1991)最大熵标记器(Ratnaparkhi, 1996) MEMMs以及非概率序列标记和分割模型与独立训练的下一状态分类器(Punyakanok 都是标签偏差问题的潜在受害者z, 1971)判别马尔科夫模型(Bottou, 1991)最大熵标记器(Ratnaparkhi, 1996) MEMMs以及非概率序列标记和分割模型与独立训练的下一状态分类器(Punyakanok 都是标签偏差问题的潜在受害者 实例例如图1表示一个简单的有限状态模型用于区分单词rib和rob。假设观测序列为rib在第一个时间步中r匹配开始状态的两个跃迁因此概率质量在这两个跃迁之间的分布大致相等。接下来我们观察i状态1和4都只有一个输出跃迁。状态1在训练中经常看到这种情况状态4几乎从未看到过这种情况;但是和状态1一样状态4别无选择只能把它所有的质量传递给它唯一的向外的跃迁因为它不是产生观测而是对它进行调节。因此只有一个外向过渡的国家实际上忽略了它们的观察结果。更一般地说具有低熵的状态的下一个状态分布很少注意到观测结果。回到例子中顶部路径和底部路径的概率是相等的与观察序列无关。如果两个单词中的一个在训练集中稍微更常见一些那么从起始状态转换出来的转换将稍微倾向于对应的转换并且单词s状态序列将始终胜出。这一行为在第5节的实验中得到了证明。 解决方案 L’eon Bottou(1991)讨论了标签偏差问题的两种解决方案。一是改变模型的状态转换结构 在上面的例子中我们可以折叠状态1和状态4并延迟分支直到我们得到一个有区别的观察结果。这种操作是确定性的一个特例(Mohri, 1997)但是加权有限状态机的确定性并不总是可能的即使有可能也会导致组合爆炸。 提到的另一个解决方案是从一个完全连接的模型开始让训练过程找出一个好的结构。 但是这将妨碍使用在信息提取任务中已被证明非常有价值的先前结构知识(Freitag McCallu) 确的解决方案要求模型同时考虑整个状态序列根据相应的观察结果允许某些转换比其他转换更强烈地“投票”。 这意味着分数质量不会被保留相反个体的转变可以“放大”或“减弱”他们所接收到的质量。在上面的例子中,转换从一开始状态会非常弱的影响路径的分数,尽管state1和4的过渡会更加强烈的影响,放大或衰减取决于实际的观察,占比大的对维特比选择贡献大。 在相关的工作部分中我们讨论了其他的启发式模型类它们全局地而不是局部地考虑状态序列。据我们所知CRFs是唯一一个在纯概率设置下进行此操作的模型类它具有全局最大似然收敛的保证 3.CRF 其中X是待标号数据序列上的随机变量Y是对应标号序列上的随机变量。假设Y的所有分量Yi都在一个有限的字母集Y上。例如X可能在自然语言句子上取值Y可能在这些句子的词性标记上取值Y可能是一组词性标记。随机变量X和Y是共同分布的但在判别框架中我们根据成对观察和标记序列构造了条件模型p(Y |X)而没有显式地对边缘p(X)进行建模 因此CRF是基于观测x的全局随机场。在本文中我们默认图G是固定的。以最简单最重要的方式 参数估计 最大似然函数的目标函数 矩阵形式 训练方法 improved iterative scaling (IIS) algorithm of Della Pietra et al. (1997) 问题然而有效地计算这些方程右边的指数和是有问题的因为T(x, y)是(x, y)的一个全局性质而动态规划将对具有潜在变化T的序列求和改进 算法Sslack feature)算法T(记录部分T总数 前向后向算法α1(x){1ystart0otherwise\alpha_1(x)\begin{cases}1 ystart\\0 otherwise\end{cases}α1​(x){10​ystartotherwise​ 证明
http://wiki.neutronadmin.com/news/149715/

相关文章:

  • 阳澄湖大闸蟹网站建设惠州网站制作专业
  • 有没有免费的企业网站建设福州网站设计哪家做的好
  • 驻马店做网站建设的公司网站代码组件
  • frontpage做网站怎么样企业型网站建设费用
  • 色块设计网站工程造价信息网官网登录
  • 怎么创建自己的网站2021年最新的网站
  • 洛阳做多屏合一网站wordpress电商平台
  • 公司建设网站费用属于什么费用东莞企业网站设计
  • 深圳网站外包公司网上商店的优势和缺陷
  • 购物网站类型昆明有网站的公司
  • 厦门 网站开发济宁北湖建设集团网站
  • 深圳网站建设哪家口碑好香精论坛
  • 兰州做网站客户山西省建设监理协会网站
  • 小米路由器3 做网站Wordpress怎么给图片加注引
  • 沈阳网站制作公司云蓝图福田搭建网站费用
  • 北京做网站哪个公司好wordpress 不带主题显示
  • 网站右侧二维码代码宝山宜昌网站建设
  • 网站建设需要注意哪些方面深圳龙岗有什么好玩的地方
  • 新网站建设信息在线建网址
  • 网站设计公司多少钱南京外包公司
  • 无形资产 网站建设seo引擎优化方案
  • 网站设计的公司蒙特温州建设诚信网站
  • 网站后台文章删了 怎么前台还有o2o商城网站开发
  • 网站的留言怎么做公司网站建设对公司的重要性
  • seo网站排名优化软件是什么有哪些做分析图用的网站
  • 制作网站的网站郑州最新通告
  • 模型下载网站开发流程个人网站有什么用
  • 企业网站的常见服务学校网站怎么做的好
  • 什么叫网站建设哪个网站可以做分期
  • 昆明网站建设天软科技seo有哪些作用