当前位置: 首页 > news >正文

网站文章页301重定向怎么做许昌网站建设

网站文章页301重定向怎么做,许昌网站建设,电子商务营销网站建设,千库网ppt文 | 花椒最近在刷EMNLP论文的时候发现一篇非常有趣的论文《Learning Music Helps You Read: Using Transfer to Study Linguistic Structure in Language Models》#xff0c;来自斯坦福大学NLP组。论文有趣的发现是让语言模型先在乐谱上进行训练#xff0c;再在自然语言上训… 文 | 花椒最近在刷EMNLP论文的时候发现一篇非常有趣的论文《Learning Music Helps You Read: Using Transfer to Study Linguistic Structure in Language Models》来自斯坦福大学NLP组。论文有趣的发现是让语言模型先在乐谱上进行训练再在自然语言上训练可以有效的提升语言模型的性能。在看了一大堆BERT-based的模型后看到这篇文章时便觉得眼前一亮。激发了花椒的好奇心。都说学习音乐可以让大脑更加聪明。难道语言模型也一样从音乐中获得了“灵感”变“聪明”了? 于是乎带着脑洞继续往下读。论文题目Learning Music Helps You Read: Using Transfer to Study Linguistic Structure in Language Models论文链接https://www.aclweb.org/anthology/2020.emnlp-main.554.pdf    Githubhttps://github.com/toizzy/tilt-transferArxiv访问慢的小伙伴也可以在 【夕小瑶的卖萌屋】订阅号后台回复关键词 【1130】 下载论文PDF~本文主要探究什么问题本文的主要假设是对于有结构性的语言比如乐谱和代码他们的潜在结构能被神经网络所编码且有助于自然语言的学习。在此假设上本文主要研究问题是当存在两种语言L1和L2时, 语言模型可以在多大程度上学习并迁移L1中的潜在结构到L2中以帮助L2的学习文中对于语言的定义是比较宽泛的包括我们日常用的自然语言音乐代码等。因为每一种语言有着不同的潜在结构为探究不同L1对L2的影响本文主要围绕3个方面对L1发问当L1是non-linguistic语言时(比如music, Java code)语言模型是否可以学习其潜在结构并迁移到自然语言中?是否是L1中的递归结构对语言模型的学习和迁移有帮助当L1是与L2不同的自然语言时语言模型是否可以学习并迁移其中的句法结构为了回答这3个问题作者提出了一种叫做TILT (Test for Inductive Bias via Language Model Transfer)的测试方法。核心思想是先用L1语言预训练一个LSTM语言模型然后固定其参数直接在L2语言上测试其困惑度。通过改变L1固定L2来对比不同潜在结构对于自然语言学习的影响。结合文中的流程图更好理解(如下看图说话Q1: 怎么用语言模型训练Music数据呢A1: 关键是将乐谱转换为线性序列。文中使用了MAESTRO数据集包含了172个小时的经典的钢琴演奏曲。该数据集采用MIDI格式的音乐数据每个MIDI文件对应一个序列的音符的标注信息。因此一首曲子就可转换一个线性的序列这样子乐谱就可以愉快的和LSTM玩耍了~ 比如对于下面的mid文件[1]哈哈点不了哦~会被标注为音符3/4 c4 d8 f g16 a g f#, 然后传递给模型。Q2: 为什么②中LSTM的参数是固定的呢A2: 这是为了保留使用不同L1训练时所捕捉的潜在结构呀~固定LSTM的参数可以防止L2的自身结构信息被编码。因为最终是在同一个L2上进行测试的所以可以公平比较使用不同L1进行预训练对L2测试结果的影响啦。文中一个核心的观点是将不同L1中的潜在结构当成inductive bias, 并探究其是否可以被语言模型捕捉并迁移到L2上。Q3: 乐谱的词表和西班牙语的词表都不一样我要怎么在西语上测试呢A3: 这还不简单在测试前使用西语语料对embedding层进行fine-tune就可以了嘛上图③的功能。乐谱到底有没有用呢有没有用还得看怎么对比了~哈哈~先看看文中使用了4组不同的L1语言的例子那他们各自的实验结果如何呢首先来个直观的对比横轴是不同的L1语言预训练纵轴是在L2上测试的结果。music所在一列就是使用乐谱训练的结果啦。与左边的baseline相比提升十分显著困惑度几乎降低了一半。最左边两个草绿色的baseline是在西语上随机采样的词汇语料没有任何结构信息预训练得到的结果。但是music的效果并不如Jave code以及别的自然语言橙色。为了探究到底是music和Java code中的什么潜在结构提升了L2的性能呢作者猜测会不会是其中的层级递归结构呢但是在music和code上又不好直接验证。于是有了第三组实验来探究层级递归结构对L2的影响。作者伪造了两个括号数据配对的整数数据一个具有层级递归结构Nesting parents)一个没有递归结构但是有配对的标记对的信息Flat Parens)。可以看到他们俩给L2带来的性能提升几乎持平。那这是不是说明层级递归对L2没有多大用呢是的至少这篇文中的实验室设置下是的。但是作者说这也说明标记对的匹配预训练LSTM语言模型是有帮助的。他们甚至表现比用music的还好你说神奇不神奇。第四组实验使用不同的自然语言数据进行预训练可以看到他们的性能其实还是远远高于non-linguistic data的。(所以说其实标题或多或少有些噱头啦哈哈。) 同时也可以看到日语、英语、葡萄牙语对于西语的帮助差别也是比较大的 那这又是为什么呢作者认为是句法结构类型的差异性所导致的。因此为了探究不同自然语言L1对L2的影响作者使用句法特征将每种语言转化为句法特征向量从而计算各个语言之间的WALS-syntax distance即下图中的横轴。然后对比用不同语言预训练后在西语上测试得到的ppl下图纵轴。图中可以明显看到句法距离越相小的语言之间的句法结构迁移的效果更好。最后花椒还有个好奇的点。虽然文中的实验结果证明代码或者乐谱中的潜在对于LSTM语言模型的预训练是有帮助的但是他们的帮助还是没有在自然语言英语,意大利语带来的收益大那么如果我们用sequencial的pre-training 或者组合在每个L1上训练的语言模型会给L2带来更大的提升吗????总结论文读完啦咱们回答下开头的问题Non-linguistic数据中的潜在结构对于L2的学习有帮助嘛有帮助但没有不同自然语言L1带来的收益大。不过虽然music的帮助是所有实验中的L1中最小的不过本文对于不同模态语言的潜在结构的迁移的探索是个不错的方向。递归结构对于L2学习影响大嘛不大但是标记之间的配对结构对L2影响比较大。当L1是自然语言时语言模型可以编码并迁移其中的句法结构嘛可以而且其与L2的句法距离越接近句法结构的迁移性越好。这是一篇故事讲得很好且文笔十分好的文章感兴趣的小伙伴可以去读一读原文感受一下作者清晰而自洽的论述过程一步步发问一步步深入是一个非常享受的过程~[1] What is music21? http://web.mit.edu/music21/doc/about/what.html萌屋作者花椒。花椒性喜温良味辛麻而持久。目前在墨尔本大学NLP组读Ph.D.主要感兴趣方向包括常识问答知识图谱低资源知识迁移。期待有生之年可见证机器真正理解常识的时刻。知乎ID花椒后台回复关键词【入群】加入卖萌屋NLP/IR/Rec与求职讨论群有顶会审稿人、大厂研究员、知乎大V和妹纸等你来撩哦~
http://wiki.neutronadmin.com/news/104361/

相关文章:

  • 在网站上做宣传seo优质友链购买
  • 去哪找做网站的客户手机网站建设与制作
  • 耳机商城网站开发新乡网站开发的公司电话
  • 东莞市网站建设分站做网站怎么发展客户
  • 济南企业自助建站成都网站制作是什么
  • 怎样申请建立自助网站广州海珠网络营销外包
  • 网站建设哪家强中国三大水电建设基地
  • 黄浦区未成年人思想道德建设网站网站的功能设计
  • 房产怎么创建网站没有网站可以备案吗
  • 天猫网站建设的意义旅游必去的10个地方
  • 外贸网站优化软件网站链接网址怎么做
  • 集团网站建设价格软件开发工具的基本功能是什么
  • 旅游电子商务网站建设调查问卷旅游网站 分析
  • 西宁最好网站建设公司成功的网站必须具备的要素
  • 优易官方网站类似全民互推的推广平台
  • 用旧手机做网站东营招标信息网官网首页
  • 淄博制作网站的公司长沙知名网站建设
  • 建设工程的招标网站有哪些windows优化大师卸载
  • html5手机网站建设企业咨询公司名称大全
  • 百度百科让做网站的超链接吗做网站备案都需要什么东西
  • 银川怎么做网站百度知道问答首页
  • 做pc端网站新闻宜兴网站开发
  • 魔站网站开发网站 开发逻辑
  • 怎么用ps做网站首页字天堂网
  • 网站由哪儿三部分组成哪里有网站设计公司
  • 朝阳企业网站建设方案wordpress主题首页问题
  • 提升网站打开速度系统app定制开发
  • 做网站哪种编程语言最好网站弹窗怎么做
  • 17岁高清免费观看完整版网站的结构与布局优化设计
  • 如何拿网站后台账号推广小程序拿佣金