当前位置: 首页 > news >正文

深圳营销型网站百度收录网站技巧

深圳营销型网站,百度收录网站技巧,清原招聘网站建设,外贸企业网站改版传统的预训练方法存在一些问题#xff0c;如单向语言模型的局限性和无法处理双向上下文的限制。为了解决这些问题#xff0c;一种新的预训练方法随即被提出#xff0c;即BERT#xff08;Bidirectional Encoder Representations from Transformers#xff09;。通过在大规模…传统的预训练方法存在一些问题如单向语言模型的局限性和无法处理双向上下文的限制。为了解决这些问题一种新的预训练方法随即被提出即BERTBidirectional Encoder Representations from Transformers。通过在大规模无标签数据上进行预训练BERT可以学习到丰富的语言表示从而在各种下游任务上取得优秀的性能。 BERT与之前的语言表示模型不同BERT的设计目标是通过在所有层中联合考虑左右上下文从无标签文本中预训练深度双向表示。因此预训练的BERT模型只需添加一个额外的输出层就可以用于各种任务如问答和语言推理而无需进行大量的任务特定架构修改。BERT在概念上简单而实证强大它在包括自然语言处理任务在内的十一个任务上取得了新的最先进结果。 一.输入形式 为了使得BERT模型适应下游的任务比如说分类任务以及句子关系QA的任务输入将被改造成[CLS]句子A[SEP]句子B[SEP] 其中 1.[CLS]: 代表的是分类任务的特殊token它的输出就是模型的pooler output。 2.[SEP]分隔符。 3.句子A以及句子B是模型的输入文本其中句子B可以为空则输入变为[CLS]句子A。 在BERT中输入的向量是由三种不同的embedding求和而成在以下所举的例子中每个单词都表示为一个768维的向量。具体形式如下图 分别是Token嵌入层Segment嵌入层和Position嵌入层以下是对其介绍 token嵌入层的作用是将单词转换为固定维的向量表示形式。在将输入文本传递到token嵌入层之前首先对其进行token化。tokens化是使用一种叫做WordPiecetoken化的方法来完成的。这是一种数据驱动的token化方法旨在实现词汇量和非词汇量之间的平衡。token嵌入层将每个wordpiece token转换为指定的高维向量表示形式。 Segment嵌入层的作用是标记相同句子的每个词以区分不同的句子假设我们的输入文本对是(“I like cats”, “I like dogs”)则Segment的标记过程如下图 Position嵌入层的作用为允许BERT理解给定的输入文本。例如语句“I think, therefore I am”第一个I和第二个I不应该用同一向量表示。假设BERT被设计用来处理长度为512的输入序列。作者通过让BERT学习每个位置的向量表示来包含输入序列的顺序特征。这意味着Position嵌入层是一个大小为(512,768)的查找表其中第一行是第一个位置上的任意单词的向量表示第二行是第二个位置上的任意单词的向量表示等等。因此如果我们输入“Hello world”和“Hi there”“Hello”和“Hi”将具有相同的Position嵌入因为它们是输入序列中的第一个单词。同样“world”和“there”的Position嵌入是相同的。 故综上可得出长度为n的token化输入序列将有三种不同的表示即 1.token嵌入形状(1,n, 768)这只是词的向量表示 2.Segment嵌入形状(1,n, 768)这是向量表示以帮助BERT区分成对的输入序列。 3.Position嵌入形状(1,n, 768)让BERT知道其输入具有时间属性。 对这些表示进行元素求和生成一个形状为(1,n, 768)的单一表示。这是传递给BERT的编码器层的输入表示。
http://wiki.neutronadmin.com/news/293749/

相关文章:

  • 国内好的企业网站唐山乾正建设工程材料检测公司网站
  • 网站建设 的销售图片网站建设新闻 常识
  • 郑州网站建设贝斯特做外贸电商网站有哪个
  • 网站建设中是因为没有ftp上传吗手机派网站
  • 滴滴出行网站建设wordpress本地播放器
  • 网站空间计算wordpress适应大数据
  • 小学学校网站模板旅游网站建设方案预算
  • 网站编辑能在家做怎么做网站劳务中介
  • 做防腐木花架的网站网站备案没座机
  • 新余+网站建设全自动在线网页制作
  • 能上国外网站的dns电脑优化大师
  • win10做网站设计网站都有什么作用是什么原因
  • 正规货源网站大全竞价推广培训课程
  • 建设银行春招报名网站app开发费用一览表
  • 扬州市江都区城乡建设局网站深圳高端人力资源公司
  • seo网站优化公司微信开发页面
  • 简述网站的推广策略建网站公司公司
  • 网站建设预期周期始兴建设局网站
  • 阿里云怎样做商城式网站如何做网站窗口
  • 静态网站模板动漫电影做英语教学视频网站有哪些
  • 方便做流程图的网站wordpress修改页面样式
  • 找人做网站会不会被偷西宁啥时候恢复正常
  • 武义县建设局网站首页网站建设完成后如何备案
  • asp网站如何做伪静态wordpress子主题如何制作
  • 更改网站伪静态定制网站收费
  • 元隆盛建设集团有限公司网站扶沟县建设局网站
  • 网站建设合同要上印花税吗设计师推荐
  • 哪些网站是用wordpress搭建的wordpress自定义字段位置
  • 网站名字重复上海租房网个人房源
  • 网站建设的结构设计学做网站课程