当前位置: 首页 > news >正文

html网站 怎么做seo永久免费个人域名注册

html网站 怎么做seo,永久免费个人域名注册,惠州品牌网站建设公司哪里有,wordpress tag搜索Transformer 比较了卷积神经网络#xff08;CNN#xff09;、循环神经网络#xff08;RNN#xff09;和自注意力#xff08;self-attention#xff09;。值得注意的是#xff0c;自注意力同时具有并行计算和最短的最大路径长度这两个优势。因此#xff0c;使用自注意力…Transformer 比较了卷积神经网络CNN、循环神经网络RNN和自注意力self-attention。值得注意的是自注意力同时具有并行计算和最短的最大路径长度这两个优势。因此使用自注意力来设计深度架构是很有吸引力的。对比之前仍然依赖循环神经网络实现输入表示的自注意力模Transformer模型完全基于注意力机制没有任何卷积层或循环神经网络层。尽管Transformer最初是应用于在文本数据上的序列到序列学习但现在已经推广到各种现代的深度学习中例如语言、视觉、语音和强化学习领域。 模型 Transformer作为编码器解码器架构的一个实例其整体架构图如下图展示。正如所见到的Transformer是由编码器和解码器组成的。与基于Bahdanau注意力实现的序列到序列的学习相比Transformer的编码器和解码器是基于自注意力的模块叠加而成的源输入序列和目标输出序列的嵌入embedding表示将加上位置编码positional encoding再分别输入到编码器和解码器中。 transformer架构  Transformer解码器也是由多个相同的层叠加而成的并且层中使用了残差连接和层规范化。除了编码器中描述的两个子层之外解码器还在这两个子层之间插入了第三个子层称为编码器解码器注意力encoder-decoder attention层。在编码器解码器注意力中查询来自前一个解码器层的输出而键和值来自整个编码器的输出。在解码器自注意力中查询、键和值都来自上一个解码器层的输出。但是解码器中的每个位置只能考虑该位置之前的所有位置。这种掩蔽masked注意力保留了自回归auto-regressive属性确保预测仅依赖于已生成的输出词元。 接下来将实现Transformer模型的剩余部分。 import math import warnings import pandas as pd from d2l import paddle as d2lwarnings.filterwarnings(ignore) import paddle from paddle import nn 基于位置的前馈网络 基于位置的前馈网络对序列中的所有位置的表示进行变换时使用的是同一个多层感知机MLP这就是称前馈网络是基于位置的positionwise的原因。在下面的实现中输入X的形状批量大小时间步数或序列长度隐单元数或特征维度将被一个两层的感知机转换成形状为批量大小时间步数ffn_num_outputs的输出张量。 #save class PositionWiseFFN(nn.Module):基于位置的前馈网络def __init__(self, ffn_num_input, ffn_num_hiddens, ffn_num_outputs,**kwargs):super(PositionWiseFFN, self).__init__(**kwargs)self.dense1 nn.Linear(ffn_num_input, ffn_num_hiddens)self.relu nn.ReLU()self.dense2 nn.Linear(ffn_num_hiddens, ffn_num_outputs)def forward(self, X):return self.dense2(self.relu(self.dense1(X))) 下面的例子显示改变张量的最里层维度的尺寸会改变成基于位置的前馈网络的输出尺寸。因为用同一个多层感知机对所有位置上的输入进行变换所以当所有这些位置的输入相同时它们的输出也是相同的。 ffn PositionWiseFFN(4, 4, 8) ffn.eval() ffn(torch.ones((2, 3, 4)))[0] tensor([[-0.8290, 1.0067, 0.3619, 0.3594, -0.5328, 0.2712, 0.7394, 0.0747],[-0.8290, 1.0067, 0.3619, 0.3594, -0.5328, 0.2712, 0.7394, 0.0747],[-0.8290, 1.0067, 0.3619, 0.3594, -0.5328, 0.2712, 0.7394, 0.0747]],grad_fnSelectBackward0)
http://www.yutouwan.com/news/79436/

相关文章:

  • 那个网站的详情做的好知名企业有哪些
  • 商务网站建设有哪几个步骤wordpress 数据库 类型
  • 商标设计网站猪八戒做网站要求的分辨率是什么意思
  • 长沙哪里有做网站的公司自己给别人做网站挣钱吗
  • 大连网站推广深圳专业做网站
  • 定制东莞网站制作公司如何做网站优化关键词优化
  • 网站建设及维护干什么的wordpress站群是什么
  • 广州做网站信息设计店名logo
  • 商业网站设计与制作论文外包加工项目
  • wordpress 网站工具栏电商平台的营销方式
  • 从建站到网络优化杭州电子网站建设方案
  • 漯河市源汇区建设局网站微动漫怎么制作
  • 网站开发证书要求兰州网站建设优化
  • 无锡商城网站建设wordpress设置密码访问带提示
  • 如何防止网站被注入黑链wordpress页面相册
  • 阿里巴巴网站备案号seo网站查询工具
  • 网站创建一般创建哪种类型做微商哪个网站比较好
  • 济南专业做网站的公司wordpress 怎么安全
  • 室内设计平面图怎么画镇江整站优化
  • wordpress插件写在模板里德兴网站seo
  • 百度seo公司整站优化软件做网站设计软件
  • 网站免费建站性盈盈影院金华在线制作网站
  • 同时做几个网站的seo个人注册登录入口
  • 石家庄哪家网站做的好如何在对方网站上做外链
  • 设置网站建设网站开发和编程有什么区别
  • 注册网站服务器做韩国网站有哪些
  • 阿里巴巴的网站二维码怎么做有哪些做的推文排版的网站
  • 网站 建设阶段wordpress去除顶部工具栏
  • 淄博网站建设详细策划wordpress网站 800cdn
  • 建设银行官方网站登录电脑版响应式网站建设特色