当前位置: 首页 > news >正文

企业品牌推广网站全国公示信用信息系统

企业品牌推广网站,全国公示信用信息系统,网站建设与维护就业怎么样,门户网站建设工序文章目录 一、理论知识二、代码实现2.1从零开始实现2.2简洁实现 【相关总结】 主要解决过拟合 一、理论知识 1、使用均方范数作为硬性限制#xff08;不常用#xff09; 通过限制参数值的选择范围来控制模型容量 通常不限制偏移b 小的意味着更强的正则项 使用均方范数作为柔… 文章目录 一、理论知识二、代码实现2.1从零开始实现2.2简洁实现 【相关总结】 主要解决过拟合 一、理论知识 1、使用均方范数作为硬性限制不常用 通过限制参数值的选择范围来控制模型容量 通常不限制偏移b 小的意味着更强的正则项 使用均方范数作为柔性限制 对于每个都可以找到使得之前的目标函数等价于下面的 可以通过拉格朗日乘子来证明 超参数控制了正则项的重要程度 参数更新法则 总结 权重衰退通过L2正则项使得模型参数不会过大从而控制模型复杂度正则项权重是控制模型复杂度的超参数 二、代码实现 权重衰减是最广泛使用的正则化技术之一 1.首先人工生成数据 我们选择标签是关于输入的线性函数。 标签同时被均值为0标准差为0.01高斯噪声破坏。 为了使过拟合的效果更加明显我们可以将问题的维数增加到 并使用一个只包含20个样本的小训练集。 %matplotlib inline import torch from torch import nn from d2l import torch as d2ln_train, n_test, num_inputs, batch_size 20, 100, 200, 5 true_w, true_b torch.ones((num_inputs, 1)) * 0.01, 0.05 # print(torch.ones((num_inputs, 1))) # print(true_w) train_data d2l.synthetic_data(true_w, true_b, n_train) train_iter d2l.load_array(train_data, batch_size) # print(train_iter) test_data d2l.synthetic_data(true_w, true_b, n_test) test_iter d2l.load_array(test_data, batch_size, is_trainFalse)2.1从零开始实现 只需将的平方惩罚添加到原始目标函数中。 def init_params():w torch.normal(0, 1, size(num_inputs, 1), requires_gradTrue)b torch.zeros(1, requires_gradTrue)return [w,b]定义L2范数惩罚 def l2_penalty(w):return torch.sum(w.pow(2)) / 2定义训练代码 def train(lambd):w,b init_params()net, loss lambda X: d2l.linreg(X, w, b), d2l.squared_lossnum_epochs, lr 100, 0.003animator d2l.Animator(xlabelepochs, ylabelloss, yscalelog,xlim[5,num_epochs], legend[train, test])for epoch in range(num_epochs):for X, y in train_iter: # 增加了L2范数惩罚项 # 广播机制使l2_penalty(w)成为一个长度为torch_size的向量l loss(net(X), y) lambd * l2_penalty(w)l.sum().backward()d2l.sgd([w,b], lr, batch_size)if(epoch 1) % 5 0:animator.add(epoch 1, (d2l.evaluate_loss(net, train_iter, loss),d2l.evaluate_loss(net, test_iter, loss)))print(w的L2范数是,torch.norm(w).item())忽略正则化直接训练 用lambd 0禁用权重衰减 train(lambd0)w的L2范数是 13.702591896057129 使用权重衰退 train(lambd3)w的L2范数是 0.36873573064804077 2.2简洁实现 在实例化优化器时直接通过weight_decay指定weight decay超参数 def train_concise(wd):net nn.Sequential(nn.Linear(num_inputs, 1))for param in net.parameters():param.data.normal_()loss nn.MSELoss(reductionnone)num_epochs, lr 100, 0.003# 偏置参数没有衰减trainer torch.optim.SGD([{params:net[0].weight,weight_decay: wd},{params:net[0].bias}], lrlr)animator d2l.Animator(xlabelepochs, ylabelloss, yscalelog,xlim[5, num_epochs], legend[train, test])for epoch in range(num_epochs):for X, y in train_iter:trainer.zero_grad()l loss(net(X), y)l.mean().backward()trainer.step()if (epoch 1) % 5 0:animator.add(epoch 1,(d2l.evaluate_loss(net, train_iter, loss),d2l.evaluate_loss(net, test_iter, loss)))print(w的L2范数, net[0].weight.norm().item())train_concise(0)w的L2范数 12.619434356689453 train_concise(3)w的L2范数 0.3909929692745209 【相关总结】
http://wiki.neutronadmin.com/news/143077/

相关文章:

  • 旅游网站开发的意义一般网站隐蔽点么么进
  • 个人网站模板儿童网站微信认证
  • 校园网上超市网站建设响应式网站建设模板
  • 在网上做设计赚钱的网站网站改版技术要求
  • 江阴网站网站建设安徽省和住房建设厅网站
  • 临沧网站制作心理网站 模版
  • .net网站开发源码注释做流量任务的试用网站
  • 福州最好的网站建设公司上海网站建设营销
  • 做网站和app网站开发离线下载报表
  • 外贸电商网站建设公司名称变更网上核名怎么弄
  • 移动 网站 素材公司网站的专题策划
  • 西乡城建局网站广告案例的网站
  • 贵州省城乡与建设厅网站山东省城乡建设网站
  • 用手机做电影网站wordpress微商城主题
  • 看国外的视频用什么浏览器网站的优化方法
  • 网站建设都是需要什么软件wordpress正文底部版权声明
  • 北京怎样建设公司网站摄影网站参考文献
  • 哪些网站做外贸效果好帝国网站seo
  • seo站外优化最主要的是什么杭州市招投标网
  • 太原正规的网站制作wordpress翻頁
  • 专业网站设计怎么做什么平台发广告最有效
  • 网站设计要如何做支付功能wordpress增加中英文切换
  • 自己做的网页怎么上传到网站吗网件路由器为什么都是官翻
  • 做网站协议怎么签衡水网站联系电话
  • 专门做流程图的网站现在做网站用什么软件
  • 普通网站与营销型网站有什么区别电子商务网站开发项目设计报告
  • 阳江公司做网站uc下一页
  • 济源网站建设价格如何让网站被收录
  • 石家庄做网站网络公司北京十大建筑设计公司
  • 网站建设上如何提高市场竞争力福建网站建设价格