当前位置: 首页 > news >正文

网站手机端排名软件四川省住房与城乡建设厅网站官网

网站手机端排名软件,四川省住房与城乡建设厅网站官网,wordpress国外模板下载,网页设计与制作作业成品免费文章目录 1. 理论介绍2. 实例解析2.1. 实例描述2.2. 代码实现 1. 理论介绍 通过对模型过拟合的思考#xff0c;人们希望能通过某种工具调整模型复杂度#xff0c;使其达到一个合适的平衡位置。权重衰减#xff08;又称 L 2 L_2 L2​正则化#xff09;通过为损失函数添加惩… 文章目录 1. 理论介绍2. 实例解析2.1. 实例描述2.2. 代码实现 1. 理论介绍 通过对模型过拟合的思考人们希望能通过某种工具调整模型复杂度使其达到一个合适的平衡位置。权重衰减又称 L 2 L_2 L2​正则化通过为损失函数添加惩罚项用来惩罚权重的 L 2 L_2 L2​范数从而限制模型参数值促使模型参数更加稀疏或更加集中进而调整模型的复杂度即 L ( w , b ) λ 2 ∥ w ∥ 2 L(\mathbf{w}, b) \frac{\lambda}{2} \|\mathbf{w}\|^2 L(w,b)2λ​∥w∥2其中 λ \lambda λ为权重衰减的超参数。 L p L_p Lp​范数 ∥ x ∥ p ( ∑ i 1 n ∣ x i ∣ p ) 1 / p \|\mathbf{x}\|_p \left(\sum_{i1}^n \left|x_i \right|^p \right)^{1/p} ∥x∥p​(i1∑n​∣xi​∣p)1/p 当 p 1 p1 p1时称为 L 1 L_1 L1​范数当 p 2 p2 p2时称为 L 2 L_2 L2​范数。 惩罚 L 1 L_1 L1​范数会导致模型将权重集中在一小部分特征上 而将其他权重清除为零 这称为特征选择惩罚 L 2 L_2 L2​范数会导致模型在大量特征上均匀分布权重使得模型对单个变量的观测误差更为稳定。通常不建议对偏置进行正则化因为偏置的取值并不像权值那样会随着训练过程而变化因此对偏置进行正则化对于控制模型的复杂度影响较小另外对偏置进行正则化可能会导致对数据中的偏移进行过度拟合而减弱了模型对其他特征的学习。 2. 实例解析 2.1. 实例描述 使用以下公式生成包含20个样本的小训练集和100个样本的测试集并用线性网络进行拟合 y 0.05 ∑ i 1 200 0.01 x i ϵ where  ϵ ∼ N ( 0 , 0.0 1 2 ) . y 0.05 \sum_{i 1}^{200} 0.01 x_i \epsilon \text{ where } \epsilon \sim \mathcal{N}(0, 0.01^2). y0.05i1∑200​0.01xi​ϵ where ϵ∼N(0,0.012). 2.2. 代码实现 主要代码 optimizer optim.SGD([{params: net.weight,weight_decay: weight_decay},{params: net.bias}], lrlr)完整代码 import os import torch from torch import nn, optim from torch.utils.data import TensorDataset, DataLoader from tensorboardX import SummaryWriter from rich.progress import trackdef data_generator(w, b, num):为线性模型生成数据X torch.randn(num, len(w))y torch.sum(X w, dim1) by torch.normal(0, 0.01, y.shape)return X, y.reshape(-1, 1)def load_dataset(*tensors):加载数据集dataset TensorDataset(*tensors)return DataLoader(dataset, batch_size, shuffleTrue)def evaluate_loss(dataloader, net, criterion):评估模型在指定数据集上的损失num_examples 0loss_sum 0.0with torch.no_grad():for X, y in dataloader:X, y X.cuda(), y.cuda()loss criterion(net(X), y)num_examples y.shape[0]loss_sum loss.sum()return loss_sum / num_examplesif __name__ __main__:# 全局参数设置lr 0.003num_epochs 100batch_size 5# 创建记录器def log_dir():root runsif not os.path.exists(root):os.mkdir(root)order len(os.listdir(root)) 1return f{root}/exp{order}writer SummaryWriter(log_dirlog_dir())# 合成数据集num_inputs 200n_train, n_test 20, 100true_w, true_b torch.ones((num_inputs, 1)) * 0.01, 0.05X, y data_generator(true_w, true_b, n_train n_test)# 加载数据集dataloader_train load_dataset(X[:n_train], y[:n_train])dataloader_test load_dataset(X[n_train:], y[n_train:])def loop(weight_decay):# 定义模型net nn.Linear(num_inputs, 1).cuda()nn.init.normal_(net.weight)nn.init.constant_(net.bias, 0)criterion nn.MSELoss(reductionnone)optimizer optim.SGD([{params: net.weight,weight_decay: weight_decay},{params: net.bias}], lrlr)# 训练循环for epoch in track(range(num_epochs), descriptionfwd{weight_decay}):for X, y in dataloader_train:X, y X.cuda(), y.cuda()loss criterion(net(X), y)optimizer.zero_grad()loss.mean().backward()optimizer.step()writer.add_scalars(fwd{weight_decay}, {train_loss: evaluate_loss(dataloader_train, net, criterion),test_loss: evaluate_loss(dataloader_test, net, criterion),}, epoch)for weight_decay in [0, 3]:loop(weight_decay)writer.close()输出结果 weight_decay 0 weight_decay 3
http://wiki.neutronadmin.com/news/92139/

相关文章:

  • 泉州网站建设企业物联网的含义是什么意思
  • 响应式网站建设服务提供商360如何做网站优化
  • wordpress视频播放卡石家庄seo结算
  • 学校网站建设培训心得专业公司网站 南通
  • 网站更改指定字段企业网站不足
  • dw怎么做别人可以看的网站市场调研报告500字
  • 做网站的市场细分免费的网站模版
  • 网站建设手机版模板贵阳公司网站建设
  • 专业做俄语网站建设荣耀手机价格表大全一览
  • 公司网站横幅是做的吗wordpress twenty ten
  • 网站设计欣赏网络营销做得好的企业
  • wordpress网站怎么进去全球购海外商城官网
  • 深泽网站制作餐饮网站建设怎样
  • 新闻静态网站咋做热点新闻
  • 微信php网站开发流程公司常见八大职能部门
  • 用rp做网站不用写前段代码软装设计师证
  • 澧县网站设计网站建站卖首饰侵权
  • 域名注册后能开始建设网站吗企业wordpress
  • 网站通栏广告素材seo快速优化
  • 专业南京网站建设网站主页排版
  • 建设工程交易中心网站收费标准seo是哪里
  • 个人网站能允许做哪些程序员做的简单的网站
  • 东源建设局网站中国工业设计在线官网
  • 设计师常用网站模板做的网站如何下载
  • 北京做百度网站提供营销型网站设计
  • 国内建网站多少钱素材网站pinterest
  • 作品集模板网站网站建设费钱吗
  • 无锡网站建设楚天软件网站推广宣传
  • 视频制作软件排行榜上海单个关键词优化
  • 北京中邦亚通网站公众号的制作方法和步骤