当前位置: 首页 > news >正文

南通市建设监理协会网站西安建站价格

南通市建设监理协会网站,西安建站价格,服务器 多wordpress,wordpress客户端linux文章目录 1. 理论介绍2. 实例解析2.1. 实例描述2.2. 代码实现 1. 理论介绍 通过对模型过拟合的思考#xff0c;人们希望能通过某种工具调整模型复杂度#xff0c;使其达到一个合适的平衡位置。权重衰减#xff08;又称 L 2 L_2 L2​正则化#xff09;通过为损失函数添加惩… 文章目录 1. 理论介绍2. 实例解析2.1. 实例描述2.2. 代码实现 1. 理论介绍 通过对模型过拟合的思考人们希望能通过某种工具调整模型复杂度使其达到一个合适的平衡位置。权重衰减又称 L 2 L_2 L2​正则化通过为损失函数添加惩罚项用来惩罚权重的 L 2 L_2 L2​范数从而限制模型参数值促使模型参数更加稀疏或更加集中进而调整模型的复杂度即 L ( w , b ) λ 2 ∥ w ∥ 2 L(\mathbf{w}, b) \frac{\lambda}{2} \|\mathbf{w}\|^2 L(w,b)2λ​∥w∥2其中 λ \lambda λ为权重衰减的超参数。 L p L_p Lp​范数 ∥ x ∥ p ( ∑ i 1 n ∣ x i ∣ p ) 1 / p \|\mathbf{x}\|_p \left(\sum_{i1}^n \left|x_i \right|^p \right)^{1/p} ∥x∥p​(i1∑n​∣xi​∣p)1/p 当 p 1 p1 p1时称为 L 1 L_1 L1​范数当 p 2 p2 p2时称为 L 2 L_2 L2​范数。 惩罚 L 1 L_1 L1​范数会导致模型将权重集中在一小部分特征上 而将其他权重清除为零 这称为特征选择惩罚 L 2 L_2 L2​范数会导致模型在大量特征上均匀分布权重使得模型对单个变量的观测误差更为稳定。通常不建议对偏置进行正则化因为偏置的取值并不像权值那样会随着训练过程而变化因此对偏置进行正则化对于控制模型的复杂度影响较小另外对偏置进行正则化可能会导致对数据中的偏移进行过度拟合而减弱了模型对其他特征的学习。 2. 实例解析 2.1. 实例描述 使用以下公式生成包含20个样本的小训练集和100个样本的测试集并用线性网络进行拟合 y 0.05 ∑ i 1 200 0.01 x i ϵ where  ϵ ∼ N ( 0 , 0.0 1 2 ) . y 0.05 \sum_{i 1}^{200} 0.01 x_i \epsilon \text{ where } \epsilon \sim \mathcal{N}(0, 0.01^2). y0.05i1∑200​0.01xi​ϵ where ϵ∼N(0,0.012). 2.2. 代码实现 主要代码 optimizer optim.SGD([{params: net.weight,weight_decay: weight_decay},{params: net.bias}], lrlr)完整代码 import os import torch from torch import nn, optim from torch.utils.data import TensorDataset, DataLoader from tensorboardX import SummaryWriter from rich.progress import trackdef data_generator(w, b, num):为线性模型生成数据X torch.randn(num, len(w))y torch.sum(X w, dim1) by torch.normal(0, 0.01, y.shape)return X, y.reshape(-1, 1)def load_dataset(*tensors):加载数据集dataset TensorDataset(*tensors)return DataLoader(dataset, batch_size, shuffleTrue)def evaluate_loss(dataloader, net, criterion):评估模型在指定数据集上的损失num_examples 0loss_sum 0.0with torch.no_grad():for X, y in dataloader:X, y X.cuda(), y.cuda()loss criterion(net(X), y)num_examples y.shape[0]loss_sum loss.sum()return loss_sum / num_examplesif __name__ __main__:# 全局参数设置lr 0.003num_epochs 100batch_size 5# 创建记录器def log_dir():root runsif not os.path.exists(root):os.mkdir(root)order len(os.listdir(root)) 1return f{root}/exp{order}writer SummaryWriter(log_dirlog_dir())# 合成数据集num_inputs 200n_train, n_test 20, 100true_w, true_b torch.ones((num_inputs, 1)) * 0.01, 0.05X, y data_generator(true_w, true_b, n_train n_test)# 加载数据集dataloader_train load_dataset(X[:n_train], y[:n_train])dataloader_test load_dataset(X[n_train:], y[n_train:])def loop(weight_decay):# 定义模型net nn.Linear(num_inputs, 1).cuda()nn.init.normal_(net.weight)nn.init.constant_(net.bias, 0)criterion nn.MSELoss(reductionnone)optimizer optim.SGD([{params: net.weight,weight_decay: weight_decay},{params: net.bias}], lrlr)# 训练循环for epoch in track(range(num_epochs), descriptionfwd{weight_decay}):for X, y in dataloader_train:X, y X.cuda(), y.cuda()loss criterion(net(X), y)optimizer.zero_grad()loss.mean().backward()optimizer.step()writer.add_scalars(fwd{weight_decay}, {train_loss: evaluate_loss(dataloader_train, net, criterion),test_loss: evaluate_loss(dataloader_test, net, criterion),}, epoch)for weight_decay in [0, 3]:loop(weight_decay)writer.close()输出结果 weight_decay 0 weight_decay 3
http://wiki.neutronadmin.com/news/205273/

相关文章:

  • html5网站修改潍坊 网站推广
  • 广东的网站备案自己创建网站怎么得流量钱
  • 公司想做个自己的网站怎么做电子商务网站建设的流程图
  • 南昌 提供网站设计 公司免费查询营业执照
  • 基础网站开发学设计哪个网站好
  • 怎么做一个电子商务网站关键词搜索查找工具
  • 专业网站建设最便宜做网销的一天都在干嘛
  • 做公众号链接的网站公司的做网站
  • 网站如何做子域名国企建筑公司有哪些
  • 趣闲赚seo是什么意思教程
  • 福建建设执业中心网站推荐佛山顺德网站建设
  • 网站基本设置还有哪些网站可以做淘宝活动
  • 网站推广话术wordpress页面内容
  • 深圳市住房和建设局网站公示应用公园制作的app归谁
  • 如何做招聘网站效果评估深圳华强北赛格大厦
  • 大连开发区社保网站书签图片
  • 网站设计内容京东慧采入驻条件及费用2022
  • 用rp怎样做网站精准信息预测
  • 辽宁建设工程质量监督站网站网站的排版好看
  • 东莞做网页建站公司国家工商官网查询
  • 有经验的做网站wordpress评论区插件
  • 做代码的网站深圳专业的网站制作公司
  • 海南做网站的公司logo制作app
  • 个人网站的制作方法个人营业执照网上申请入口官网
  • 开源 企业网站北京app开发定制公司
  • 试玩平台怎么做网站wordpress突然访问不了
  • 网站优化快速排名软件自动化培训机构排名
  • 深圳做二维码网站设计有哪些网站做二手房好的
  • 手机端网站html好看的单页模板wordpress分类目录下文章过多_添加文章目录导航
  • 深圳的网站建设公司 湖南岚鸿展馆设计费用取费标准