当前位置: 首页 > news >正文

百度站长工具网站提交网站关键词密度过高

百度站长工具网站提交,网站关键词密度过高,学校网站建设新闻,福州到泉州文章目录 一、机器学习是什么#xff1f;二、模型训练YouTube流量预测1. 先写一个具有未知参数的函数#xff08;Function#xff09;2. 定义损失#xff08;从训练数据进行计算#xff09;3.最优化4.结果分析 Back to framework1.带有未知数的函数#xff1a;2.定义损失… 文章目录 一、机器学习是什么二、模型训练YouTube流量预测1. 先写一个具有未知参数的函数Function2. 定义损失从训练数据进行计算3.最优化4.结果分析 Back to framework1.带有未知数的函数2.定义损失从训练数据进行计算3. 最优化4.[激活函数](https://blog.csdn.net/weixin_39910711/article/details/114849349)5.继续改我们的模型 三、Neural Network 一、机器学习是什么 机器学习≈找一个函数 这个函数不是人能容易的找出来需要借助机器的力量。 不同的函数 回归Regression:函数输出一个标量。eg.对PM2.5的预测 分类Classification:给定选项(类)函数输出正确的选项。eg1二分类.是否为垃圾邮件 eg2多分类.下围棋 二、模型训练 训练 先写一个具有未知参数的函数Function定义损失从训练数据进行计算最优化 YouTube流量预测 有没有可能找一个函数输入是这个频道后台的数据输出隔天的总点阅率 机器学习找这个函数分为三个过程以 YouTube流量预测为例。 1. 先写一个具有未知参数的函数Function 先猜测函数的类型 2. 定义损失从训练数据进行计算 损失是一个关于参数的函数 函数输入的值代表这一组参数设定某一组数值这个数值是好还是不好。 同样的方法我们可以算出三年来每一天的预测误差。 接下来我们把三年的误差求平均。 L越小参数设置越好越大越不好。 计算误差有很多方式根据需求选取。 如果真实值与预测值是概率分布可能选择交叉熵损失。 误差曲面 3.最优化 找一组参数是的L最小 为此我们使用梯度下降gradient decent 简化过程一个参数的gradient decent 随机选取初始点 w 0 w_0 w0​计算 ∂ L ∂ w ∣ w w 0 \frac{\partial L}{\partial w}|_{ww_0} ∂w∂L​∣ww0​​。就是看左右哪边高向低的跨步 若求出为负值左高右低的切线增大wloss就变小若求出为正值左低右高的切线减小wloss就变大。 步子跨多大取决于1.斜率斜率大就跨大一点2学习率自己设定的更新迭代w 当 ∂ L ∂ w ∣ w w 0 \frac{\partial L}{\partial w}|_{ww_0} ∂w∂L​∣ww0​​计算为0就不在更新了。 有可能梯度下降会陷入局部最优 局部最小值真的会导致问题吗后面会说gradient decent的真正痛点 两个参数的gradient decent 随机选取初始点 w 0 b 0 w_0b_0 w0​b0​计算 ∂ L ∂ w ∣ w w 0 b b 0 ∂ L ∂ b ∣ w w 0 , b b 0 \frac{\partial L}{\partial w}|_{ww_0bb_0}\frac{\partial L}{\partial b}|_{ww_0, bb_0} ∂w∂L​∣ww0​bb0​​∂b∂L​∣ww0​,bb0​​。就是看左右哪边高向低的跨步 若求出为负值左高右低的切线增大wloss就变小若求出为正值左低右高的切线减小wloss就变大。 步子跨多大取决于1.斜率斜率大就跨大一点2学习率自己设定的更新迭代w 在深度学习中微分应该怎么算 ---- 程序会自己算 4.结果分析 能否做的更好 从图中看出7天一个循环。我们分别考虑2017-2020的前1、7、18、56天对2021年的某一天的影响。我们采用的是Linear Model。 线性模型太简单了… 我们需要更复杂的模式。 线性模型具有严重的局限性。模型偏差我们需要一个更灵活的模式! 所有分段的线性曲线可以可以由常数与一系列蓝色Function组成。 转折越多越复杂需要的蓝色Function就越多。 如果不是分段曲线而是连续曲线我们可以使用分段线性曲线去逼近。 如何表示蓝色的Function呢 我们可以使用 y c 1 1 e − ( b w 1 x ) yc\frac{1}{1e^{-(bw_1x)}} yc1e−(bw1​x)1​: Sigmoid Function(S型曲线: y c ∗ s i g m o i d ( b w 1 x ) c 1 1 e − ( b w 1 x ) y c*sigmoid(bw_1x) c\frac{1}{1e^{-(bw_1x)}} yc∗sigmoid(bw1​x)c1e−(bw1​x)1​ w改变斜率、b曲线左右移动、c改变他的高度 新的模型有更多的特征 我们把它画出来直观 x 1 , x 2 , x 3 x_1,x_2,x_3 x1​,x2​,x3​与 r 1 , r 2 , r 3 r_1,r_2,r_3 r1​,r2​,r3​的关系我们可以用矩阵表示出来 Back to framework 1.带有未知数的函数 特征与参数 2.定义损失从训练数据进行计算 Loss是参数的函数 L ( θ ) L(\theta) L(θ) Loss意味着一套参数值有多好 3. 最优化 随机选取初始点 θ 0 \theta_0 θ0​计算微分 就是看左右哪边高向低的跨步 若求出为负值左高右低的切线增大wloss就变小若求出为正值左低右高的切线减小wloss就变大。 更新迭代w 步子跨多大取决于1.斜率斜率大就跨大一点2学习率自己设定的 直到你不想做了或计算出的gradient为零向量。 实际做gradient decent N的数据分成多个Batch计算loss更新参数。 为什么Hard Sigmoid 要换成Soft Sigmoid Hard Sigmoid 表示 ReLU函数 从ReLU到Sigmoid2个ReLU合成Sigmoid 4.激活函数 5.继续改我们的模型 机器02/14左右高估了因为除夕。 三、Neural Network 那这个 Sigmoid 或是 ReLU,它们在机器学习里面叫做 Activation Function 激活函数。 这些Sigmoid 或 ReLU ,它们叫做 Neuron 神经元。我们这边有很多的 Neuron,很多的 Neuron 就叫做 Neural Network。 每一排neourn叫做hidden layer许多layer就叫做Deep Learning。 为什么不做的更深呢 会过拟合即在训练资料上变好在没训练的资料上变差 预测未知资料
http://wiki.neutronadmin.com/news/415449/

相关文章:

  • 不建议网站如何购买网站域名
  • 平凉崆峒建设局网站北京做网站价格
  • 南沙定制型网站建设ftp上传网站之后怎么做
  • 加强门户网站建设与管理办法百度网址大全免费下载
  • 邮箱注册网站申请wordpress文章不能添加标签
  • 网站建设开发兴田德润seo是免费推广吗?
  • 泉州建设人才网站如何推销自己的产品
  • 广州做网站多wordpress 虎嗅2016
  • 网页设计跟网站建设的区别中国城乡建设厅网站首页
  • 查看网站开发商工业设计公司宣传语
  • 宿迁宿豫网站建设视频制作表情包
  • 如何分析网站竞争对手徐州领航装饰工程有限公司
  • 百度电脑版登录网站冯耀宗seo课程
  • 苏州建网站用路由器建设网站
  • 建立自己的网站费用长沙百度百科
  • 校园网网站建设黑龙江网站建设
  • 上海免费网站建设模板推荐判断网站的好坏
  • 装饰公司怎么做网站河南建达工程建设监理公司网站
  • 顺德网站开发网站建设规划面试技巧
  • 永城城乡建设局网站网站怎么做镜像
  • 电商网站设计系统阳江市新增确诊病例
  • 桂林北站防疫电话营销网站的建设流程
  • 昆山网站建设书生商友二级网站怎么建
  • 英文网站域名注册刚做的网站为什么搜索不到
  • 钓鱼转转网站在线生成软件东莞做一个企业网站
  • 青岛公司建设网站移动惠生活app下载网址
  • 大同网站建设熊掌号wordpress腾讯cos
  • 网站开发 上海wordpress可以自动采集吗
  • 有用cc域名做网站的福建网站开发公司电话
  • 怎么引导做淘宝的客户做官方网站网站架构师工资