当前位置: 首页 > news >正文

凉山网站建设商务网站建设数据处理

凉山网站建设,商务网站建设数据处理,德庆网站建设公司,有域名之后怎么自己做网站1 前言 当我们使用一个线性回归模型时#xff0c;通常这个模型是在很大假设的前提下才有一个很好的结果#xff1a; 1、假设预测因子和预测目标之间的关系是线性的2、数据不存在外在噪声#xff1a;不存在一些极端的数据3、非共线性#xff08; collinearity#xff09;…1 前言 当我们使用一个线性回归模型时通常这个模型是在很大假设的前提下才有一个很好的结果 1、假设预测因子和预测目标之间的关系是线性的2、数据不存在外在噪声不存在一些极端的数据3、非共线性 collinearity如果你的预测因子和预测目标之间高相关可能会发生过拟合4、正态分布如果预测因子和目标变量是正态分布则可以进行更可靠的预测5、尺度因为它是一个基于距离的算法所以预测因子应该进行归一化使得在相关的量纲或者量级上 其中对于第四点说明了数据应该符合一个高斯分布如下所示 可能你使用的数据并不是一个完美的高斯分布也无法处理为一个完美的高斯分布但是并不意味着你不去尝试下面介绍如何处理偏态数据。 什么是偏态数据 偏态数据当数据的分布曲线不对称时(与完全对称的正态分布曲线相比)。数据中有两种不同类型的偏态左(负)或右(正)偏。 给个降水数据的一般分布情况 2 偏态数据的影响 降低模型(特别是基于回归的模型)描述典型case的能力因为它必须处理极端值的罕见case。也就是说右偏的数据在低值上的预测结果比在高值上的预测结果更好。偏态的数据也不适用于许多统计方法。但是基于tree的模型不受影响。 为了避免机器学习模型的能力不被影响应该对偏态数据进行处理处理为一个近似标准正态分布处理的方法取决于数据的特征。 3 处理偏态数据的方法 3.1 log转换 可能是第一种应该尝试的方法来去除偏态分布 y np.log1p(y)这个实际上就是log(1x),这个对于降水数据的去偏还是挺不错的 注意无法转换0或负值(为所有值添加常数以确保值 1) 3.2 剔除极端值 对于降水数据不太适合因为降水数据本身就是大部分为晴天异常降水是少部分是典型的右偏数据类型。 3.3 最大最小正态化 3.4 立方根转换 当值太大时可以做一个立方根 可以应用于负值 具体没有试过感觉对于降水数据不适用 3.5 平方根转换 y np.sqrt(y)不适用于包含负值的数据 3.6 倒数转换 3.7 平方转换 适用于左偏数据分布 3.8 Box Cox transformation scipy已经封装好了可以之间调用. 而且这个方法和log转换差不多也并不复杂 from scipy import stats y stats.boxcox(y)基于下面的方程进行转换只适用于正值 当包含负值时可以使用以下的方程 3.9 对于预测目标的变量进行重采样 undersamplingoversamplingSMOTE 本质上没有解决模型对于偏态数据的学习处理能力 总结 总的来说对于降水这种偏态分布的数据来说使用log转换和box cox转换都是有作用且存在必要的的。 引用 1、 https://www.e-education.psu.edu/meteo810/content/l5_p5.html 2、 https://www.mdpi.com/2076-3417/10/18/6247 Handling Skewed Data: A Comparison of Two Popular Methods 3、 https://www.sciencedirect.com/science/article/abs/pii/S0022169423002895 A comprehensive implementation of the log, Box-Cox and log-sinh transformations for skewed and censored precipitation data 4、 https://stats.stackexchange.com/questions/47698/kriging-on-log-transformed-rainfall-data 5、 https://www.researchgate.net/publication/239792614_RAINBOW-A_software_package_for_hydro_meteorological_frequency_analysis_and_testing_the_homogeneity_of_historical_data_sets 6、 https://blogs.ubc.ca/colinmahony/2014/10/17/should-precipitation-variables-be-transformed-prior-to-pca/ Should precipitation variables be transformed prior to PCA? 7、 https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4120293/ Log-transformation and its implications for data analysis 8、 https://agupubs.onlinelibrary.wiley.com/doi/full/10.1029/2020GL089794 Skewness of Temperature Data Implies an Abrupt Change in the Climate System Between 1985 and 1991 9、 https://journals.physiology.org/doi/full/10.1152/advan.00018.2018 Explorations in statistics: the log transformation
http://wiki.neutronadmin.com/news/121111/

相关文章:

  • 呼市网站开发淘宝分销平台
  • 江门网站制作流程包头seo哪家专业
  • 万网网站模板购买石家庄最新状况
  • 律师微网站制作整站seo怎么做
  • 响应式网站的登录设置wordpress 最新
  • 网站集约化建设会议请示网站关键词描述
  • 一个网站可以有几个域名饮食网站模板
  • 杭州的网站设计个人简历模板免费下载网站
  • 高端网站开发培训wordpress中文手册pdf
  • 个人网站导航html源码福州模板建站哪家好
  • 百度建立网站需要花多少钱安阳网站建设_
  • 孝义网站开发wordpress 图片边框
  • 网站建设及上线流程做宣传网站需要多少钱
  • 网站出现搜索做博客网站什么空间好
  • 做分子生物实验常用网站seo自学网视频教程
  • 著名网站有哪些备案 增加网站
  • 企业网站最重要的访问对象是航达建设集团有限公司网站
  • 哪个网站可以做担保交易平台wordpress搜索小工具
  • 中国站长之家爱站网.net网站开发书
  • 网站改版报告订阅号可以做网站吗
  • 太原做网站公司哪家好优舟网站建设
  • 大连市房屋管理局官方网站大连旅顺旅游攻略
  • 用asp.net开发网站的优势合肥本地建网站
  • 艺术品电商网站开发北京丰台区做网站公司
  • 网站建设企业服务商北京营销型网站建站公司
  • 重庆免费网站建站模板事件营销的案例
  • 嘉兴网站制作案例荥阳做公司网站的公司
  • 个人建网站网站开发相关专业
  • 营销型网站商城国外网站域名
  • 福建鞋子做淘宝图片网站公司做网站可以用个人域名