当前位置: 首页 > news >正文

wordpress站点字体修改京东自营入驻流程及费用

wordpress站点字体修改,京东自营入驻流程及费用,万网,虎嗅模板 wordpress数据归一化与标准化 数据预处理是机器学习和数据分析中非常重要的一环#xff0c;它能够有效地提高模型的性能和准确度。在数据预处理的过程中#xff0c;数据归一化和标准化是两个常用的技术#xff0c;它们可以将数据转换成一定的标准形式#xff0c;有助于模型更好地学…数据归一化与标准化 数据预处理是机器学习和数据分析中非常重要的一环它能够有效地提高模型的性能和准确度。在数据预处理的过程中数据归一化和标准化是两个常用的技术它们可以将数据转换成一定的标准形式有助于模型更好地学习数据的分布和特征。 1. 数据归一化 数据归一化也称为最大-最小缩放是一种线性转换方法将原始数据缩放到一个特定的范围通常是[0, 1]。其转换公式如下 X n o r m X − X m i n X m a x − X m i n X_{norm} \frac{X - X_{min}}{X_{max} - X_{min}} Xnorm​Xmax​−Xmin​X−Xmin​​ 其中 X n o r m X_{norm} Xnorm​ 是归一化后的数据 X X X 是原始数据 X m i n X_{min} Xmin​ 和 X m a x X_{max} Xmax​ 分别是原始数据的最小值和最大值。 优点 消除量纲影响数据归一化可以消除原始数据的量纲影响确保所有特征在相同的范围内。这有助于避免某些特征对模型训练产生过大的影响导致模型过于依赖某个特征。加速模型收敛数据归一化可以使模型更快地收敛特别是对于基于梯度的优化算法如梯度下降算法。由于所有特征都在相同的尺度上模型能够更快地找到最优解。 缺点 异常值敏感数据归一化容易受到异常值的影响。如果原始数据中存在异常值它们的缩放范围可能会显著影响归一化结果导致大部分数据集中在较小的范围内。边界效应数据归一化会将最大值和最小值映射到[0, 1]之间当新数据落在比训练集中的最大/最小值还大或还小时会导致数据无法正确归一化。 2. 数据标准化 数据标准化也称为零-均值标准化是一种将原始数据转换成均值为0标准差为1的标准正态分布的方法。其转换公式如下 X s t d X − μ σ X_{std} \frac{X - \mu}{\sigma} Xstd​σX−μ​ 其中 X s t d X_{std} Xstd​ 是标准化后的数据 X X X 是原始数据 μ \mu μ 是原始数据的均值 σ \sigma σ 是原始数据的标准差。 优点 消除量纲影响数据标准化能够消除原始数据的量纲影响确保所有特征都具有相同的尺度有助于避免某些特征对模型训练产生过大的影响。减少异常值影响由于数据标准化是基于数据的均值和标准差进行缩放因此对于存在异常值的数据集标准化能够减少异常值对模型训练的影响。 缺点 信息损失数据标准化会改变原始数据的分布将其转换为均值为0方差为1的正态分布。这可能导致一定程度的信息损失尤其在一些需要保留原始数据分布信息的场景下可能影响模型表现。不适用于稀疏数据对于稀疏数据由于大部分元素为0计算得到的标准差可能为0从而导致无法进行标准化。 3. 实战项目与代码演示 在这个实战项目中我们将使用Python和scikit-learn库来演示数据归一化和标准化的应用。 import numpy as np from sklearn.datasets import load_iris from sklearn.preprocessing import MinMaxScaler, StandardScaler from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score# 加载数据集 iris load_iris() X, y iris.data, iris.target# 将数据集分为训练集和测试集 X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.2, random_state42)# 使用数据归一化 scaler MinMaxScaler() X_train_normalized scaler.fit_transform(X_train) X_test_normalized scaler.transform(X_test)# 使用数据标准化 std_scaler StandardScaler() X_train_standardized std_scaler.fit_transform(X_train) X_test_standardized std_scaler.transform(X_test)# 使用逻辑回归模型 model LogisticRegression()# 拟合归一化后的数据并预测 model.fit(X_train_normalized, y_train) y_pred_normalized model.predict(X_test_normalized) accuracy_normalized accuracy_score(y_test, y_pred_normalized)# 拟合标准化后的数据并预测 model.fit(X_train_standardized, y_train) y_pred_standardized model.predict(X_test_standardized) accuracy_standardized accuracy_score(y_test, y_pred_standardized)print(Accuracy with normalization:, accuracy_normalized) print(Accuracy with standardization:, accuracy_standardized)在这个实例中我们使用了鸢尾花数据集对特征进行了数据归一化和标准化并分别使用了逻辑回归模型进行了测试。 结论 数据归一化和标准化都是常用的数据预处理技术它们能够消除特征之间的量纲影响加速模型收敛提高模型性能。在实际应用中我们需要根据数据的具体情况选择适合的方法。对于异常值较多的数据集数据标准化可能更合适而对于稀疏数据数据归一化可能更为有效。在进行特征工程时应该尝试不同的预处理方法并结合模型的表现来做出最佳选择。
http://wiki.neutronadmin.com/news/129349/

相关文章:

  • 个人网站如何制作教程制作网页完整步骤手机版
  • 建网站挣钱吗外贸网站建设价格怎么样
  • 专业做网站优化价格东莞市住建局局长
  • 免费创建网站平台有哪些自己做装修网站
  • 做调研用到的大数据网站制作网站哪家服务好
  • 烟台智能建站模板网站建设审核需要多长时间
  • 莱芜0634技术支持 宿州网站建设性价比高柳州网站建设
  • 高校网站建设的目的和意义扬州市做网站
  • 网站内容建设的原则是什么意思网站语言切换功能如何做
  • 怎样提高网站点击率设计logo 费用
  • wordpress网站go.php跳转有数据库的网站
  • 自己电脑做网站服务器系统网站建设欧美风格
  • 公司云网站建设百度服务商
  • 如何规划企业网站2021没封的网站有人分享吗
  • 何苦做游戏网站公司名字大全列表
  • 建设工程质量检测网站多用户自助建站系统源码
  • 全球访问量最大的网站自建网站系统
  • 河北住房和城乡建设局网站首页法语网站建设
  • 网站租房做公寓企业信息管理系统源码
  • 佛山市研发网站建设哪家好温州百度关键词搜索
  • 百度权重是怎么来的搜索引擎优化的内容包括
  • 国内炫酷网站设计成免费crm是什么
  • 工程设计东莞网站建设技术支持自适应wordpress模板
  • 电子商务网站建设移动电商开发网页设计专业服务公司
  • 网站创意模板网站页面由什么构成
  • wordpress大型站点做国际贸易都用什么网站
  • 关于申请建设网站申请报告药监局网站建设方案
  • 个人代运营一般怎么收费合肥网站建设 乐云seo
  • 江苏艺居建设有限公司网站郑州工装定制厂家哪家好
  • 网站开发前端与后端区别揭阳网站制作费用