当前位置: 首页 > news >正文

网站制作公司网站源码国产免费crm系统有哪些在线

网站制作公司网站源码,国产免费crm系统有哪些在线,广告设计图片 门头,深圳做企业网站的公1.缺失值概要 数据的缺失主要包括记录的缺失和记录中某个字段信息的缺失#xff0c;两者都会造成分析结果的不准确#xff0c;以下从缺失值产生的原因及影响扥方面展开分析。 #xff08;1#xff09;缺失值产生的原因 1#xff09;有些信息暂时无法获取#xff0c;或…1.缺失值概要 数据的缺失主要包括记录的缺失和记录中某个字段信息的缺失两者都会造成分析结果的不准确以下从缺失值产生的原因及影响扥方面展开分析。 1缺失值产生的原因 1有些信息暂时无法获取或者获取信息的代价太大 2有些信息是被遗漏的。可能是因为输入时认为不重要、忘记填写或对数据理解错误等一些人为因素而遗漏也可能是由于数据采集设置的故障、存储介质的故障、传输媒体的故障灯非人为原因而丢失 3属性值不存在。在某些情况下缺失值并不意味着数据有错误。对一些对象来说某些属性是不存在的如一个未婚者的配偶姓名、一个儿童的固定收入等。 2缺失值的影响 1数据挖掘建模将丢失大量的有用信息 2数据挖掘模型所表现出的不确定性更加显著模型中蕴涵的规律更难把握。 3包含空值的数据会使建模过程陷入混乱导致不可靠的输出。 3缺失值的分析 使用简单的统计分析可以得到含有缺失值的属性的个数以及每个属性的未缺失数、缺失数与缺失率等。 从总体上来说缺失值的处理分为删除存在缺失值的记录、对可能值进行插补和不处理3种情况。 2.缺失值处理 import pandas as pd import numpy as np df pd.read_csv(data/table_missing.csv) #默认输出DataFrame的前5行 df.head() 1了解缺失数据 函数isna和notna方法 df[Physics].isna().head() df[Physics].notna().head() 统计每列每行的缺失情况 #统计每列的缺失 df.isna().sum()#或者df.isnull().sum() #统计每行的缺失 df.isna(axis0).sum()#或者df.isnull(axis0).sum() 挑出该列缺失值的行 df[df[Physics].isna()] 挑选出所有非缺失值的列 这里介绍了all和any的用法all是全部值any是至少有一个值 #all是全部非缺失值 df[df.notna().all(1)] #any至少有一个不是缺失值 df[df.notna().any(1)] 2三种缺失符号 anp.nan 它不等与任何东西甚至不等于自己¶ 在用equals函数比较时自动略过两侧全是np.nan的单元格 在numpy中的类型为浮点由此导致数据集读入时即使原来是整数的列只要有缺失值就会变为浮点型 对于布尔类型的列表如果是np.nan填充那么它的值会自动变为True而不是False但当修改一个布尔列表时会改变列表类型而不是赋值为True 在所有的表格读取后无论列是存放什么类型的数据默认的缺失值全为np.nan类型因此整型列转为浮点而字符由于无法转化为浮点因此只能归并为object类型O原来是浮点型的则类型不变。 bNone None比前者稍微好些至少它会等于自身 它的布尔值为False 修改布尔列表不会改变数据类型 在传入数值类型后会自动变为np.nan 只有当传入object类型是保持不动几乎可以认为除非人工命名None它基本不会自动出现在Pandas中 在使用equals函数时不会被略过因此下面的情况下返回False¶ cNaT NaT是针对时间序列的缺失值是Pandas的内置类型可以完全看做时序版本的np.nan与自己不等且使用equals是也会被跳过。 3Nullable类型与NA符号 aNullable整形 对于该种类型而言它与原来标记int上的符号区别在于首字母大写‘Int’好处在于缺失值的类型都被替换成统一的NA符号且不改变数据类型。 bNullable布尔  与Nullable整型一致且数据类型不会变成浮点型 cstring类型 为了区分开原本含糊不清的object类型它本质上也属于Nullable类型因为不会含有缺失而改变类型 与object类型的一点重要区别就在于在调用字符方法后string类型返回的是Nullable类型object则会根据缺失类型和数据类型而改变。 4NA的特性 a逻辑运算 只需看该逻辑运算的结果是否依赖pd.NA的取值如果依赖则结果还是NA如果不依赖则直接计算结果取值不明直接报错 b算术运算和比较运算 当出现pd.NA**0和1**pd.NA时结果为1其他情况为NA 5convert_dtypes方法 在读取数据时就把数据列转为Nullable是pandas1.0的新函数。 pd.read_csv(data/table_missing.csv).convert_dtypes().dtypes 3.缺失数据的运算与分组 a加号和乘号规则 使用加法时缺失值为0 使用乘法时缺失值为1 使用累计函数时缺失值自动略过 bgroupby方法中的缺失值 自动忽略为缺失值的组 df_g pd.DataFrame({one:[A,B,C,D,np.nan],two:np.random.randn(5)}) print(df_g) df_g.groupby(one).groups4.填充与剔除 afillna方法值填充与前后向填充methodsffill or bfill #值填充 df[Physics].fillna(missing).head() #前向填充 df[Physics].fillna(methodffill).head() #后向填充 df[Physics].fillna(methodbackfill).head() 指定列填充 df_f pd.DataFrame({A:[1,3,np.nan],B:[2,4,np.nan],C:[3,5,np.nan]}) #填充全部列 df_f.fillna(df_f.mean()) #填充A,B两列 df_f.fillna(df_f.mean()[[A,B]]) bdropna方法 axis参数是行或列的参数如果axis0则对应是每一行如果axis1,则对应没一列 how参数是可以选择all或者是any表示全为缺失去除或存在缺失去除 subset参数是在某一列范围中搜索缺失值 5.插值interpolation 常见的数据插补方法有 1线性插值 a与索引无关的线性插值 默认状态下interpolate会对缺失的值进行线性插值 s pd.Series([1,10,15,-5,-2,np.nan,np.nan,28]) s.interpolate() b与索引有关的线性插值 method中的index和time选项可以是插值线性地依赖索引即插值为索引的线性函数 s.interpolate(methodindex) 如果索引是时间那么可以按照时间长短插值。 s_t pd.Series([0,np.nan,10],index[pd.Timestamp(2012-05-01),pd.Timestamp(2012-05-07),pd.Timestamp(2012-06-03)]) #未按照time插值图1 s_t.interpolate() #按照time插值图2 s_t.interpolate(methodtime) 2高级插值方法 与线性插值相比较例如样条插值、多项式插值、阿基玛插值等可进一步学习。 ser pd.Series(np.arange(1, 10.1, .25) ** 2 np.random.randn(37)) missing np.array([4, 13, 14, 15, 16, 17, 18, 20, 29]) ser[missing] np.nan methods [linear, quadratic, cubic] df pd.DataFrame({m: ser.interpolate(methodm) for m in methods}) df.plot() 3interpolate的限制参数 alimit最多插入多少个s.interpolate(limit2) blimit_direction表示插值方向可选forwordbackwardboth默认前向s.interpolate(limit_directionbackward) climit_area表示插值区域可选insideoutside默认Nones.interpolate(limit_areainside) 练习题 1如何删除缺失值在25%以上的列 s.drop(s.columns[s.isna().sum()/s.shape[0]0.25],axis1)
http://wiki.neutronadmin.com/news/232221/

相关文章:

  • 手机自己制作表白网站网站制作多少费用
  • 有网站做点什么好去哪找做网站的人
  • 网站建设实施计划包括福建刚刚发生大事
  • 中国建设银行官网站陕西西安网站设计制作是什么
  • asp网站发布ftp排名优化网站seo排名
  • 自己的网站服务器北京网站建设首选小峰
  • 自建站外贸平台有哪些比较好全网品牌营销
  • 网站开发需要的学历手机网站功能
  • 做网站拉广告网络营销是什么的产生主要源于网络市场的复杂性
  • 炫酷表白网站在线制作ps怎么做网站横幅广告
  • 网站做动态图片大全共享虚拟主机 几个网站
  • 网站上线需要哪些步骤青岛网站运营
  • 帮人做ppt的网站wordpress文章阅读统计
  • 许昌网站优化科技信息网站系统建设方案
  • 深圳中高端网站建设怎么样京东商城网站建设策划书
  • 濮阳哪里做网站百度舆情系统
  • 建设工程月评打分网站做移动网站快速
  • wordpress 商务 主题wordpress分类目录优化
  • 建站平台的基础概念班级网站建设组织机构
  • 广州洲聚网站开发外贸局是做什么的工作
  • 北碚免费建站哪家做得好seo的含义
  • 唐山建网站公司浪花直播
  • 北京网站建设公司拟做排行网站
  • 网站建设实习收获企业网页设计
  • 佛山网站建设费用网站闭关保护怎么做
  • 用dw做的代码怎么放在网站上提供做网站企业
  • 品牌网站建设有哪些方面seo百度快照优化公司
  • 网站空间支持功能网站招工费怎么做会计分录
  • 宁波公司网站建设价格蚌埠市建设学校网站
  • 网站代码优化方案厦门在哪个网站做用工报备