(14)Python_SimpleImputer缺失值处理
  pbXLT49GSI1r 2023年11月02日 63 0


前言
目前常用的SimpleImputer补全缺失值的策略有平均值,最大值,中值等,采用的方式transform, fit_transform,fill_value

导入包

from sklearn.impute import SimpleImputer
import numpy as np

transform(X)

#使用数据训练imp模型,按照原数据的内容对新数据的确实值进行补充
X = np.array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
X1 = np.array([[1, 2, np.nan],
[4, np.nan, 6],
[np.nan, 8, 9]])
imp = SimpleImputer(missing_values=np.nan, strategy='mean')
imp.fit(X)
print(imp.transform(X1))

fit_transform(X)

#根据缺失值的列剩余值的特点对缺失值进行补充,这里采用的是平均值
X1 = np.array([[1, 2, np.nan],
[4, np.nan, 6],
[np.nan, 8, 9]])
imp = SimpleImputer(missing_values=np.nan, strategy='mean')
print(imp.fit_transform(X1))

fill_value(x)

#将数据中某个值修改为指定值
X = np.array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])

imp = SimpleImputer(missing_values=1, strategy='constant', fill_value=199)
print(imp.fit_transform(X))

get_params()

专门用来查看SimpleImputer里面的参数情况

参考文献

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
pbXLT49GSI1r