Python缺失值处理

在许多业务数据分析场景中，数据不一定十分完整，总是存在部分缺失值，因此，数据清洗阶段，对缺失值进行处理就显得尤为重要。本文介绍一些缺失值处理的示例，主要用到的库有：pandas、numpy 、sklearn。

工具/原料

python

方法/步骤

导入需要的库。import pandas as pdimport numpy as npfrom sklearn.preprocessing import Imputer

生成缺失数据。data=pd.DataFrame({'name':['Kite','Lily','Hanmei','Danny','Bob'],'English':[92,78,np.nan,23,82],'Math':[69,87,91,np.nan,90],'Chinese':[np.nan,78,96,np.nan,75]})print(data)

查看缺失值。data.isnull()#查看所有缺失值data.isnull().any()#获取含有缺失值的列data.isnull().all()#获取全部为NA的列

删除缺失值。这种处理方式丢失的信息比较多。data2=data.dropna()print(data2)可以看到，删除后，仅剩两行数据。

利用sklearn替换缺失值。当缺失值为数值型数据时，可用利用均值来替换。data.index=data['name']#将第一列作为索引data=data.drop(['name'],axis=1)#删除第一列nan_model=Imputer(missing_values='NaN',strategy='mean',axis=0)#按照行均值替换对应缺失值。nan_result=nan_model.fit_transform(data)print(nan_result)

利用pandas替换缺失值。data.fillna(0) #缺失值用0替换(考试中缺考记0分)data.fillna(method='pad')#用前面的值替换data.fillna(method='backfill')#用后面的值替换可以看到，当第一行有缺失值时，利用向前替换是会失败的。

上一篇：病娇模拟器第二周怎么办

下一篇：用python制作一个扭曲的机器猫

欧尼酱

Python缺失值处理

Python 如何做价格模拟走势

python绘制参数方程曲面图（二维参数曲面）

给定一个日期计算该日期在年内是第几天(python)

Python缺失值处理

用python制作一个扭曲的机器猫

用python进行圆形截图

python 线性代数：[3]矩阵转置

截图（正方形区域的截图）（python3）

python中numpy的数组数学运算

如何用numpy创建ndarry

用python玩转元胞自动机

用python绘制参数方程的图像

通过OTSU二值方法进行肤色检查（python）

全民小镇：[16]扬帆远航版本更新及新功能简介

王者荣耀2021典韦新皮肤铁甲之心上线时间

意大利科莫湖怎么玩？

让身心放松的好方法有哪些？

产后调理的必要性

基督山伯爵观后感

升级等级10继续来挑战

MP3芯片的选型经验分享

购MP3播放器防忽悠攻略

qq音乐今日推荐歌曲在哪？

怎么利用短信群发提高工作效率?

短信营销如何做到精准投放

企业短信平台哪个好？凌凯短信平台教程

节日期间企业如何利用短信群发工具提高转化率

怎么用电脑群发短信

MP3音频格式转换器哪个好

短信群发有多少种数类型？

音乐播放器推荐

教您如何发使用短信平台

经典英文歌曲推荐