软科小院

pandas中NaN缺失值的处理方法

热度:15℃ 发布时间:2022-01-17 09:54:23

本文主要介绍了pandas中NaN缺失值的处理方法,主要有两种方法,具体如下:

import pandas as pd

缺失值处理

两种方法:

删除含有缺失值的样本 替换/插补处理缺失值为NaN

先判断数据中是否存在NaN,通过下面两个方法中任意一个

pd.isnull(dataframe)# dataframe为数据如果数据中存在NaN返回True,如果没有就返回Falsepd.notnull(dataframe)该方法与isnull相反any() 和 all()"""pd.isnull(dataframe).any()判断哪一个字段中存在缺失值没有就返回Falsepd.notnull(dataframe).all()判断哪一个字段中存在缺失值没有就返回True"""

使用numpy也可以进行判断

import numpy as npnp.any(pd.isnull(dataframe)) # 如果返回True,说明数据中存在缺失值np.all(pd.notnull(dataframe)) # 如果返回False, 说明数据中存在缺失值

然后进行数据处理

方式一: 删除空值行

dataframe.dropna(inplace=False)"""dropna() 是删除空值数据的方法, 默认将只要含有NaN的整行数据删除, 如果想要删除整行都是空值的数据需要添加how=’all’参数默认是删除整行, 如果对列做删除操作, 需要添加axis参数, axis=1表示删除列, axis=0表示删除行inplace: 是否在当前的dataframe中执行此操作,True表示在原来的基础上修改,False表示返回一个新的值, 不修改原有数据"""

方式二: 替换/插补

dataframe.fillna(’替换的值value’,inplace=False)’’’把替换NaN的值传入到fillna()中’’’缺失值NaN有默认标记的值

比如有的空值不是NaN, 有的是一个’?’

先替换
使用numpy把"?"替换为NaN

import numpy as np# 替换dataframe.replace(to_replace="?", value=np.nan)

把其他的缺失值换为NaN后, 然后就按照缺失值为NaN的方式就行操作

删除数据

如果只是单独的删除数据可以使用drop()方法

DataFrame.drop(labels=None,axis=0, index=None, columns=None, inplace=False)’’’代码解释:labels : 就是要删除的行列的名字,用列表指定index : 直接指定要删除的行columns : 直接指定要删除的列inplace=False : 表示返回一个新的值, 不修改原有数据inplace=True : 表示在原来的基础上修改’’’

例:

import pandas as pddf = pd.read_csv(’/text.xlsx’)# 删除第0行和第1行df.drop(labels=[0,1],axis=0)# 删除列名为 age 的列df.drop(axis=1,columns=age)

到此这篇关于pandas中NaN缺失值的处理方法的文章就介绍到这了,更多相关pandas NaN缺失值内容请搜索软科小院以前的文章或继续浏览下面的相关文章希望大家以后多多支持软科小院!

  • 编程技术推荐
更多+
Python 数据化运营之KMeans聚类分析总结

Python 数据化运营之KMeans聚类分析总结

目录Python 数据化运营1、内容介绍2、一般应用场景3、聚类的常见方法4、Keans聚类实现5、聚类的评估指标6、聚类效果可视化7、数据预测Python 数据化运营1、内容介绍以 Python 使用 Keans 进行聚类分析的简单举例应用介绍聚类分析。聚类分析 或 聚类 是对一组对象进行分组的任...

07-18

如何用Python写一个简单的通讯录

如何用Python写一个简单的通讯录

目录用Python写一个简单的通讯录一、构思1、定义空列表和一个空字典来存储2、定义功能选项3、添加通讯录功能4、 循环,调用所有的函数功能二、整体项目演示用Python写一个简单的通讯录一、构思1、定义空列表和一个空字典来存储list1=[] #用于储存字典中的信息dict1={} #用于储存...

07-18

如何使用Python做个自定义动态壁纸

如何使用Python做个自定义动态壁纸

目录使用Python做个自定义动态壁纸一、核心功能设计二、实现步骤1. UI排版布局设计2. 视频加载预览3. 动态壁纸功能实现4. 关闭动态壁纸使用Python做个自定义动态壁纸首先一起来看看最终实现的自定义动态壁纸效果:接我接下来,我们开始介绍这个自定义动态桌面的制作过程。一、核心功能设计总体来...

07-18

Python 自动化常用操作及glob使用大全

Python 自动化常用操作及glob使用大全

目录1. OS模块2. shutil模块3. globa模块glob的几种用法本文摘自微信公众号 GitPython:十个 Python 自动化常用操作。如有侵权,联系必删。1. OS模块导入:import os1. 遍历文件夹批量操作的前提就是对文件夹进行遍历,os.walk遍历文件夹后产生三个参...

07-18

我用Python做个AI出牌器斗地主把把赢

我用Python做个AI出牌器斗地主把把赢

目录前言一、核心功能设计UI设计排版布局手牌和出牌数据识别AI出牌方案输出二、实现步骤1. UI设计排版布局2. 手牌和出牌数据识别3. AI出牌方案输出三、出牌器用法1. 环境配置2. 坐标调整确认3. 运行测试前言最近在网上看到一个有意思的开源项目,基于快手团队开发的开源AI斗地主——DouZe...

07-18

网友评论
评论
发 布

更多编程技术
最新软件下载