python pandas数据处理之删除特定行与列
短信预约 -IT技能 免费直播动态提醒
dropna() 方法过滤任何含有缺失值的行
pandas.DataFrame
里,如果一行数据有任意值为空,则过滤掉整行,这时候使用dropna()
方法是合适的。下面的案例,任意列只要有一个为空数据,则整行都干掉。但是我们常常遇到的情况,是根据一个指标(一列)数据的情况,去过滤行数据,类似Excel里面的过滤漏斗,怎么办?
>>> import pandas as pd
>>> data = pd.DataFrame([[1.,6.5,3.],[1.],[],[6.5,3.]],index=list('abcd'),columns=list('def'))
>>> data
d e f
a 1.0 6.5 3.0
b 1.0 NaN NaN
c NaN NaN NaN
d 6.5 3.0 NaN
>>> data.dropna() #任意列只要有一个为空数据,则整行都干掉
d e f
a 1.0 6.5 3.0
方法一:dropna() 其他参数解析
原文链接,我们引入了dropna()
方法的其他参数。
DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
参数说明:
- axis:
- axis=0: 删除包含缺失值的行
- axis=1: 删除包含缺失值的列
- how: 与axis配合使用
- how=‘any’ :只要有缺失值出现,就删除该行或列
- how=‘all’: 所有的值都缺失,才删除行或列
- thresh: axis中至少有thresh个非缺失值,否则删除。比如 axis=0,thresh=10:标识如果该行中非缺失值的数量小于10,将删除改行
- subset: list,在哪些列中查看是否有缺失值
- inplace: 是否在原数据上操作。如果为真,返回None,否则返回新的copy,去掉了缺失值
>>> data.dropna(axis=0,subset=['e']) #axis=0,删除行,在subset的列中进行查看
d e f
a 1.0 6.5 3.0
d 6.5 3.0 NaN
方法二:替换并删除,Python pandas 如果某列值为空,过滤删除所在行数据
如上面的data数据,如果希望“e”列数值为空NaN时,删除对应行也就是“b、c”行数据,保留其他行,用dropna()
似乎比较麻烦。 这个时候的思路是:
fillna()
给空值填充一个数值(如999999)index.tolist()
找出值为填充值所在行的索引drop
根据索引干掉对应的行
>>> data['e']=data['e'].fillna(999999)
>>> find_index=data[(data.e==999999)].index.tolist()
>>> find_index
['b', 'c']
>>> data.drop(find_index)
d e f
a 1.0 6.5 3.0
d 6.5 3.0 NaN
总结
到此这篇关于python pandas数据处理之删除特定行与列的文章就介绍到这了,更多相关python pandas删除特定行列内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341