Pandas条件筛选与组合筛选的使用
短信预约 -IT技能 免费直播动态提醒
在使用pandas进行数据分析时,经常需要根据逻辑条件来筛选数据。
如果使用 for循环语句 遍历的方式来查找,将十分耗时。
推荐使用pandas自身的功能函数进行筛选,效率更高。
以下列出笔者常用的筛选方法。
条件筛选
根据具体值筛选
df[df['Num'] == 10]
df[df['Name'] == 'Tom']
找出df中值在具体列表中的数据
val_list = [100, 200, 300]
df[df['Num'].isin(val_list)]
筛选某列值长度为固定值的数据
df[df['content'].str.len() == 10]
筛选某列是否为空的数据
# 找出content列为空的数据
df[df['content'].isna()]
# 找出content不为空的数据
df[~df['content'].isna()]
组合筛选
多条件同时满足
# 找出df中A列值为100 且 B列值为‘a'的所有数据
df[(df['A']==100)&(df['B']=='a')]
多条件满足其一即可
# 找出df中A列值为100或B列值为‘b'的所有数据
df[(df['A']==100)|(df['B']=='b')]
注:筛选后所得数据的索引一般是乱的,可使用 df = df.reset_index(drop=True) 的方式重置索引。
到此这篇关于Pandas条件筛选与组合筛选的使用的文章就介绍到这了,更多相关Pandas条件筛选与组合筛选内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341