聊聊python dropna()和notnull()的用法区别
`dropna()`和`notnull()`是pandas库中用于处理缺失值的函数,它们的用法和功能有一些区别。
`dropna()`是pandas库中DataFrame和Series对象的一个方法,用于删除含有缺失值的行或列。它的主要功能是过滤掉包含缺失值的行或列,返回一个新的DataFrame或Series对象。默认情况下,`dropna()`会删除包含任何缺失值的行或列,也可以通过参数指定删除方式。例如,可以通过设置`axis`参数为1来删除包含缺失值的列,通过设置`subset`参数来指定删除含有缺失值的特定列。
示例代码:
``` python
import pandas as pd
# 创建一个包含缺失值的DataFrame
df = pd.DataFrame({'A': [1, 2, None, 4],
'B': [5, None, 7, 8]})
# 使用dropna()删除含有缺失值的行
df_dropna = df.dropna()
print(df_dropna)
```
输出结果:
```
A B
0 1.0 5.0
3 4.0 8.0
```
`notnull()`是pandas库中DataFrame和Series对象的一个方法,用于判断每个元素是否为非空值。它返回一个布尔值的DataFrame或Series,其中为非空值的元素对应的位置为`True`,否则为`False`。
示例代码:
``` python
import pandas as pd
# 创建一个包含缺失值的DataFrame
df = pd.DataFrame({'A': [1, 2, None, 4],
'B': [5, None, 7, 8]})
# 使用notnull()判断每个元素是否为非空值
df_notnull = df.notnull()
print(df_notnull)
```
输出结果:
```
A B
0 True True
1 True False
2 False True
3 True True
```
总结一下,`dropna()`主要用于删除含有缺失值的行或列,而`notnull()`主要用于判断每个元素是否为非空值。
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341