python重复值处理得方法

2024-04-02 19:55

短信预约 -IT技能 免费直播动态提醒

前言：

如果大家接触过数据分析，那么大家可能都知道，最让人头疼的就是在数据录入的过程中，不可避免的会产生重复值，缺失值和异常值了，python也提供了一些方法让我们处理这些值。下面让我们一块来学习一下吧~

今天，先处理重复值，首先创建一个包含重复值的DataFrame,如下：

import pandas as pd
data = pd.DataFrame([[1,2],[1,2],[3,4]],columns = ['a','b'])
print(data)

我们将其打印出来，结果如下：

可以看出来第一第二行是重复的，这里的数据量比较少，可以直接肉眼观察，但如果数据量多的时候，我们就需要用到diplicated()函数来查询了，我们用它来查查上面data的重复值。

data[data.duplicated()]

我们可以看出，它把索引为1的行打印了出来，如果有3行一样的呢？我们下面来试试！

import pandas as pd
data = pd.DataFrame([[1,2],[1,2],[1,2],[3,4]],columns = ['a','b'])
data[data.duplicated()]

其结果如下：

可以看出，重复项出了第一个出现的数据外，都会显示出来。

如果想统计出一共有多少行重复了，我们就可以用到sum()函数，代码如下：

data.duplicated().sum()

很多情况下，我们都需要删除掉重复的数据，这时候我们就可以用到drop_duplicated()函数，我们将data的重复行删除掉试试！

data.drop_duplicated()

刚执行代码时发生了错误，原来是duplicates而不是duplicated!

但是要注意，用drop_duplicates()删除重复项并不会影响data的结构，如果你要把data结构改掉就要重新赋值。如果要用来删除某列的重复值的话，直接在括号内加上列名即可。

如下：

到此这篇关于python重复值处理得方法的文章就介绍到这了,更多相关python 重复值内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉

python重复值处理得方法

下载Word文档到电脑，方便收藏和打印～

下载Word文档

python重复值处理得方法

python重复值处理得方法

相关文章

猜你喜欢

python重复值处理得方法

python处理重复值的方法有哪些

python重复值如何处理

Python缺失值处理方法

python查找重复值的方法有哪些

python移除重复值的方法是什么

如何使用Pandas处理数据中的重复值：全面解析去重方法

python字典多键值及重复键值的使用方法(详解)

pandas数据清洗(缺失值和重复值的处理)

25个值得收藏的Python文本处理案例

MYSQL中怎么插入处理重复键值

Android 处理 View 重复点击的多种方法

怎么处理配置文件中的重复值

Python基础知识方法重写+文件处理+异常处理

MySQL 处理重复数据的方法(防止、删除)

Python pandas处理缺失值方法详解(dropna、drop、fillna)

SQL COUNT处理空值的方法

Python详解复杂CSV文件处理方法

python之NAN和INF值处理方式

自然语言处理中的Python库有哪些值得推荐？

热门标签

编程热搜

编程资源站

目录

感谢您的提交，我们服务专员将在30分钟内给您回复