位置：首页-资讯-后端开发

Pandas 实现分组计数且不计重复

2024-04-02 19:55

短信预约 -IT技能 免费直播动态提醒

在对dataframe进行分析的时候会遇到需要分组计数，计数的column中属性有重复，但又需要仅对不重复的项计数（即重复N次出现的项只计1次）。

函数如下：

dataframe.groupby([‘分组的列名']).需要计数的列名.nunique()

举例：

数组“data”如下：

StoreID	Sales	SalesDate	Channel
A	100	2018/1/1	01
A	90	2018/1/1	02
A	110	2018/1/2	01
B	82.2	2018/1/1	01
B	90	2018/1/2	02

如果要按StoreID来统计每一家店的营业日期数（可以通过不计重复的count “SalesDate”来完成）

代码如下：


data.groupby(['StoreID']).SalesDate.nunique()

补充：pandas 统计分组内不重复计数

在数据分析中的数据处理过程中，经常需要对数据进行分组计数，看下下面这组数据

数据中name 为C 的有三行，其中有2个code是重复的

目标：

按name 分组，统计每组中code的不重复数量


df.groupby('name')['code'].nunique()
# 以name 分组后，统计code的不重复数目

结果如下：

排序


df.groupby('name')['code'].nunique().sort_values(ascending=False)
# 以name 分组后，统计code的不重复数目

以上为个人经验，希望能给大家一个参考，也希望大家多多支持编程网。如有错误或未考虑完全的地方，望不吝赐教。

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉

Pandas 实现分组计数且不计重复

下载Word文档到电脑，方便收藏和打印～

下载Word文档

Pandas 实现分组计数且不计重复

举例：

目标：

排序

Pandas 实现分组计数且不计重复

相关文章

猜你喜欢

Pandas 实现分组计数且不计重复

Pandas实现groupby分组统计的实践

使用Pandas怎么实现一个分组计数功能

python中pandas对多列进行分组统计的实现

一条sql实现统计总数、分组分别统计总数

JavaScript 中怎么实现数组去重并统计重复元素出现的次数

SQL分组怎么实现去重且合并相似数据

java8 如何实现分组计算数量和计算总数

java8怎么实现分组计算数量和计算总数

Python代码实现列表分组计数

R语言 实现两表连接且输出不重复数据

Python Pandas模块实现数据的统计分析的方法

批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数)

R语言 实现data.frame 分组计数、求和等

Python代码然后实现列表分组计数

怎么在R语言中实现两表连接且输出不重复数据

两种方法实现mysql分组计数，范围汇总

如何实现统计重复次数并排序的批处理

sql server中怎么使用over()函数实现分组统计

Curator实现分布式锁（可重入 不可重入 读写 联锁 信号量 栅栏 计数器）

热门标签

编程热搜

编程资源站

目录

感谢您的提交，我们服务专员将在30分钟内给您回复

R语言实现两表连接且输出不重复数据

R语言实现data.frame 分组计数、求和等

Curator实现分布式锁（可重入不可重入读写联锁信号量栅栏计数器）