我的编程空间,编程开发者的网络收藏夹
学习永远不晚

pandas分组排序 如何获取第二大的数据

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

pandas分组排序 如何获取第二大的数据

Python用来做数据分析很方便,网上很多关于找数据中第二大的方法,但是大多数都是关于SQL的,于是我挑战一下用Python来做这件事(主要是SQL写的不好>_<),上代码。

1、数据我是自己编的

在实际工作中应该从数据库中导入数据,如何从数据库导出数据,我之后会补充。


import pandas as pd
df = pd.DataFrame([
    {"class": 1, "name": "aa", "english": 120},
    {"class": 1, "name": "bb", "english": 110},
    {"class": 1, "name": "cc", "english": 110},
    {"class": 1, "name": "dd", "english": 110},
    {"class": 2, "name": "ee", "english": 120},
    {"class": 2, "name": "ff", "english": 140},
    {"class": 2, "name": "gg", "english": 130},
    {"class": 2, "name": "hh", "english": 130},
    {"class": 3, "name": "tt", "english": 130},
    {"class": 4, "name": "xx", "english": 130},
    {"class": 4, "name": "yy", "english": 130},
    {"class": 5, "name": "zz", "english": None},
  ])

2、分组取第二大的数据


def fun(df):
  # english数据去重
  sort_set = set(df["english"].values.tolist())
  if len(sort_set)<=1:
    # 数据量小于等于1,无法取到第二大的数据
    return None
  else:
    # 取english中第二大的值
    sort_value = sorted(sort_set,reverse=True)[1]
    temp_df = df[df["english"]==sort_value]
    return temp_df
 
df = df.groupby(by=["class"]).apply(fun).reset_index(drop=True)
print(df)

结果如下:


  class name english
0 1 bb 110.0
1 1 cc 110.0
2 1 dd 110.0
3 2 gg 130.0
4 2 hh 130.0

3、写完啦,就这么简单

当然这还可以改为取最大、取最小、取第三大、等等......

补充:pandas 按某一列A排序,按B和C两列分组,选择分组后A列值最大的行

pandas 按某一列A排序,按B和C两列分组,选择分组后A列值最大的行

一、需求

按 updateTime 列倒序排序,按 B 和 C 两列分组,分组后选择最后更新的时间的那一行,并将结果加上新索引。

二、代码


import pandas as pd
data = pd.read_csv('test.csv')
df = pd.DataFrame(data)
df = df.sort_values('updateTime', ascending=False).groupby(['B','C']).first().reset_index()

first() 函数代表选择第一行,如果要选取多行,可以使用 head() 函数: head(5)表示选择前五行。

如下例:


import pandas as pd 
data = pd.read_csv('test.csv',header = 0)
df = pd.DataFrame(data) 
# 按日期分组,分组后对 value 列从大到小排序,取每组前十行
df = df.groupby('date', group_keys=False).apply(lambda x: x.sort_values('value', ascending=False)).groupby('date').head(10).reset_index()

在不能直接使用sort_values() 函数时,使用 apply() 函数。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。如有错误或未考虑完全的地方,望不吝赐教。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

pandas分组排序 如何获取第二大的数据

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

oracle数据库排序后如何获取第一条数据

这篇文章主要介绍了oracle数据库排序后如何获取第一条数据问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
2023-02-28

oracle如何根据字段分组排序取其第一条数据

这篇文章主要介绍“oracle如何根据字段分组排序取其第一条数据”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“oracle如何根据字段分组排序取其第一条数据”文章能帮助大家解决问题。以某个字段分组
2023-07-05

MySQL分组排序取每组第一条数据的实现

目录group bygroup by+子查询order byderived_merge子查询order by失效的场景需求:mysql根据某一个字段分组,然后组内排序,最后每组取排序后的第一条数据。准备表:CREATE TABLE `t
MySQL分组排序取每组第一条数据的实现
2024-08-09

小程序如何获取第三方平台自定义的数据字段

本文将为大家详细介绍“小程序如何获取第三方平台自定义的数据字段”,内容步骤清晰详细,细节处理妥当,而小编每天都会更新不同的知识点,希望这篇“小程序如何获取第三方平台自定义的数据字段”能够给你意想不到的收获,请大家跟着小编的思路慢慢深入,具体
2023-06-26

Java如何用“自然排序”算法对数组进行不区分大小写字母的排序

Java使用“自然排序”算法对字符串数组进行不区分大小写的排序。该算法通过定制比较器实现,将字符串转换为小写再比较。它可以按自然顺序对包含数字和大小写字母的字符串进行排序,且使用简单高效。局限性是仅适用于字符串,无法自定义排序顺序。替代方案是使用Guava库的Ordering.natural().nullsFirst()方法。此算法广泛应用于需要不区分大小写字母排序的场景。
Java如何用“自然排序”算法对数组进行不区分大小写字母的排序
2024-04-02

PHP如何用“自然排序”算法对数组进行不区分大小写字母的排序

本篇文章介绍了使用PHP对数组执行不区分大小写字母的自然排序的方法。自然排序算法优先考虑数字顺序,而不是字母顺序。通过将数组元素转换为小写、使用usort()函数比较元素的自然排序版本,您可以按自然顺序对数组进行排序。示例代码展示了如何使用array_map()、usort()和natural_sort()函数实现此功能。
PHP如何用“自然排序”算法对数组进行不区分大小写字母的排序
2024-04-02

微信小程序如何获取第三方平台自定义的数据字段

这篇文章主要介绍了微信小程序如何获取第三方平台自定义的数据字段的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇微信小程序如何获取第三方平台自定义的数据字段文章都会有所收获,下面我们一起来看看吧。wx.getExt
2023-06-26

如何通过索引优化PHP与MySQL的数据排序和数据分组的效率?

在开发Web应用过程中,经常需要对数据进行排序和分组操作。而对于PHP与MySQL之间的数据排序和数据分组操作,我们可以通过索引来优化其效率。索引是一种数据结构,用于提高数据的检索速度。它可以加快数据的排序、分组以及查找操作。下面我们将介绍
2023-10-21

小程序如何获取第三方平台自定义数据字段的同步接口

这篇“小程序如何获取第三方平台自定义数据字段的同步接口”除了程序员外大部分人都不太理解,今天小编为了让大家更加理解“小程序如何获取第三方平台自定义数据字段的同步接口”,给大家总结了以下内容,具有一定借鉴价值,内容详细步骤清晰,细节处理妥当,
2023-06-26

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录