【Python】【DataFrame】如何按照日期列统计数据列(按照日期或者按照年月)
短信预约 -IT技能 免费直播动态提醒
import pandas as pd# 创建示例DataFramedata = { '日期': ['2023-06-01', '2023-06-02', '2023-06-02', '2023-06-03', '2023-06-03'], '数值': [10, 15, 20, 25, 30]}df = pd.DataFrame(data)# 将日期列转换为日期类型df['日期'] = pd.to_datetime(df['日期'])# 按照日期列进行统计,这里以求和为例result = df.groupby('日期')['数值'].sum()# 打印结果print(result)
输出结果:
日期2023-06-01 102023-06-02 352023-06-03 55Name: 数值, dtype: int64
使用pd.to_datetime
将日期列转换为日期类型。接下来,使用groupby
方法按照日期列进行分组,并选择要统计的数据列。在这里,我们选择了'数值'列,并使用sum
方法对每个日期进行求和操作。最后,打印结果。
你可以根据实际需求修改统计的方法,比如使用mean
计算平均值、max
获取最大值等。
使用pd.to_datetime
将日期列转换为日期时间类型,并利用该类型的属性进行分组操作。上代码:
import pandas as pd# 创建示例DataFramedata = { '日期': ['2023-06-01', '2023-06-02', '2023-07-01', '2023-07-02', '2023-08-01'], '数值': [10, 15, 20, 25, 30]}df = pd.DataFrame(data)# 将日期列转换为日期时间类型df['日期'] = pd.to_datetime(df['日期'])# 提取年月作为新的列df['年月'] = df['日期'].dt.to_period('M')# 按照年月进行统计,这里以求和为例result = df.groupby('年月')['数值'].sum()# 打印结果print(result)
输出结果:
年月2023-06 252023-07 452023-08 30Freq: M, Name: 数值, dtype: int64
使用pd.to_datetime
将日期列转换为日期时间类型。接下来,我们使用dt.to_period('M')
提取年月,并将其存储为新的列'年月'。然后,我们使用groupby
方法按照'年月'列进行分组,并选择要统计的数据列。在这里,我们选择了'数值'列,并使用sum
方法对每个年月进行求和操作。最后,打印结果。
来源地址:https://blog.csdn.net/Good_Hope/article/details/131134781
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341