我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Python中常用探索性数据分析方法有哪些

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Python中常用探索性数据分析方法有哪些

这篇文章主要介绍了Python中常用探索性数据分析方法有哪些,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。

常用探索性数据分析方法很多,比如常用的 Pandas DataFrame 方法有 .head()、.tail()、.info()、.describe()、.plot() 和 .value_counts()。

import pandas as pdimport numpy as npdf = pd.DataFrame( {     "Student" : ["Mike", "Jack", "Diana", "Charles", "Philipp", "Charles", "Kale", "Jack"] ,           "City" : ["London", "London", "Berlin", "London", "London", "Berlin", "London", "Berlin"] ,"Age" : [20, 40, 18, 24, 37, 40, 44, 20 ],"Maths_Score" : [84, 80, 50, 36, 44, 24, 41, 35],"Science_Score" : [66, 83, 51, 35, 43, 58, 71, 65]} ) df

在 Pandas 中创建 groupby() 对象

在许多情况下,我们希望将数据集拆分为多个组并对这些组进行处理。 Pandas 方法 groupby() 用于将 DataFrame 中的数据分组。

与其一起使用 groupby() 和聚合方法,不如创建一个 groupby() 对象。 理想的情况是,我们可以在需要时直接使用此对象。

让我们根据列“City”将给定的 DataFrame 分组

df_city_group = df.groupby("City")

我们创建一个对象 df_city_group,该对象可以与不同的聚合相结合,例如 min()、max()、mean()、describe() 和 count()。 一个例子如下所示。

Python中常用探索性数据分析方法有哪些


要获取“City”是Berlin的 DataFrame 子集,只需使用方法 .get_group()

Python中常用探索性数据分析方法有哪些


这不需要为每个组创建每个子 DataFrame 的副本,比较节省内存。

另外,使用 .groupby() 进行切片比常规方法快 2 倍!!

Python中常用探索性数据分析方法有哪些

使用 .nlargest()

通常,我们根据特定列的值了解 DataFrame 的 Top 3 或 Top 5 数据。例如,从考试中获得前 3 名得分者或从数据集中获得前 5 名观看次数最多的电影。使用 Pandas .nlargest() 是最简单的方式。

df.nlargest(N, column_name, keep = ‘first' )

使用 .nlargest() 方法,可以检索包含指定列的 Top ‘N' 值的 DataFrame 行。

在上面的示例中,让我们获取前 3 个“Maths_Score”的 DataFrame 的行。

Python中常用探索性数据分析方法有哪些

如果两个值之间存在联系,则可以修改附加参数和可选参数。 它需要值“first”、“last”和“all”来检索领带中的第一个、最后一个和所有值。这种方法的优点是,你不需要专门对 DataFrame 进行排序。

使用 .nsmallest()

与Top 3 或5 类似,有时我们也需要DataFrame 中的Last 5 条记录。例如,获得评分最低的 5 部电影或考试中得分最低的 5 名学生。使用 Pandas .nsmallest() 是最简单的方式

df.nsmallestst(N, column_name, keep = ‘first' )

使用 .nsmallest() 方法,可以检索包含指定列的底部“N”个值的 DataFrame 行。

在同一个示例中,让我们获取 DataFrame“df”中“Maths_Score”最低的 3 行。

Python中常用探索性数据分析方法有哪些

逻辑比较

比较运算符 <、>、<=、>=、==、!= 及其包装器 .lt()、.gt()、.le()、.ge()、.eq() 和 .ne() 分别在以下情况下非常方便将 DataFrame 与基值进行比较,这种比较会产生一系列布尔值,这些值可用作以后的指标。

  • 基于比较对 DataFrame 进行切片

  • 可以基于与值的比较从 DataFrame 中提取子集。

  • 根据两列的比较在现有 DataFrame 中创建一个新列。

所有这些场景都在下面的示例中进行了解释

# 1. Comparing the DataFrame to a base value# Selecting the columns with numerical values onlydf.iloc[:,2:5].gt(50)df.iloc[:,2:5].lt(50)# 2. Slicing the DataFrame based on comparison# df1 is subset of df when values in "Maths_Score" column are not equal or equal to '35'df1 = df[df["Maths_Score"].ne(35)]df2 = df[df["Maths_Score"].eq(35)]# 3. Creating new column of True-False values by comparing two columnsdf["Maths_Student"] = df["Maths_Score"].ge(df["Science_Score"])df["Maths_Student_1"] = df["Science_Score"].le(df["Maths_Score"])

感谢你能够认真阅读完这篇文章,希望小编分享的“Python中常用探索性数据分析方法有哪些”这篇文章对大家有帮助,同时也希望大家多多支持编程网,关注编程网行业资讯频道,更多相关知识等着你来学习!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Python中常用探索性数据分析方法有哪些

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Python中常用探索性数据分析方法有哪些

这篇文章主要介绍了Python中常用探索性数据分析方法有哪些,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。常用探索性数据分析方法很多,比如常用的 Pandas DataFra
2023-06-25

电商数据分析的常用方法有哪些

电商数据分析的常用方法有市场分析、用户行为分析、商品分析、营销策略分析、供应链分析、用户满意度分析和大数据分析等。详细介绍:1、市场分析方法,通过分析市场数据,企业可以了解目标市场的规模、增长趋势,以及竞争对手的策略;2、用户行为分析方法,
2023-08-10

常用的5种数据分析方法有哪些?

对比分析法指通过指标的对比来反映事物数量上的变化,属于统计分析中常用的方法。常见的对比有横向对比和纵向对比。

Python数据分析常用工具有哪些

Python数据分析常用工具有以下几种:1. NumPy:用于高性能数值计算和数组操作的库。2. Pandas:用于数据分析和数据处理的库,提供了高性能、易于使用的数据结构和数据分析工具。3. Matplotlib:用于绘制二维图形的库,提
2023-10-12

Python中Sweetviz如何实现探索性数据分析

小编给大家分享一下Python中Sweetviz如何实现探索性数据分析,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!Sweetviz 是一个开源 Python 库,它只需三行代码就可以生成漂亮的高精度可视化效果来启动EDA
2023-06-25

数据分析方法有哪些

数据分析方法有:1、描述性统计分析,对数据集的基本统计项进行计算和总结,来描述数据的特征和分布;2、探索性数据分析,对数据集进行初步探索,以发现数据中潜藏的模式,异常和趋势等信息;3、假设检验,使用统计方法来评估某个假设是否成立;4、回归分
2023-08-07

Python常见的数据分析库有哪些

这篇文章主要介绍“Python常见的数据分析库有哪些”,在日常操作中,相信很多人在Python常见的数据分析库有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python常见的数据分析库有哪些”的疑惑有所
2023-06-02

搜索引擎优化SEO常用分析方法有哪些

这篇文章将为大家详细讲解有关搜索引擎优化SEO常用分析方法有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。如何分析竞争对手网站外部因素分析:雅虎查反向链接数量。百度谷歌查询收录量。查询域名使用时间.内
2023-06-10

spss数据分析方法有哪些

这篇文章主要讲解了“spss数据分析方法有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“spss数据分析方法有哪些”吧!spss数据分析的五种方法:1、线性模型;点击分析,一般线性模型,
2023-06-20

pandas数据分析有哪些方法

pandas数据分析的方法有:1、数据读取与处理;2、数据筛选与选择;3、数据排序与整理;4、数据聚合与分组;5、数据透视与透视表;6、合并与连接数据;7、数据持久化与保存。Pandas库提供了丰富的数据分析和处理功能,涵盖了数据的读取、处
pandas数据分析有哪些方法
2023-11-22

pandas数据分析常用函数有哪些

小编给大家分享一下pandas数据分析常用函数有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!1. 导入模块import pandas as pd
2023-06-01

查看Python中常用的数据类型有哪些方法

Python是一种简洁而强大的编程语言,它支持多种数据类型。在编写Python程序时,我们经常需要查看数据的类型,以便了解数据的结构和特征,进而进行相应的操作和处理。本文将介绍Python中常用的数据类型查看方法,并提供相应的代码示例。在
查看Python中常用的数据类型有哪些方法
2024-01-20

探索Golang中常用的数据类型转换方法

探索Golang中常用的数据类型转换方法前言在Golang编程中,经常会遇到不同数据类型之间的转换问题。本文将介绍一些常用的数据类型转换方法,并附上具体的代码示例,以供大家参考。字符串与整数之间的转换在Golang中,字符串与整数之间的转换
探索Golang中常用的数据类型转换方法
2023-12-23

JavaScript中有哪些常用的属性方法

JavaScript中有哪些常用的属性方法?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。JavaScript常用属性方法有:1.document.write("
2023-06-14

Python中有哪些字典常用方法

Python中有哪些字典常用方法?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。1、clear方法清除字典中所有的项,这是一个原地操作,所以无返回值(或则说返回None)d
2023-06-15

使用pandas进行数据可视化和探索性数据分析的技巧及方法

如何使用pandas进行数据可视化和探索性分析导语:在数据分析的过程中,可视化和探索性分析是不可或缺的环节。pandas是Python中一个非常强大的数据分析库,除了具有数据处理功能外,还提供了一系列用于数据可视化和探索性分析的工具。本文
使用pandas进行数据可视化和探索性数据分析的技巧及方法
2024-01-13

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录