我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Pandas使用技巧有哪些

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Pandas使用技巧有哪些

小编给大家分享一下Pandas使用技巧有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

1.行的条件选择

首先,数据探索是必要步骤。Pandas为进行各种分析提供了一种快速简便的方法。其中一个非常重要的技巧是根据条件选择行或过滤数据。

行的条件选择可以基于由逻辑运算符分隔的单个语句中的单个条件或多个条件。

例如,我使用一个关于贷款预测的数据集。

我们将挑选一排还没有毕业、收入低于5400英镑的客户。让我们看看我们该怎么做。

import pandas as pddata = pd.read_csv('../Data/loan_train.csv')data.head()data2 = data.loc[(data['Education'] == 'Not Graduate') & (data['ApplicantIncome'] <= 5400)]data2

注意:记住把每个条件放在括号内。

2.数据的存储

数据可以有两种类型-连续的和离散的,这取决于我们的分析要求。有时我们不需要连续变量中的精确值,但需要它所属的群体。

例如,你的数据中有一个连续变量,年龄。但你需要一个年龄组来进行分析,比如儿童、青少年、成人、老年人。实际上,Binning非常适合解决我们这里的问题。

为了执行Binning,我们使用cut()函数。这对于从连续变量到离散变量非常有用。

import pandas as pddf = pd.read_csv('titanic.csv')from sklearn.utils import shuffle# 随机化df = shuffle(df, random_state = 42)df.head()bins = [0,4,17,65,99]labels =['Toddler','Child','Adult','Elderly']category = pd.cut(df['Age'], bins = bins, labels = labels)df.insert(2, 'Age Group', category)df.head()df['Age Group'].value_counts()df.isnull().sum()

3.分组数据

这种操作在数据科学家和分析师的日常生活中经常执行。Pandas提供了一个基本的函数来执行数据分组,即Groupby

Groupby操作包括根据特定条件拆分对象,应用函数,然后组合结果。

让我们再看一次贷款预测数据集,假设我想看看给来自不同财产领域的人的平均贷款额,比如农村、半城市和城市。花点时间来理解这个问题陈述并思考如何解决它。

嗯,Pandasgroupby可以非常有效地解决这个问题。首先根据属性区域划分数据。其次,我们将mean()函数应用于每个类别。最后,我们将它们组合在一起,并将其打印为新的数据帧。

#导入数据集import pandas as pddf = pd.read_csv('../Data/loan_train.csv')df.head()# 男女平均收入df.groupby(['Gender'])[['ApplicantIncome']].mean()# 平均贷款金额不同的财产地区,如城市,农村df.groupby(['Property_Area'])[['LoanAmount']].mean()# 比较不同教育背景的贷款状况df.groupby(['Education'])[['Loan_Status']].count()

4.Pandas map

map是另一个提供高度灵活性和实际应用的重要操作。

Pandas map()用于根据输入对应关系将序列中的每个值映射到其他值。实际上,这个输入可以是一个序列、字典,甚至是一个函数。

让我们举一个有趣的例子。我们有一个虚拟的雇员数据集。此数据集由以下列组成–姓名、年龄、职业、城市。

现在需要添加另一列,说明相应的状态。你会怎么做?如果数据集的范围是10行,你可以手动执行,但是如果有数千行呢?使用Pandas map会更有利。

#样本数据data = {'name': ['A', 'B', 'C', 'D', 'E'],         'age': [22, 26, 33, 44, 50],        'profession' : ['data engineer', 'data scientist', 'entrepreneur', 'business analyst', 'self-employed'],         'city': ['Gurgaon', 'Bangalore', 'Gurgaon', 'Pune', 'New Delhi']}df = pd.DataFrame(data)df# 城市与州map_city_to_states = { 'Gurgaon' : 'Haryana',                   'Bangalore' : 'Karnataka',                   'Pune' : 'Maharashtra',                   'New Delhi' : 'Delhi'}# 将城市列映射为州df['state'] = df['city'].map(map_city_to_states)df

5.Pandas DataFrame的条件格式化

这是我最喜欢的Pandas技巧之一。这个技巧让我有能力直观地定位特定条件下的数据。

可以使用Pandasstyle属性将条件格式应用于数据框。事实上,条件格式是根据某种条件对数据帧应用视觉样式的操作。

虽然Pandas提供了大量的操作,但我将在这里向你展示一个简单的操作。例如,我们有对应于每个销售人员的销售数据。我想查看的是销售价值高于80的。

import pandas as pddata = pd.read_excel("../Data/salesman_performance.xlsx")datadata.styledef highlight_green(sales):    color = 'green' if sales > 80 else 'black'    return 'color: %s' % colorformatting = data.iloc[:,1:6].style.applymap(highlight_green)formatting

以上是“Pandas使用技巧有哪些”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注编程网行业资讯频道!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Pandas使用技巧有哪些

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Pandas使用技巧有哪些

小编给大家分享一下Pandas使用技巧有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!1.行的条件选择首先,数据探索是必要步骤。Pandas为进行各种分析提供
2023-06-27

Pandas的使用技巧有哪些

这篇文章主要介绍了Pandas的使用技巧有哪些的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Pandas的使用技巧有哪些文章都会有所收获,下面我们一起来看看吧。Pandas是一个强大的分析结构化数据的工具集;它
2023-06-27

使用Numpy与Pandas的高效技巧有哪些

本篇内容介绍了“使用Numpy与Pandas的高效技巧有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!Numpy 的 6 种高效函数首先
2023-06-15

鲜为人知的Pandas技巧有哪些

这篇文章主要介绍了鲜为人知的Pandas技巧有哪些,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。Pandas为Python营造了一个高水平的操作环境,还提供了便于操作的数据结
2023-06-16

LoadRunner使用技巧有哪些

这篇文章主要讲解了“LoadRunner使用技巧有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“LoadRunner使用技巧有哪些”吧!一、性能指标在做性能测试之前,简单说下性能指标:响
2023-06-05

CSS使用技巧有哪些

本篇内容主要讲解“CSS使用技巧有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“CSS使用技巧有哪些”吧!1、使用 :not() 为导航添加/取消边框很多人会这样给导航添加边框,然后给最后一
2023-06-04

vim使用技巧有哪些

这篇文章将为大家详细讲解有关vim使用技巧有哪些,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。一、VIM常用操作1、插入命令a在光标所在字符后插入A在光标所在行尾插入i在光标所在字符前插入I
2023-06-05

CSS有哪些使用技巧

本篇内容主要讲解“CSS有哪些使用技巧”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“CSS有哪些使用技巧”吧! 1. 文字的水平居中 将一段文字置于容器的水平中点,只要设置text-align属
2023-06-08

vsFTPd使用技巧有哪些

这篇文章将为大家详细讲解有关vsFTPd使用技巧有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。一、匿名服务器的连接(独立的服务器)在/etc/vsftpd/vsftpd.conf配置文件中添加如下几
2023-06-16

ubantu使用技巧有哪些

这篇文章给大家分享的是有关ubantu使用技巧有哪些的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。1.打开超级用户权限的运行程序对话框你也许已经知道用Alt+F2来打开”运行程序”对话框,然后可以输入任何命令行运
2023-06-16

win10有哪些使用技巧

本篇内容介绍了“win10有哪些使用技巧”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!win10技巧大全:1、快速进行电脑锁屏如果用户们想要
2023-07-01

Linux使用技巧有哪些

这篇文章主要为大家展示了“Linux使用技巧有哪些”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Linux使用技巧有哪些”这篇文章吧。1.快速跳转命令 - z要是每次都要进入一个目录很深的文件夹
2023-06-15

Vue有哪些使用技巧

这篇文章主要介绍了Vue有哪些使用技巧,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。1. 将 prop 限制为类型列表在 prop 定义中使用 validator 选项,你可
2023-06-25

Git使用技巧有哪些

小编给大家分享一下Git使用技巧有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!Git,一个分布式版本控制系统,它已经成为了开源世界的源码控制默认工具,在4月
2023-06-16

JavaScript使用技巧有哪些

本篇内容主要讲解“JavaScript使用技巧有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“JavaScript使用技巧有哪些”吧!1. 过滤唯一值ES6 引入了 Set 对象和延展(sp
2023-06-27

win7有哪些使用技巧

今天小编给大家分享一下win7有哪些使用技巧的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。win7上手使用技巧一、鼠标的基本
2023-07-01

Laravel使用技巧有哪些

今天小编给大家分享一下Laravel使用技巧有哪些的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。1.胖模型,瘦控制器如果我们
2023-07-04

kubernetes使用技巧有哪些

这篇文章主要介绍了kubernetes使用技巧有哪些,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。一:在容器中获取 Pod 的IPapiVersion: v1kind: Re
2023-06-04

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录