我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Pandas的介绍及安装方法

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Pandas的介绍及安装方法

这篇文章主要介绍“Pandas的介绍及安装方法”,在日常操作中,相信很多人在Pandas的介绍及安装方法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Pandas的介绍及安装方法”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

  Pandas介绍与安装

  为什么会有Pandas

   Pandas支持大部分Numpy语言风格,尤其是数组函数与广播机制的各种数据处理。单是Numpy更适合处理同质型的数据。而Pandas的设计就是用来处理表格型或异性数据的,高效的清洗、处理数据。

  Pandas是什么?

   Pandas是基于Numpy的一种工具,提供高性能矩阵的运算,该工具是为了解决数据分析任何而创建的。也是贯穿整个Python数据分析非常核心的工具

  安装Pandas

  pip install Pandas

  Pandas涉及内容

   Pandas基础 、数据清洗与准备、数据聚合与分组、时间序列

  Pandas数据结构介绍

  Series介绍

   Series是一种一维数组对象,它包含了一个值序列(value) ,并且包含了数据标签,称之为索引 (index)

  Series创建

  pd.Series(data=None,index=None,dtype=None,name=None,copy=False)

  data : 创建数组的数据,可为array、like、dict、or scalar value

  index : 指定索引

  dtype : 数组数据类型

  name : 数组名称

  copy : 是否拷贝

  Pandas数组函数

  语法  基本使用

  dtype  查看数据类型

  astype  修改数据类型

  head()  预览前几条数据

  tail()  预览后几条数据

  In [15]: # 指定索引序列

  In [16]: series = pd.Series(np.arange(4),index=['a','b','c','d'])

  In [17]: series

  Out[17]:

  a 0

  b 1

  c 2

  d 3

  dtype: int32

  In [18]: # 指定索引的名字

  In [19]: series = pd.Series(np.arange(4),index=['a','b','c','d'],name='SmallJ')

  In [20]: series

  Out[20]:

  a 0

  b 1

  c 2

  d 3

  Name: SmallJ, dtype: int32

  In [21]: # 默认返回int32,可指定其他类型

  In [23]: series = pd.Series(np.arange(4),index=['a','b','c','d'],name='SmallJ',dtype='int64')

  In [24]: series

  Out[24]:

  a 0

  b 1

  c 2

  d 3

  Name: SmallJ, dtype: int64

  In [29]: import numpy as np

  In [30]: import pandas as pd

  In [31]: series = pd.Series(np.arange(10),name='SmallJ')

  In [32]: series

  Out[32]:

  0 0

  1 1

  2 2

  3 3

  4 4

  5 5

  6 6

  7 7

  8 8

  9 9

  Name: SmallJ, dtype: int32

  In [33]: # 前面为索引后面为值

  In [34]: series.dtype

  Out[34]: dtype('int32')

  In [35]: # 查看数据类型

  In [36]: series.dtype

  Out[36]: dtype('int32')

  In [37]: # 修改数据类型

  In [38]: series.astype('float64')

  Out[38]:

  0 0.0

  1 1.0

  2 2.0

  3 3.0

  4 4.0

  5 5.0

  6 6.0

  7 7.0

  8 8.0

  9 9.0

  Name: SmallJ, dtype: float64

  In [39]: # 预览从头开始的数据 (括号内填指定的数据)

  In [40]: series.head(5)

  Out[40]:

  0 0

  1 1

  2 2

  3 3

  4 4

  Name: SmallJ, dtype: int32

  In [41]: series.head(6)

  Out[41]:

  0 0

  1 1

  2 2

  3 3

  4 4

  5 5

  Name: SmallJ, dtype: int32

  In [42]: # 预览最后的数据 (括号填指定的数据)

  In [43]: series.tail(5)

  Out[43]:

  5 5

  6 6

  7 7

  8 8

  9 9

  Name: SmallJ, dtype: int32

  Series的索引与值

  series.index

  查看索引

  series.values

  查看值序列

  series.reset_index(drop=False)

  重置索引

  drop 是否删除原索引 默认为否

  In [89]: import pandas as pd

  In [90]: import numpy as np

  In [91]: series = pd.Series(data=np.arange(5),index=['a','b','c','d','e'])

  In [92]: series

  Out[92]:

  a 0

  b 1

  c 2

  d 3

  e 4

  dtype: int32

  In [93]: # 查看索引

  In [94]: series.index

  Out[94]: Index(['a', 'b', 'c', 'd', 'e'], dtype='object')

  In [95]: series.values

  Out[95]: array([0, 1, 2, 3, 4])

  In [96]: series.reset_index()

  Out[96]:

  index 0

  0 a 0

  1 b 1

  2 c 2

  3 d 3

  4 e 4

  In [98]: series

  Out[98]:

  a 0

  b 1

  c 2

  d 3

  e 4

  dtype: int32

  In [99]: # 查看值序列

  In [100]: series.values

  Out[100]: array([0, 1, 2, 3, 4])

  In [101]: # 当drop中的值为True的时候将采用删除原索引,并不会对原数据进行修改,需要复制

  In [102]: series = series.reset_index(drop=True)

  In [103]: series

  Out[103]:

  0 0

  1 1

  2 2

  3 3

  4 4

  dtype: int32

  Series索引与切片

  series.[‘标签索引’]

  通过标签索引来取值

  series[‘索引’]

  通过下标索引来取值

  series.loc(标签索引)

  通过标签索引来取值

  series.iloc(索引)

  通过索引

  In [115]: # 通过标签来取值

  In [116]: series.loc['b']

  Out[116]: 1

  In [117]: # 通过索引下标来取值

  In [118]: series.iloc[1]

  Out[118]: 1

  采用神奇索引

  In [139]: series

  Out[139]:

  a 0

  b 1

  c 10

  d 3

  e 22

  dtype: int32

  In [141]: # 采用标签来取值

  In [142]: series[['a','e']]

  Out[142]:

  a 0

  e 22

  dtype: int32

  In [143]: # 采用索引取值

  In [144]: series[[0,-1]]

  Out[144]:

  a 0

  e 22

  dtype: int32

  Series修改值

  In [122]: series

  Out[122]:

  a 0

  b 1

  c 2

  d 3

  e 4

  dtype: int32

  通过索引来修改值

  series.iloc[2] = 10

  通过标签来修改值

  series.loc['e'] = 22

  In [139]: series

  Out[139]:

  a 0

  b 1

  c 10

  d 3

  e 22

  dtype: int32

  判断值是否存在

  in 并不是判断值,而是根据标签索引来判断

  Series运算

  共同索引对应运算,其他值填充为NaN

  Pandas会自动帮我们进行数据转换,当我们的数据类型为None时,会把数据替换为NaN

  当没用通过索引的时候,将全部变为NaN

  NaN与任何值计算都是NaN

  In [148]: data = pd.Series(data=[1,2,3,4,None],index=['a','b','c','d','e'])

  In [149]: data

  Out[149]:

  a 1.0

  b 2.0

  c 3.0

  d 4.0

  e NaN

  dtype: float64

  当进行对应标签索引进行相加的时候

  In [148]: data = pd.Series(data=[1,2,3,4,None],index=['a','b','c','d','e'])

  In [149]: data

  Out[149]:

  a 1.0

  b 2.0

  c 3.0

  d 4.0

  e NaN

  dtype: float64

  In [150]: data1 = pd.Series(data=[1,2,3,4,None],index=['a','b','c','d','e'])

  In [151]: data1

  Out[151]:

  a 1.0

  b 2.0

  c 3.0

  d 4.0

  e NaN

  dtype: float64

  In [152]: data + data1

  Out[152]:

  a 2.0

  b 4.0

  c 6.0

  d 8.0

  e NaN

  dtype: float64

  当对应的标签索引位置进行相加时

  当对应是索引的位置没有数值时,显示的数值为NaN

  In [148]: data = pd.Series(data=[1,2,3,4,None],index=['a','b','c','d','e'])

  In [153]: data2 = pd.Series(data=[1,2,3],index=['a','b','c'])

  In [156]: data

  Out[156]:

  a 1.0

  b 2.0

  c 3.0

  d 4.0

  e NaN

  dtype: float64

  In [157]: data2

  Out[157]:

  a 1

  b 2

  c 3

  dtype: int64

  In [158]: data + data2

  Out[158]:

  a 2.0

  b 4.0

  c 6.0

  d NaN

  e NaN

  dtype: float64

  当不对应的索引标签进行相加的时候

  当对应的索引标签不相同的时,显示的全部结果为NaN

  In [161]: data2 = pd.Series(data=[1,2,3],index=['a','b','c'])

  In [162]: data3 = pd.Series(data=[1,2,3,4],index=['d','e','f','g'])

  In [163]: data2

  Out[163]:

  a 1

  b 2

  c 3

  dtype: int64

  In [164]: data3

  Out[164]:

  d 1

  e 2

  f 3

  g 4

  dtype: int64

  In [165]: data2 + data3

  Out[165]:

  a NaN

  b NaN

  c NaN

  d NaN

  e NaN

  f NaN

  g NaN

  dtype: float64

到此,关于“Pandas的介绍及安装方法”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注编程网网站,小编会继续努力为大家带来更多实用的文章!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Pandas的介绍及安装方法

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Pandas的介绍及安装方法

这篇文章主要介绍“Pandas的介绍及安装方法”,在日常操作中,相信很多人在Pandas的介绍及安装方法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Pandas的介绍及安装方法”的疑惑有所帮助!接下来,请跟
2023-06-01

windows7字体安装方法介绍

windows7字体安装方法是什么,最先客户必须先下载字体文件,然后在我的电脑中进到字体文件夹,以后用户们将拷贝解压出来的字体文件,黏贴到字体文件夹中,就能够自动安装了,以后就能看到这个字体文件了,下面则是windows7字体安装方法介绍的
2023-07-13

Python之pandas库的安装及库安装方法小结

Pandas是一种开源的、易于使用的数据结构和Python编程语言的数据分析工具,它与Scikit-learn两个模块几乎提供了数据科学家所需的全部工具,今天通过本文给大家介绍Python之pandas库的安装及库安装方法小结,感兴趣的朋友跟随小编一起看看吧
2022-11-13

Python装饰器的介绍及使用方法

本篇内容主要讲解“Python装饰器的介绍及使用方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python装饰器的介绍及使用方法”吧!app = Flask(__name__) @app.r
2023-06-17

XpmJS的介绍以及安装过程

XpmJS的介绍以及安装过程,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。一、XpmJS 是啥XpmJS可以链接任何云端资源,为小程序、移动应用提供云资源通道和后端能力。降
2023-06-19

01.数据库的介绍及安装

MySQL理论1. 数据库数据:数据就是一种符号,记录人类认为有价值的东西,例如图片、视频、文字、表格等从计算机角度来看,就是二进制、16进制的文件数据库的分类:RDBMS:关系型数据库管理系统二维表结构,有清楚的行列结构,提供丰富的查询功能,高一致性,性能较
2020-08-29

MySQL Shell的介绍以及安装

01 ReplicaSet的架构 前面的文章中,我们说了ReplicaSet的基本概念和限制以及部署前的基本知识。今天我们来看InnoDB ReplicaSet部署过程中的两个重要组件之一的MySQL Shell,为了更好的理解My
2022-05-17

python pandas安装方法

python可以通过使用pip、使用conda、从源代码、使用IDE集成的包管理工具来安装pandas。详细介绍:1、使用pip,在终端或命令提示符中运行pip install pandas命令即可安装pandas;2、使用conda,在终
python pandas安装方法
2023-11-22

Pytorch中torchtext终极安装方法介绍

本篇文章和大家了解一下Pytorch中torchtext终极安装方法介绍。有一定的参考价值,有需要的朋友可以参考一下,希望对大家有所帮助。目录1.简介2.先说成功安装的方法3.常见的其他安装方式3.1 直接使用pip install tor
2023-07-06

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录