我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Python高级数据分析之pandas和matplotlib绘图

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Python高级数据分析之pandas和matplotlib绘图

一、matplotlib 库

一个用来绘图的库

import matplotlib.pyplot as plt

1)plt.imread(“图片路径”)

功能: 将图片加载后返回一个维数组

>>> jin = plt.imread("./jin.png")
>>> jin
array([[[0.24313726, 0.24313726, 0.24705882],        
        ...,

        [0.7294118 , 0.7294118 , 0.7294118 ]]], dtype=float32)

>>> jin.shpae
(273, 411, 3)
'''
这是一个三维数组
第一层代表将图片分成273行,
第二层代表将图片的第一层的每一行分为411列,
第三层代表将每一像素点中的(R,G,B)

注意:有些图片加载后最内层有4个元素,分别是(R,G,B,A[阿尔法/透明度])

'''

2)plt.imshow(ndarray)显示图片

功能: 将多维数组渲染为一张图片

>>> plt.imshow(nd)  #将加载后的多维数组传入就可以将图片渲染出来
'''
有的图片加载出来之后数据范围在0-255之间的需要将数据/255之后转化为0-1之间的就可以和0-1的图片进行合并操作
'''

这里就可以将图片进行处理(反转,拉伸,改色)等操作

3)plt.imsave(ndarray)保存图片

plt.imsave(ndarray)

默认保存到当前路径

plt.imsave('图片名称.png',图片数据,cmap='gray')    #保存图片
cmap:将图片保存为黑白图片

二、Pandas绘图

1.绘制简单的线型图

1.1)简单的Series图表示例 .plot()

绘制正弦曲线

# 正弦曲线
x = np.linspace(0,2*np.pi,100)      # 从0 到 2π  取100份
y = np.sin(x)                       # y 为sin(x) 的值
s = Series(data=y,index=x)          # 构建一个Series对象
s.plot()                  # 使用Series的plot()方法

1.2) 两个Series绘制的曲线可以叠加

2)简单的DataFrame图表示例 .plot()

绘制余弦曲线

x = np.linspace(0,2*np.pi,100)          # 从0 到 2π  取100份
df = DataFrame(data={'sin':np.sin(x),'cos':np.cos(x)},index=x)   #创建DataFrame对象
df.plot()

2.数据驱动的线型图(分析苹果股票)

导包

import numpy as np
import pandas as pd
from pandas import Series,DataFrame

1.读取数据

读取文件AAPL.csv

df = pd.read_csv('./data/AAPL.csv')
df.head()

2.检查数据类型

df.dtypes

Date          object       #时间的数据类型为对象,在使用中需要做处理
Open         float64
High         float64
Low          float64
Close        float64
Adj Close    float64
Volume       float64
dtype: object

3.将’Date’这行数据转换为时间数据类型

pd.to_datetime(Series对象)

功能: 将Series转换为时间数据类型

df['Date']  # 这一列获取出来是一个Series
type(df['Date'])
df['Date'] = pd.to_datetime(df['Date'])

df.dtypes

Date         datetime64[ns]  #此时已经是时间类型的数据了
Open                float64
High                float64
Low                 float64
Close               float64
Adj Close           float64
Volume              float64
dtype: object

4.将’Date’设置为行索引

df.set_index('Date',inplace=True)
'''
inplace:改变原来的变量的值
'''

5.绘制图形,以字段Adj Close(已调整收盘价格)为数据绘制

df['Adj Close'].plot()

3.绘制简单的柱状图

1) Series柱状图示例,kind = ‘bar’/’barh’

随机产生5个数,对其绘制纵向柱状图

'''
data:  生成之后为Y轴的数据
index: 生成之后为X轴的索引
'''
s = Series(data=np.random.randint(0,10,size=5),index=list('abcde'))  #随机产生5个数
s.plot(kind='bar')

随机产生5个数,对其绘制横向柱状图

'''
data:  生成之后为Y轴的数据
index: 生成之后为X轴的索引
'''
s = Series(data=np.random.randint(0,10,size=5),index=list('abcde'))  
s.plot(kind='barh')

2) DataFrame柱状图示例

随机产生一个二维数组,并绘制纵向(kind=’bar’)柱状图

'''
index: 生成数据X轴的索引
columns: 特征的名称
'''
df = DataFrame(np.random.randint(0,10,size=(8,4)),index=list('abcdefgh'),columns=list('ABCD'))
df.plot(kind='bar')

随机产生一个二维数组,并绘制横向(kind=’barh’)柱状图

4.绘制简单的直方图

直方图
直方图(Histogram)又称质量分布图。是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型,纵轴表示分布情况。

s = Series(np.random.normal(loc=0,scale=5,size=10000))    # normal 正态分布
s.hist()
#这里模拟出一组以0为中心,标准差为5的正态分布数据, 绘制出的直方图如下

5.绘制简单的核密度(“ked”)图

核心密度估计:对分布的图进行估计核心

我们继续使用刚刚直方图的 Series的正态分布数据

Series(np.random.normal(loc=0,scale=5,size=10000))    
s.plot(kind='kde')

直方图一般和核密度图常常被画在一起,既展示出频率,又展示出了概率

有两组数组,我们将这两组数据连接成为一个。

分析这组新数据

ndarr1 = np.random.normal(loc=-10,scale=5,size=5000)  #第一组数据
ndarr2 = np.random.normal(loc=15,scale=2,size=5000)  第二组数据
ndarr = np.concatenate([ndarr1,ndarr2])   #将两组数据合为一组
s = Series(ndarr)    #生成Series对象
s.plot(kind='kde')  # 核心 密度 估计 用来展示某个位置出现内容的概率的估计值
s.hist(density=True)  # density表示直方图也以 密度概率的值来展示  hist用来展示某个位置出现内容的实际频率
#展示效果如下
'''
s.plot(kind='kde')  展示某个位置的估计值
s.hist(density=True)  表示某个位置出现内容的实际频率
'''

6.绘制简单的散点图

散布图是观察两个一维数据数列之间的关系的有效方法

示例数据

df = DataFrame(np.random.randint(0,150,size=(20,3)),columns=['python','math','eng'])
df   #模拟一个DataFrame数据,列名为'python','math','eng'

    python  math    eng
0   141     41      55
1   37      76      96
2   61      28      135
。。。
17  124     103     83
18  86      47      44
19  35      85      85

将这组数据生成散点图

df.plot(kind='scatter',x='python',y='eng')
# kind = 'scatter'  , 给明标签columns

这样其实是没有什么实际的意义的

现在我们再加一列和“python”相关的数据

np.random.randint(-10,10,1)[0]   # 0-10之间 随机取一个数
df['php'] = df['python'].map(lambda x: x*0.9+np.random.randint(-10,10,1)[0])
df

    python  math    eng php
0   121     67      15  113.9
1   148     33      149 123.2
。。。
18  79      77      108 74.1
19  105     107     53  102.5

我们从数据是很难看出来python和php有什么关系

这时我们就可以用散点图来绘制出观察

可以看出有python的值增大,php的值也会增大。

总结

到此这篇关于Python高级数据分析之pandas和matplotlib绘图的文章就介绍到这了,更多相关Python pandas和matplotlib绘图内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Python高级数据分析之pandas和matplotlib绘图

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

python之matplotlib和pandas绘图的操作

这篇文章主要介绍python之matplotlib和pandas绘图的操作,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!python可以做什么Python是一种编程语言,内置了许多有效的工具,Python几乎无所不能
2023-06-07

Python数据分析之怎么用Matplotlib绘制饼图

这篇文章主要介绍“Python数据分析之怎么用Matplotlib绘制饼图”,在日常操作中,相信很多人在Python数据分析之怎么用Matplotlib绘制饼图问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”P
2023-06-30

Python数据分析之绘图和可视化详解

一、前言 matplotlib是一个用于创建出版质量图表的桌面绘图包(主要是2D方面)。该项目是由John Hunter于2002年启动的,其目的是为Python构建一个MATLAB式的绘图接口。matplotlib和IPython社区进行
2022-06-02

Python数据分析之绘图和可视化的示例分析

小编给大家分享一下Python数据分析之绘图和可视化的示例分析,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!一、前言matplotlib是一个用于创建出版质量图表
2023-06-15

Python数据分析之Matplotlib 3D图怎么实现

这篇文章主要讲解了“Python数据分析之Matplotlib 3D图怎么实现”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python数据分析之Matplotlib 3D图怎么实现”吧!M
2023-06-30

python数据分析之pandas数据选

Pandas是作为Python数据分析著名的工具包,提供了多种数据选取的方法,方便实用。本文主要介绍Pandas的几种数据选取的方法。  Pandas中,数据主要保存为Dataframe和Series是数据结构,这两种数据结构数据选取的方式
2023-01-30

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录