我的编程空间,编程开发者的网络收藏夹
学习永远不晚

我的Python分析成长之路10

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

我的Python分析成长之路10

matplot数据可视化基础

  制作提供信息的可视化(有时称作绘图)是数据分析中最重要任务之一。

1.图片(画布)与子图

    plt.figure :创建一张空白的图片,可以指定图片的大小、像素。

    figure.add_subplot:添加子图,可以指定子图的行数、列数和选中图片的编号。

    如果使用plt.subplots(),它创建了一张图片,然后返回包含了已生成子图对象的Numpy数组

    plt.subplots选型:

          nrow:子图的行数

          ncols:子图的列数

          sharex:所有子图使用相同的x轴刻度

          sharey:所有子图使用相同的y轴刻度

    

 1 import numpy as np
 2 import matplotlib.pyplot as plt
 3 plt.rcParams["font.sans-serif"] = "SimHei"  #设置中文显示
 4 plt.rcParams["axes.unicode_minus"] = False     #设置正常符号
 5 #没有子图的绘图
 6 x = np.arange(0,1,0.01)
 7 y = x**2
 8 y2 = x**4
 9 plt.plot(x,y)
10 plt.plot(x,y2)
11 plt.show()
12 #有子图的绘制方法
13 fig = plt.figure(figsize=(8,5))
14 ax1 = fig.add_subplot(2,1,1)
15 ax1.plot(x,y)
16 ax2 = fig.add_subplot(2,1,2)
17 ax2.plot(x,y2)
18 plt.show()
19 #用plt.subplots方法
20 fig,axes = plt.subplots(2,1,sharex=True)
21 axes[0].plot(x,y)
22 axes[1].plot(x,y2)
23 plt.show()

2.添加各类标签和图例的常用函数

    plt.title  为当前图形添加标题,可以指定标题的名称、位置、颜色、大小等参数

    plt.xlabel  为当前图形添加x轴名称,可以指定位置、颜色、大小等参数

    plt.ylabel:为当前图形添加y轴名称,可以指定位置、颜色、字体大小等参数

    plt.xlim:指定当前图形x轴的范围,只能确定一个数值区间,而无法使用字符串标识

    plt.ylim:指定当前图形y轴的范围,只能确定一个数值区间,而无法使用字符串标识

    plt. xticks:指定x轴数目与取值

    plt.yticks:指定y轴刻度的数目与取值

    plt.legend:根据当前图形的图例,可以指定图例的大小、位置、标签。

    plt.savefig("filename"):保存图片

    text/arrow/annote方法添加注释和文本

    

 1 import numpy as np
 2 import matplotlib.pyplot as plt
 3 plt.rcParams["font.sans-serif"] = "SimHei"
 4 plt.rcParams["axes.unicode_minus"] = False
 5 x = np.arange(0,1,0.01)
 6 y1 = x**2
 7 y2 = x**4
 8 plt.plot(x,y1,"g--")
 9 plt.plot(x,y2,"b-")  
10 plt.xlabel("x")  #设置x轴类标
11 plt.ylabel("y")  #设置y轴类标
12 plt.xlim([0,1])  #设置x范围
13 plt.ylim([0,1])    #设置y范围
14 plt.title("x**2和x**4函数")  #添加标题
15 plt.legend(["Y1","Y2"],loc="best")   #
16 plt.show()
View Code

3.设置pyplot的rc参数

     lines.linestyle:线条样式

      lines.linewidth:线条宽度

    lines.marker:线条上的点的形状

    lines.markersize:点的大小

4.分析特征间的相互关系

    1.柱状图:

        plot.bar():绘制垂直方向上的柱状图

        plot.barh():绘制水平方向上的柱状图

    

 
 1 import matplotlib.pyplot as plt
 2 import pandas as pd
 3 fig,axes = plt.subplots(2,1)
 4 data = pd.Series(np.random.rand(16),index=list("abcdefghijklmnop"))
 5 data.plot.bar(ax=axes[0],color='k')
 6 data.plot.barh(ax=axes[1],color="r")
 7 plt.show()
 8 df = pd.DataFrame(np.random.rand(6,4),index=["one","two","three","four","five","six"],
 9                   columns=pd.Index(["a","b","c","d"],name="Genus"))
10 df.plot.bar()
11 df.plot.barh(stacked=True)
12 plt.show()
View Code

    2.直方图和密度图:

        直方图是一种条形图,用于给出值频率的离散显示。数据被分隔成离散的,均匀间隔的箱,并且绘制每个箱中数据点的数量.一般用横轴表示        数据类型,用纵轴表示数量或者占比。

        plot.hist()

        密度图是一种与直方图相关的图表类型,它通过计算可能产生观测数据的连续概率分布估计而产生的。 密度图也称为内核密度估计图            (KED)

        plot.density()

        seabon.distplot()可以绘制直方图和连续密度估计

1 t seaborn as sns
2 import pandas as pd
3 import matplotlib.pyplot as plt
4 data1 = pd.Series(np.random.normal(0,1,size=200))
5 data2 = pd.Series(np.random.normal(10,2,size=200))
6 data3 = pd.Series(np.concatenate([data1,data2]))
7 # print(data3)
8 sns.distplot(data3,bins=100,color="k")
9 plt.show()
View Code

 

    3.散点图

        散点图,又称散点分布图,是一个以一个特征为横坐标,以另一个特征为纵坐标,利用坐标点的分布状态反映特征间的统计关系的一阵图         形。主要用于分析特征间的相互关系,散点图可以提供两类关键信息。1.特征之间是否存在数值或数量之间的关联趋势,关联趋势是线性           还是非线性的。2.如果从某一个点或者某几个点偏离大多数    点,则这些点就是离群值,从而分析这些离群值是否在建模分析中产生          很大的关系。散点图通过散点的疏密程度和变化趋势表示两个特征的数量关系。

    plt.scatter(x,y,s=None,c=None,marker=None)  c:代表颜色,marker:绘制点的类型

    seaborn.pairplot(data,diag_kind="kde",{“plot_kws”:0.2}) 可以支持在对角线上放置每个变量的直方图或密度估计图

    4.折线图

        折线图是一种将数据点按照顺序连接起来的图形。查看因变量y随自变量x改变的趋势,最适合于显示随时间而变化的连续数据.

        plt.plot()  

    5.饼图  

        饼图是将各项大小与各项总和的比例显示在一张“饼”上,以“饼”的大小确定所占的比例。

        plt.pie(x,explode,labels,autopct,octdistance,labeldistance,radius)

        explode:设定各项距离圆心n个半径

        label:饼图的标签

        autupct:指定数值的显示方式

    6.箱型图

        箱型图也称箱须图,其绘制需要常用的统计量,能提供有关数据位置和分散情况的关键信息,尤其在比较不同特征时,更可表现其分散程度         差异。箱型图利用数据中的5个统计量(最小值、下四分位数、中位数、上四分位数、和最大值)来描述数据。

        plt.boxplot(x,menline) meanline:是否显示中值

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

我的Python分析成长之路10

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

我的Python分析成长之路10

matplot数据可视化基础  制作提供信息的可视化(有时称作绘图)是数据分析中最重要任务之一。1.图片(画布)与子图    plt.figure :创建一张空白的图片,可以指定图片的大小、像素。    figure.add_subplot
2023-01-30

我的Python分析成长之路3

一 集合                                                                                                                    
2023-01-30

我的Python分析成长之路8

Numpy数值计算基础  Numpy:是Numerical Python的简称,它是目前Python数值计算中最为基础的工具包,Numpy是用于数值科学计算的基础模块,不但能够完成科学计算的任而且能够用作高效的多维数据容器,可用于存储和处理
2023-01-30

我的Python分析成长之路7

类一、编程范式:       1.函数式编程   def       2.面向过程编程   (Procedural Programming)        基本设计思路就是程序一开始是要着手解决一个大的问题,然后把一个大问题分解成很多个小问
2023-01-30

我的Python分析成长之路9

pandas入门统计分析是数据分析的重要组成部分,它几乎贯穿整个数据分析的流程。运用统计方法,将定量与定性结合,进行的研究活动叫做统计分析。而pandas是统计分析的重要库。1.pandas数据结构    在pandas中,有两个常用的数据
2023-01-30

我的Python成长之路—03

1.文件管理 <1>查看文件信息:ls ls是英文单词list的简写,其功能为列出目录的内容,是用户最常用的命令之一,它类似于DOS下的dir命令。 Linux文件或者目录名称最长可以有265个字符,“.”
2023-01-31

Python成长之路第二篇(3)_字典的

字典的置函数用法(字典dict字典中的key不可以重复)class dict(object):"""dict() -> new empty dictionarydict(mapping) -> new dictionary initiali
2023-01-31

Python数据分析:数据驱动成功之路

数据分析是信息时代的关键技能,而 Python 已成为数据分析领域不可或缺的工具。Python 提供了广泛的库和工具,使数据探索、建模和可视化变得容易,为数据驱动决策和成功铺平了道路。
Python数据分析:数据驱动成功之路
2024-02-17

如何进行Python数据分析?正确的“入门之路”三部曲!

Python是一种面向对象、直译式计算机程序设计语言,由于他简单、易学、免费开源、可移植性、可扩展性等特点,Python又被称之为胶水语言。下图为主要程序语言近年来的流行趋势,Python受欢迎程度扶摇直上。由于Python拥有非常丰富的库
2023-06-05

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录