我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Python 数据可视化

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Python 数据可视化

Python提供了多个用于数据可视化的工具和库。其中最常用的包括:

1. Matplotlib:Matplotlib 是一个用于绘制二维图形的 Python 库。它提供了广泛的绘图选项,可以帮助您创建线图、散点图、柱状图、饼图、等高线图、3D 图形等。

2. Seaborn:Seaborn 是基于 Matplotlib 的图形可视化库,它主要用于绘制统计分析结果的图表和数据集。相比于 matplotlib 包,seaborn 包提供了更为美观、更为精美的可视化效果。

3. Plotly:Plotly 是一个交互式数据可视化库,在数据科学领域十分受欢迎。它支持大量的 2D/3D 图表类型,并且具备强大的交互元素如缩放、平移、悬停等等。

4. Bokeh:Bokeh 是一个面向现代网页的交互式可视化工具。它支持多种语言(Python、R 和 Julia)并非常适用于大规模数据集的可视化展示。

5. Pandas data visualization:Pandas 数据可视化是 Pandas 库内置的一种数据可视化工具,它可以促使你通过 DataFrames 和 Series 数据结构,快速生成多样性的图表。 

这些库和工具都有不同的功能和应用场景,可以根据具体需求选择合适的工具进行数据可视化。

下面是一些使用不同库进行数据可视化的示例:

1. Matplotlib:用 Matplotlib 绘制折线图、散点图和柱状图。```pythonimport matplotlib.pyplot as pltimport numpy as np# 折线图x = np.arange(0, 10, 0.1)y = np.sin(x)plt.plot(x, y)plt.show()# 散点图x = np.random.rand(50)y = np.random.rand(50)colors = np.random.rand(50)plt.scatter(x, y, c=colors)plt.show()# 柱状图 x = ['A', 'B', 'C', 'D']y = [3, 8, 1, 10]plt.bar(x, y)plt.show()```2. Seaborn:在 Seaborn 中绘制散点图和直方图。```pythonimport seaborn as snsimport numpy as np# 散点图x = np.random.normal(size=100)y = np.random.normal(size=100)sns.scatterplot(x=x, y=y)plt.show()# 直方图data = np.random.normal(size=100)sns.histplot(data=data, kde=True)plt.show()```3. Plotly:用 Plotly 绘制交互式热力图和二维散点图。```pythonimport plotly.express as pximport numpy as np# 热力图z = np.random.rand(10, 10)fig = px.imshow(z, color_continuous_scale='OrRd')fig.show()# 二维散点图x = np.random.rand(50)y = np.random.rand(50)colors = np.random.rand(50)fig = px.scatter(x=x, y=y, color=colors)fig.show()```4. Bokeh:用 Bokeh 绘制交互式时序数据图。```pythonfrom bokeh.plotting import figure, output_file, showimport pandas as pd# 读取数据data = pd.read_csv('temperature_data.csv')x = pd.to_datetime(data['datetime'])y = data['temperature']# 绘制曲线output_file('temp_plot.html')p = figure(title="Temperature Data", x_axis_label='Time', y_axis_label='Temperature')p.line(x, y)show(p)```5. Pandas 数据可视化:对 Pandas 的 Series 和 DataFrame 对象直接调用 `plot()` 函数即可绘制不同类型的图表,如折线图、散点图、柱状图、饼图等。下面以折线图为例:```pythonimport pandas as pdimport numpy as np# 创建 Series 对象dates = pd.date_range(start='20210101', end='20210110', periods=10)ts = pd.Series(np.random.randn(10), index=dates)# 绘制折线图ts.plot()```

Example 1 :散点图、密度图(Python)

import numpy as npimport matplotlib.pyplot as plt# 创建随机数n = 100000x = np.random.randn(n)y = (1.5 * x) + np.random.randn(n)fig1 = plt.figure()plt.plot(x,y,'.r')plt.xlabel('x')plt.ylabel('y')plt.savefig('2D_1V1.png',dpi=600)nbins = 200H, xedges, yedges = np.histogram2d(x,y,bins=nbins)# H needs to be rotated and flippedH = np.rot90(H)H = np.flipud(H)# 将 zeros maskHmasked = np.ma.masked_where(H==0,H)# Plot 2D histogram using pcolorfig2 = plt.figure()plt.pcolormesh(xedges,yedges,Hmasked)plt.xlabel('x')plt.ylabel('y')cbar = plt.colorbar()cbar.ax.set_ylabel('Counts')plt.savefig('2D_2V1.png',dpi=600)plt.show()

这段代码的主要作用是生成 2D 直方图,帮助我们可视化数据集中的情况。

首先,使用 `numpy.random.randn()` 函数生成一个包含100,000个元素的随机数数组 x,并由 y = (1.5 * x) + np.random.randn(n) 计算出相应的 y 值,在 plt.plot(x,y,'.r') 中绘制二维散点图。

接着,使用 `numpy.histogram2d()` 函数将数据划分到网格中,并且根据各网格内数据的计数绘制颜色不同的矩形。该函数返回三个值,分别是 H(计数)、xedges(每一列的边界)和 yedges(每一行的边界)。

再之后,在 H 非 0 的区域打上背景遮罩,并通过 `pcolormesh()` 函数把这些区域的计数对应于不同颜色的矩形来展示直方图。

最后,增加了一些标签、轴、颜色线条等细节,并使用 `plt.savefig()` 函数将图片保存为文件。

该代码可以用于描述任何包含两个变量的数据集,以适合于在图像上显示数据的形式呈现它们。

 

Example 2 :双 Y 轴(Python)

import csvimport pandas as pdimport matplotlib.pyplot as pltfrom datetime import datetimedata=pd.read_csv('LOBO0010-2020112014010.tsv',sep='\t')time=data['date [AST]']sal=data['salinity']tem=data['temperature [C]']print(sal)DAT = []for row in time:DAT.append(datetime.strptime(row,"%Y-%m-%d %H:%M:%S"))#create figurefig, ax =plt.subplots(1)# Plot y1 vs x in blue on the left vertical axis.plt.xlabel("Date [AST]")plt.ylabel("Temperature [C]", color="b")plt.tick_params(axis="y", labelcolor="b")plt.plot(DAT, tem, "b-", linewidth=1)plt.title("Temperature and Salinity from LOBO (Halifax, Canada)")fig.autofmt_xdate(rotation=50)# Plot y2 vs x in red on the right vertical axis.plt.twinx()plt.ylabel("Salinity", color="r")plt.tick_params(axis="y", labelcolor="r")plt.plot(DAT, sal, "r-", linewidth=1)#To save your graphplt.savefig('saltandtemp_V1.png' ,bbox_inches='tight')plt.show()Example 3:拟合曲线(Python)import csvimport numpy as npimport pandas as pdfrom datetime import datetimeimport matplotlib.pyplot as pltimport scipy.signal as signaldata=pd.read_csv('LOBO0010-20201122130720.tsv',sep='\t')time=data['date [AST]']temp=data['temperature [C]']datestart = datetime.strptime(time[1],"%Y-%m-%d %H:%M:%S")DATE,decday = [],[]for row in time:daterow = datetime.strptime(row,"%Y-%m-%d %H:%M:%S")DATE.append(daterow)decday.append((daterow-datestart).total_seconds()/(3600*24))# First, design the Buterworth filterN= 2# Filter orderWn = 0.01 # Cutoff frequencyB, A = signal.butter(N, Wn, output='ba')# Second, apply the filtertempf = signal.filtfilt(B,A, temp)# Make plotsfig = plt.figure()ax1 = fig.add_subplot(211)plt.plot(decday,temp, 'b-')plt.plot(decday,tempf, 'r-',linewidth=2)plt.ylabel("Temperature (oC)")plt.legend(['Original','Filtered'])plt.title("Temperature from LOBO (Halifax, Canada)")ax1.axes.get_xaxis().set_visible(False)ax1 = fig.add_subplot(212)plt.plot(decday,temp-tempf, 'b-')plt.ylabel("Temperature (oC)")plt.xlabel("Date")plt.legend(['Residuals'])plt.savefig('tem_signal_filtering_plot.png', bbox_inches='tight')plt.show()

代码块主要是使用 Python 实现了一个数字信号处理的过程,是针对来自 LOBO0010-20201122130720.tsv 数据集的处理。

该代码块的任务是进行高斯滤波(Butterworth Filter)处理并拟合曲线,并通过可视化的方式呈现出原始数据和经过滤波处理后的信号及其差异。具体来说,使用 scipy.signal.butter() 函数设计滤波器、应用高斯滤波,然后使用 matplotlib.pyplot.plot() 函数画出图像。此外,还使用 matplotlib.pyplot.legend() 等函数为图形添加标签和文字说明。

最后,使用 matplotlib.pyplot.savefig() 函数将生成的图像保存到本地磁盘,并使用 matplotlib.pyplot.show() 函数展示可视化结果。

Example 3:拟合曲线(Python)

import csvimport numpy as npimport pandas as pdfrom datetime import datetimeimport matplotlib.pyplot as pltimport scipy.signal as signaldata=pd.read_csv('LOBO0010-20201122130720.tsv',sep='\t')time=data['date [AST]']temp=data['temperature [C]']datestart = datetime.strptime(time[1],"%Y-%m-%d %H:%M:%S")DATE,decday = [],[]for row in time:daterow = datetime.strptime(row,"%Y-%m-%d %H:%M:%S")DATE.append(daterow)decday.append((daterow-datestart).total_seconds()/(3600*24))# First, design the Buterworth filterN= 2# Filter orderWn = 0.01 # Cutoff frequencyB, A = signal.butter(N, Wn, output='ba')# Second, apply the filtertempf = signal.filtfilt(B,A, temp)# Make plotsfig = plt.figure()ax1 = fig.add_subplot(211)plt.plot(decday,temp, 'b-')plt.plot(decday,tempf, 'r-',linewidth=2)plt.ylabel("Temperature (oC)")plt.legend(['Original','Filtered'])plt.title("Temperature from LOBO (Halifax, Canada)")ax1.axes.get_xaxis().set_visible(False)ax1 = fig.add_subplot(212)plt.plot(decday,temp-tempf, 'b-')plt.ylabel("Temperature (oC)")plt.xlabel("Date")plt.legend(['Residuals'])plt.savefig('tem_signal_filtering_plot.png', bbox_inches='tight')plt.show()

这段代码主要是针对来自 LOBO0010-20201122130720.tsv 数据集的处理。它的主要任务是使用 Butterworth 滤波器进行数字信号处理,即对温度数据进行滤波处理,并通过可视化的方式呈现出原始数据和经过滤波处理后的信号及其差异。

首先,根据所给的 tsv 文件,我们使用 `pandas.read_csv()` 函数读取 csv 文件并将其加载到 data 存储库中。然后,使用 `datetime.strptime()` 函数来从 data 中获取时间戳。接着,创建一个时间序列,用于绘制 X 轴(每个时刻距离第一个时刻的秒数)。

然后,定义了 Buterworth 滤波器的阶数 N 和截止频率 Wn,并使用 `scipy.signal.butter()` 函数来设计(设计)滤波器。在设计完毕后,使用 `scipy.signal.filtfilt()` 函数应用该滤波器对原始数据 temp 进行滤波,得到滤波后的结果 tempf。

最后,使用 `plt.plot()` 绘制两个子图,分别表示原始温度数据、滤波后的温度数据和它们之间的差异(残差)。使用 `plt.savefig()` 函数将生成的图像保存到本地磁盘,并使用 `matplotlib.pyplot.show()` 函数展示可视化结果。

 

Example 4:三维地形(Python)

# This import registers the 3D projectionfrom mpl_toolkits.mplot3d import Axes3Dfrom matplotlib import cbookfrom matplotlib import cmfrom matplotlib.colors import LightSourceimport matplotlib.pyplot as pltimport numpy as npfilename=cbook.get_sample_data('jacksboro_fault_dem.npz',asfileobj=False)with np.load(filename) as dem:z = dem['elevation']nrows, ncols = z.shapex = np.linspace(dem['xmin'], dem['xmax'], ncols)y = np.linspace(dem['ymin'], dem['ymax'], nrows)x, y = np.meshgrid(x, y)region = np.s_[5:50, 5:50]x, y, z = x[region], y[region], z[region]fig, ax = plt.subplots(subplot_kw=dict(projection='3d'))ls = LightSource(270, 45)rgb = ls.shade(z, cmap=cm.gist_earth, vert_exag=0.1, blend_mode='soft')surf = ax.plot_surface(x, y, z, rstride=1, cstride=1, facecolors=rgb,linewidth=0, antialiased=False, shade=False)plt.savefig('example4.png',dpi=600, bbox_inches='tight')plt.show()

这段代码主要使用 Matplotlib 库中的模块 `Axes3D` 来创建和处理 3D 图形。其任务是将样本数据集 jacksboro_fault_dem.npz 中的地理高度(即该点距离海平面的高度)制成 3D 表面图。

首先,导入所需模块和库并读取数据。然后,选择特定区域进行绘制,即选区 region 为左上角为(5,5),右下角为(50,50) 的区域。接下来,使用 LightSource 函数实现 3D 图形的渲染,其中的参数 elevation 是数据集的高程信息,cmap 参数表示图像的颜色映射,vert_exag 参数表示图像的垂直高度系数。最后,使用 `plot_surface()` 函数画出 3D 表面图,并使用 `savefig()` 函数将生成的图像保存到本地磁盘,并使用 `show()` 函数展示可视化结果。

需要注意的是,在此过程中,也需要对 x、y 和 z 坐标进行网格化和重采样以制作 3D 表面图。

来源地址:https://blog.csdn.net/shaozheng0503/article/details/131027184

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Python 数据可视化

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Python数据可视化

相信最后大家阅读完毕本篇文章,肯定学到了不少知识吧?其实大家私下还得多多自学,当然如果大家还想了解更多方面的详细内容的话呢,不妨关注编程学习网教育平台,在这个学习知识的天堂中,您肯定会有意想不到的收获的!
Python数据可视化
2024-04-23

python数据可视化

1、安装matplotlib在 cmd 中键入 python -m pip install matplotlib,系统将自动安装,需要等一段时间,待完成后 python -m pip list ,显示敲黑板划重点:一定通过 cdm 指定具体
2023-01-30

Python数据可视化详解

数据可视化是一种将庞杂抽象的数据转化为直观易懂的图形的数据呈现技术,它能帮助我们快速把握数据的分布和规律,更加轻松地理解和探索信息,本文通过代码图片详细介绍了Python数据可视化,感兴趣的小伙伴可以参考阅读
2023-05-16

Python数据可视化库-Matplot

我们接着上次的继续讲解,先讲一个概念,叫子图的概念。我们先看一下这段代码import matplotlib.pyplot as pltfig = plt.figure()ax1 = fig.add_subplot(3,2,1)ax2 = f
2023-01-31

Python数据可视化的方法

这篇“Python数据可视化的方法”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Python数据可视化的方法”文章吧。一、数
2023-06-30

python数据可视化怎么做

通过使用 python 库(numpy、pandas、matplotlib),可以实现数据可视化。具体步骤包括:数据准备:导入库、加载数据、处理数据。选择可视化类型:根据数据和需要传达的信息,选择合适的图表类型。创建可视化对象:使用 mat
python数据可视化怎么做
2024-05-22

Python 数据可视化神器—Pyecharts

能否在 Python 中也能用到 Echarts 的功能呢?寻找中惊喜地发现了 pyecharts,只需在python中安装该模块即可使用。

Python数据可视化举例分析

这篇文章主要介绍“Python数据可视化举例分析”,在日常操作中,相信很多人在Python数据可视化举例分析问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python数据可视化举例分析”的疑惑有所帮助!接下来
2023-06-16

Python有哪些数据可视化库

今天就跟大家聊聊有关Python有哪些数据可视化库,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。1、Matplotlib是Python中众多数据可视化库的鼻祖,其设计风格与20世纪8
2023-06-15

Top 5 Python 数据可视化技术

掌握下面这五种高级可视化图表将使数据可视化变得容易。这些库互为补充,以最大化数据表达。

Python数据可视化库有哪些

这篇文章主要介绍“Python数据可视化库有哪些”,在日常操作中,相信很多人在Python数据可视化库有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python数据可视化库有哪些”的疑惑有所帮助!接下来
2023-06-02

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录