我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Seaborn数据分析NBA球员信息数据集

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Seaborn数据分析NBA球员信息数据集

本案例使用 Jupyter Notebook进行案例演示,数据集为NBA球员信息数据集。本项目将进行完整的数据分析演示。

1. 数据介绍

  • 数据集共有342个球员样本,38个特征,即342行×38列。
  • 数据集主要信息如下表所示:
球员姓名位置身高体重年龄球龄上场次数场均时间进攻能力防守能力是否入选过全明星球员薪金
  • 本数据集主要可以用来做数据处理以及数据挖掘,进行数据可视化。
  • 本小结,我们将对NBA球员数据集进行初步统计学分析,并且绘制出相关性热力图。

2. 案例演示

2.1 获取数据

导入相关库,并使用如下代码进行本地数据集获取。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# 获取数据集
NBA = pd.read_csv("nba_2017_nba_players_with_salary.csv")
NBA.head()

运行结果:

2.2 查看数据基本信息

先进行简单的统计学分析,查看标准差、中位数、方差等等信息。

# 看一下数据有多少
NBA.shape
# 查看基本统计信息
NBA.describe()

部分运行结果:

2.3 数据分析

2.3.1 效率值相关性分析

在众多数据中,有一项名为RPM,表示球员的效率值。该数据反映球员在场时对球队比赛获胜的贡献大小,最能反映球员的综合实力。我们可以看一下它与其他数据的相关性。

首先,我们取出几个有用的特征分析相关性,并绘制热力图。

# 2. 数据分析
## 2.1 效率值相关性分析
NBA_1 = NBA.loc[:, ['RPM','AGE','SALARY_MILLIONS','ORB','DRB','TRB','AST','AST','STL','BLK','TOV','PF','POINTS','GP','MPG','ORPM','DRPM']]
NBA_1.head()

然后,使用如下代码计算出相关性表。

# 计算相关性
# 获取两列之间的相关性
corr = NBA_1.corr()
corr

部分运行结果如下图所示:

最后,使用刚才的相关性表,绘制出相关性关系热力图

# 调用热力图绘制相关性关系
plt.figure(figsize=(20,20),dpi=120)
sns.heatmap(corr, square=True, linewidths=0.1, annot=True)
# 保存图像
plt.savefig("./test.png")
# 颜色越深:相关性越弱
# 颜色越浅:相关性越强

运行结果如下图所示:

以上就是Seaborn数据分析NBA球员信息数据集的详细内容,更多关于Seaborn数据分析的资料请关注编程网其它相关文章!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Seaborn数据分析NBA球员信息数据集

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

如何用Python命令观看 NBA 比分直播及球员数据

今天就跟大家聊聊有关如何用Python命令观看 NBA 比分直播及球员数据,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。NBAsh 是一款基于 Python3 的命令行工具,它用来观
2023-06-16

阿里云如何采集数据库信息和数据

在数字化转型的大潮中,企业对于数据的需求越来越大,而数据库作为数据的核心载体,其信息和数据的采集与管理就显得尤为重要。本文将详细阐述阿里云如何采集数据库信息和数据。一、阿里云采集数据库信息和数据的基本原理阿里云采集数据库信息和数据的基本原理是通过数据库的API接口进行数据的采集和管理。首先,需要在阿里云上创建一个
阿里云如何采集数据库信息和数据
2023-12-12

Python数据分析案例合集

案例一、利用税务数据分析美国人群收入情况
2023-01-31

VB.NET数据集的示例分析

这篇文章将为大家详细讲解有关VB.NET数据集的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。1.基本概念VB.NET数据集是一种离线了的缓存存储数据,它的结构和数据库一样,具有表格、行、列的一种
2023-06-17

Oracle Index函数与数据库的统计信息收集

Oracle Index 函数和数据库的统计信息收集是两个不同的概念,但它们之间存在一定的联系。Oracle Index 函数是用来创建索引、管理索引和优化查询性能的功能。索引是一种数据结构,可以加快数据库查询的速度。当数据库表中的数据量
Oracle Index函数与数据库的统计信息收集
2024-08-15

TensorFlow中数据类型信息及转换的示例分析

这篇文章主要介绍了TensorFlow中数据类型信息及转换的示例分析,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。一、数据类型在tf中,数据类型有整型(默认是int32),浮
2023-06-25

2021下半年信息处理技术员高频考点:信息与数据

  为帮助大家备考2021下半年信息处理技术员考试,今天编程学习网小编为大家整理了2021下半年信息处理技术员高频考点:信息与数据,希望对大家备考会有帮助。  考点1.信息与数据(★★★★)  【考法分析】  1、围绕信息和数据的相关概念,一般是给一段描述,判断描述的正确性。  2、考查信息的特征、 世界三大资源等知识。 
2021下半年信息处理技术员高频考点:信息与数据
2024-04-19

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录