我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Pandas函数有哪些

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Pandas函数有哪些

本篇内容介绍了“Pandas函数有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

1.安装

如果想自己运行这些示例,请从Kaggle下载Anime推荐数据集,将其解压缩并放入与jupyter notebook相同的文件夹中。

接下来运行这些指令,应该能重复得出以下任一函数的结果。

import pandas as pd import numpy as npanime =pd.read_csv('anime-recommendations-database/anime.csv') rating = pd.read_csv('anime-recommendations-database/rating.csv')anime_modified= anime.set_index('name')

2.输入

输入CSV(逗号分隔值)

将CSV直接转换为数据框。有时CSV载入数据还需要指定一种编码(即:encoding='ISO-8859–1')。如果数据框包含不可读的字符,应首先尝试上述方法。

对于表格文件,存在一个叫做pd.read_excel的类似函数。

anime =pd.read_csv('anime-recommendations-database/anime.csv')

Pandas函数有哪些

根据输入数据构建数据框

这在手动示例化简单数据时十分有用,方便查看这些数据运行时如何变化。

df = pd.DataFrame([[1,'Bob','Builder'],                   [2,'Sally', 'Baker'],                   [3,'Scott', 'CandleStick Maker']], columns=['id','name', 'occupation'])

Pandas函数有哪些

df.head()

复制数据框

想保留原始副本同时对数据框进行更改,复制数据框很有用。在输入数据框后立即对其进行复制是很好的做法。

anime_copy =anime.copy(deep=True)
Pandas函数有哪些

3.查看和检验

获取顶部或底部的n项记录

显示数据框中的前n项记录。笔者通常在notebook中的某个位置打印数据框的顶部记录,以便在忘记其中的内容时可以返回来参考。

anime.head(3) rating.tail(1)
Pandas函数有哪些
Pandas函数有哪些

计算行数

这本身不是pandas函数,而是len()函数对行进行计数,并将其保存到变量中,在其他地方使用。

len(df) #=> 3

计算唯一行

计算一列中的唯一值。

len(ratings['user_id'].unique())

获取数据框信息

对于获取一些常规信息(如标题、值的数量和按列的数据类型)很有用。df.dtypes是一个类似但实用性低的函数,仅提供列数据类型。

anime.info()
Pandas函数有哪些

获取统计数据

如果数据框具有很多数值,获取统计数据非常有用。了解评级列的平均值,最小值和最大值,可以大致了解数据框。

anime.describe()
Pandas函数有哪些

获取值总和

获取特定列的值总和。

anime.type.value_counts()
Pandas函数有哪些

4.输出

保存为CSV格式

这将转储到与notebook相同的目录。笔者只保存下面的前10行,但读者不需要这样做。同样,也可使用df.to_excel()  函数,将表格文件保存为CSV格式。

rating[:10].to_csv('saved_ratings.csv',index=False)

5.选取

获取列的值清单或一系列值。

需要将列中的值放入X和y变量中以适应机器学习模型时,此方法有效。

anime['genre'].tolist() anime['genre']
Pandas函数有哪些
anime[‘genre’].tolist()
Pandas函数有哪些
anime[‘genre’]

获取索引值列表

通过索引创建数值列表。请注意,这里使用了anime_modified数据框,因为索引值更加有趣。

anime_modified.index.tolist()

Pandas函数有哪些

获取列值列表

anime.columns.tolist()

Pandas函数有哪些

6.添加/删除

用设置值附加新列

偶尔,当测试集和训练集在两个单独的数据框中,并想在组合它们之前分别标记出行与集的对应关系时,笔者会这样做。

anime['train set'] = True

从一部分列中创建新的数据框

此方法用于只想保留巨型数据框中的几列并且不想指定删除列时。

anime[['name','episodes']]
Pandas函数有哪些

删除指定列

删除指定列用于仅需删除几列时。否则,写出全部内容可能会很乏味,笔者更喜欢前者,删除指定列。

anime.drop(['anime_id', 'genre','members'], axis=1).head()
Pandas函数有哪些

添加其他行总和的一行

因其更易于查看,故在此处手动创建一个小型数据框。这里的有趣之处在于,df.sum(axis=0)将值添加到各行或各列中。

计算总和或平均值时,采用同样的逻辑,如:

df.mean(axis=0). f = pd.DataFrame([[1,'Bob',8000],                  [2,'Sally', 9000],                  [3,'Scott', 20]],columns=['id','name', 'power level'])df.append(df.sum(axis=0),ignore_index=True)
Pandas函数有哪些

7.合并

串联两个数据框

用于同行有两个数据框,并想将其组合的情况。这里将数据框分成两部分,然后重新将它们添加在一起。

df1 = anime[0:2]df2 =anime[2:4]pd.concat([df1, df2], ignore_index=True)
Pandas函数有哪些
Pandas函数有哪些
Pandas函数有哪些

合并数据框

想将两个数据框合并在一列时,合并数据框就如同SQL(结构化查询语言)的左联接用法。

rating.merge(anime,left_on=’anime_id’, right_on=’anime_id’, suffixes=(‘_left’, ‘_right’))
Pandas函数有哪些

8.筛选

检索匹配索引值的行

anime_modified中的索引值是动漫的名称。请注意,如何使用这些名称来获取特定列。

anime_modified.loc[['Haikyuu!!Second Season','Gintama']]
Pandas函数有哪些

通过编号索引值来检索行

与上面的函数不同,使用 iloc,第一行的索引值为0,第二行的索引值为1,以此类推……即便在修改数据框后,在索引列中使用字符串值。

使用此函数,当你想获得数据框中的前3行。

anime_modified.iloc[0:3]
Pandas函数有哪些

获取行

在给定列表的列值中检索行。匹配单个值时,anime[anime[‘type’] == 'TV']也适用。

anime[anime['type'].isin(['TV','Movie'])]
Pandas函数有哪些

拆分数据框

这就像拆分表格一样。拆分数据框,来获取在特定索引前/中/后的所有行。

anime[1:3]
Pandas函数有哪些

通过值筛选

筛选符合条件的行的数据框。但注意,这将维持现有的索引值。

anime[anime['rating'] > 8]
Pandas函数有哪些

9.排序

排序函数sort_values

按列中的值对数据框进行排序。

anime.sort_values('rating',ascending=False)
Pandas函数有哪些

10.汇总

分组和计数

计算列中每个不同值的记录数。

anime.groupby('type').count()
Pandas函数有哪些

以不同方式对列进行分组和汇总

注意,笔者添加了 reset_index() 函数,否则,下文的“type”列将成为索引列——笔者建议在多数情况下这样做。

anime.groupby(["type"]).agg({   "rating": "sum",   "episodes":"count",   "name": "last" }).reset_index()

创建数据透视表

数据透视表是比较适合从数据框中提取数据子集的工具。

需注意,笔者已对数据框进行了大量筛选,因此可以更快地构建数据透视表。

tmp_df = rating.copy() tmp_df.sort_values('user_id', ascending=True, inplace=True) tmp_df = tmp_df[tmp_df.user_id < 10] tmp_df = tmp_df[tmp_df.anime_id < 30] tmp_df = tmp_df[tmp_df.rating != -1]pd.pivot_table(tmp_df, values='rating',index=['user_id'], columns=['anime_id'], aggfunc=np.sum, fill_value=0)
Pandas函数有哪些

11.整理

设置非数(NaN)单元格为某个值

设置非数值单元格为0。示例中,笔者像之前一样创建了相同的数据透视表,但不使用fill_value=0,而是使用 fillna(0)进行填充。

pivot = pd.pivot_table(tmp_df, values='rating',index=['user_id'], columns=['anime_id'], aggfunc=np.sum)pivot.fillna(0)
Pandas函数有哪些
Pandas函数有哪些

12.其他

采样数据框

笔者一直从较大的数据框中提取少量样本。如果frac = 1,则可以在保留索引的情况下随机重新排行。

anime.sample(frac=0.25)
Pandas函数有哪些

迭代行索引

在数据框中迭代索引和行。

for idx,row inanime[:2].iterrows():     print(idx, row)
Pandas函数有哪些

启动jupyter notebook

以高数据速率限制启动jupyter notebook程序。

jupyter notebook &mdash;NotebookApp.iopub_data_rate_limit=1.0e10

“Pandas函数有哪些”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Pandas函数有哪些

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

pandas库有哪些常用函数

pandas库常用函数有:1、read_csv()和read_excel()函数;2、head()和tail()函数;3、info()函数;4、describe()函数等。详细介绍:1、read_csv()和read_excel()函数,这
pandas库有哪些常用函数
2023-11-22

高效的Pandas函数有哪些

本篇内容介绍了“高效的Pandas函数有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!介绍这些函数之前,第一步先要导入pandas和nu
2023-06-16

Python中Pandas数据合并函数有哪些

这篇文章主要介绍Python中Pandas数据合并函数有哪些,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!1. concatconcat是pandas中专门用于数据连接合并的函数,功能非常强大,支持纵向合并和横向合并
2023-06-29

pandas数据分析常用函数有哪些

小编给大家分享一下pandas数据分析常用函数有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!1. 导入模块import pandas as pd
2023-06-01

从Excel到Python最常用的Pandas函数有哪些

从Excel到Python最常用的Pandas函数有哪些,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。生成数据表常见的生成数据表的方法有两种,第一种是导入外部数据,第二种是直接
2023-06-02

pandas数据分析有哪些方法

pandas数据分析的方法有:1、数据读取与处理;2、数据筛选与选择;3、数据排序与整理;4、数据聚合与分组;5、数据透视与透视表;6、合并与连接数据;7、数据持久化与保存。Pandas库提供了丰富的数据分析和处理功能,涵盖了数据的读取、处
pandas数据分析有哪些方法
2023-11-22

从Excel到Python中最常用到的Pandas函数都有哪些

本篇文章为大家展示了从Excel到Python中最常用到的Pandas函数都有哪些,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。数据预处理本章主要讲的是数据的预处理,对清洗完的数据进行整理以便后期的
2023-06-02

pandas的优点有哪些

本篇内容主要讲解“pandas的优点有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“pandas的优点有哪些”吧!下面是一个例子,数据获取方式见文末。>>> import pandas as
2023-06-15

有哪些Pandas小窍门

本篇内容主要讲解“有哪些Pandas小窍门”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“有哪些Pandas小窍门”吧!用剪贴板创建数据框众所周知,Pandas可以使用SQLAlchemy从CSV
2023-06-16

java函数有哪些?

java函数有哪些?java有很多函数,函数就是方法,JDK中有很多包,每个包中有很多类,每个类中都有很多方法。所以java的函数是很多的。比如String这个类中,valueOf()、split()、toArrayChar(),等等都是函数。具体的使用我们可
java函数有哪些?
2018-07-17

VB.NET函数有哪些

这篇文章给大家分享的是有关VB.NET函数有哪些的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。VB.NET函数总结:Int(x):求不大于自变量x的***整数Fix(x):去掉一个浮点数的小数部分,保留其整数部分
2023-06-17

numpy函数有哪些

numpy函数有np.sin(), np.cos(), np.tan()、np.exp()、np.log(), np.log10(), np.log2()、np.mean(), np.median(), np.var(), np.std()
numpy函数有哪些
2023-11-21

编程热搜

目录