我的编程空间,编程开发者的网络收藏夹
学习永远不晚

python pandas中如何实现合并与拼接

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

python pandas中如何实现合并与拼接

小编给大家分享一下python pandas中如何实现合并与拼接,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!

前言

在许多应用中,数据可能来自不同的渠道,在数据处理的过程中常常需要将这些数据集进行组合合并拼接,形成更加丰富的数据集。pandas提供了多种方法完全可以满足数据处理的常用需求。具体来说包括有join、merge、concat、append等。

python pandas中如何实现合并与拼接

一般来说

方法说明
join最简单,主要用于基于索引的横向合并拼接
merge最常用,主要用户基于指定列的横向合并拼接
concat最强大,可用于横向和纵向合并拼接
append主要用于纵向追加
combine_first合并重叠数据,填充缺失值
update将一个数据集的值更新到另一个数据集

下面就来逐一介绍每个方法

一、join

join主要用于基于索引的横向合并拼接

在介绍pandas的join之前我们来看一下SQL对数据集join的几种模式。如果大家对SQL比较熟悉的话应该对SQL操作数据集进行各种合并拼接印象深刻。SQL中各种JOIN的方法如下:

python pandas中如何实现合并与拼接

pandas的join实现了left join、right jion、inner join、out jion常用的4中join方法

来自官网的参数说明:

dataframe.join(other,  # 待合并的另一个数据集                   on=None,  # 连接的键                   how='left',   # 连接方式:‘left', ‘right', ‘outer', ‘inner' 默认是left                   lsuffix='',  # 左边(第一个)数据集相同键的后缀                   rsuffix='',  # 第二个数据集的键的后缀                   sort=False)  # 是否根据连接的键进行排序;默认False

我们来看下实例,有两个数据集一个是人员姓名,一个是人员的工资

left=pd.DataFrame(['张三','李四','王五','赵六','钱七'], index=[3,4,5,6,7],columns=['姓名'])right=pd.DataFrame([13000,15000,9000,8600,10000], index=[3,4,5,6,8],columns=['工资'])

python pandas中如何实现合并与拼接

注意,left和right的数据集分别都指定了index,因为join主要用于基于索引的横向合并拼接。

1、left join

left.join(right)  #默认how='left'

python pandas中如何实现合并与拼接

jion操作默认是left jion的操作,可以看到left索引为7姓名为钱七,在right中没有索引为7的对应所以显示left的姓名但right的工资为NaN,right中索引为8的数据在left中没有索引为8的,所以没有显示。left join合并left的数据

left join 如下图所示

python pandas中如何实现合并与拼接

2、right join

left.join(right,how='right')

python pandas中如何实现合并与拼接

右链接合并时可以看到,left的数据集没有索引为8的项,所以索引为8的项显示right数据集的工资数据但姓名为NaN,在left中索引为7的项因为right中不存在,所以没有显示。right join合并right的数据

right join 如下图所示

python pandas中如何实现合并与拼接

3、inner join

left.join(right,how='inner')

python pandas中如何实现合并与拼接

内链接合并时,可以看到left数据集中的索引为7姓名为钱七因为在right数据集中找不到对应的索引,right数据集中索引为8的在left找不到对应的索引所以内连接合并时索引7和8都没有进行合并,inner join只合并两个数据集共有的数据

inner join 如下图所示

python pandas中如何实现合并与拼接

4、out join

left.join(right,how='outer')

python pandas中如何实现合并与拼接

外链接合并时,可以看到不管是left中的数据还是right中的数据都进行了合并。right join合并两个数据集中所有的数据。

outer join 如下图所示

python pandas中如何实现合并与拼接

join很简单,但是它有局限性,因为它只能根据索引来合并。不能指定键来进行合并。比如我要根据编号和姓名来合并,join就比较难办了。但是pandas提供了merge的方法,可以指定列来进行合并拼接。

二、merge

merge最常用,主要用户基于指定列和横向合并拼接,语法如下:

pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None,left_index=False, right_index=False, sort=True,suffixes=('_x', '_y'), copy=True)
参数名称说明
left/right两个不同的 DataFrame 对象。
on指定用于连接的键(即列标签的名字),该键必须同时存在于左右两个 DataFrame 中,如果没有指定,并且其他参数也未指定, 那么将会以两个 DataFrame 的列名交集做为连接键。
left_on指定左侧 DataFrame 中作连接键的列名。该参数在左、右列标签名不相同,但表达的含义相同时非常有用。
right_on指定左侧 DataFrame 中作连接键的列名。
left_index布尔参数,默认为 False。如果为 True 则使用左侧 DataFrame 的行索引作为连接键,若 DataFrame 具有多层索引(MultiIndex),则层的数量必须与连接键的数量相等。
right_index布尔参数,默认为 False。如果为 True 则使用左侧 DataFrame 的行索引作为连接键。
how要执行的合并类型,从 {‘left’, ‘right’, ‘outer’, ‘inner’} 中取值,默认为“inner”内连接。
sort布尔值参数,默认为True,它会将合并后的数据进行排序;若设置为 False,则按照 how 给定的参数值进行排序。
suffixes字符串组成的元组。当左右 DataFrame 存在相同列名时,通过该参数可以在相同的列名后附加后缀名,默认为(’_x’,’_y’)。
copy默认为 True,表示对数据进行复制。

我们来看下面的数据集,在上面的数据集中left数据集加入了员工的编号,right数据集加入了编号及姓名。索引就按默认的索引。

left=pd.DataFrame([[3,'张三'],[4,'李四'],[5,'王五'],[6,'赵六'],[7,'钱七']],columns=['编号','姓名'])right=pd.DataFrame([[3,'张三',13000],[4,'李四',15000],[5,'王五',9000],[6,'赵六',8600],[8,'孙八',10000]],columns=['编号','姓名','工资'])

python pandas中如何实现合并与拼接

pd.merge(left,right)

python pandas中如何实现合并与拼接

没有指定连接键,默认用重叠列名,没有指定连接方式,默认inner内连接(取left和right编号和姓名的交集)

和join一样通过how来指定连接方式如:

pd.merge(left,right,how='left')

python pandas中如何实现合并与拼接

how的连接方式和join一样支持left、right、inner、outer

merge还可以指定多个列进行合并链接,也就是和SQL一样设置多个关联的列。

pd.merge(left,right,how='outer',on=['编号','姓名'])

python pandas中如何实现合并与拼接

如果两个对象的列名不同,可以使用left_on,right_on分别指定,如我们把right数据集的“编码”列标签改成“ID”后如果需要left数据集的"编号"和right数据集的"ID"进行关联

right=pd.DataFrame([[3,'张三',13000],[4,'李四',15000],[5,'王五',9000],[6,'赵六',8600],[8,'孙八',10000]],columns=['ID','姓名','工资'])pd.merge(left,right,how='outer',left_on='编号',right_on='ID')

python pandas中如何实现合并与拼接

虽然说merge已经很强大了,但是pandas愿意给你更多,它提供了concat,可以实现横向和纵向的合并与拼接。也就是说不但实现了SQL中的join还实现了union

三、concat

concat() 函数用于沿某个特定的轴执行连接操作,语法如下:

pd.concat(objs,axis=0,join='outer',join_axes=None,ignore_index=False)
参数名称说明
objs一个序列或者是Series、DataFrame对象。
axis表示在哪个轴方向上(行或者列)进行连接操作,默认 axis=0 表示行方向。
join指定连接方式,取值为{“inner”,“outer”},默认为 outer 表示取并集,inner代表取交集。
ignore_index布尔值参数,默认为 False,如果为 True,表示不在连接的轴上使用索引。
join_axes表示索引对象的列表。

来看具体的例子

left2=pd.DataFrame([[1,'陈一'],[2,'周二']],columns=['编号','姓名'])

python pandas中如何实现合并与拼接

1、纵向合并

concat默认纵向拼接,我们要在left1数据集的基础上把left2数据集给合并上去,很简单用concat直接就可以合并。

df=pd.concat([left,left2])

python pandas中如何实现合并与拼接

2、横向合并

df_outer=pd.concat([left,right],axis=1,join='outer')#外链接df_inner=pd.concat([left,right],axis=1,join='inner')#内链接

python pandas中如何实现合并与拼接

注意:因为concat的链接和join一样是通过索引来链接合并,并不能指定通过某个特定的列来链接进行合并,所以看到的合并后的数据集left和right的编号和姓名是错位的。

如果要根据编号来关联可以指定编号作为索引再进行横向合并,这样就没有问题了。

left.index=left['编号'].valuesright.index=right['编号'].valuesdf_outer=pd.concat([left,right],axis=1,join='outer')df_inner=pd.concat([left,right],axis=1,join='inner')

python pandas中如何实现合并与拼接

四、append

df.append 可以将其他行附加到调用方的末尾,并返回一个新对象。它是最简单常用的数据合并方式。语法如下:

df.append(self, other, ignore_index=False,verify_integrity=False, sort=False)

其中:

  • other 是它要追加的其他 DataFrame 或者类似序列内容

  • ignore_index 如果为 True 则重新进行自然索引

  • verify_integrity 如果为 True 则遇到重复索引内容时报错

  • sort 进行排序

来看下面的例子:

1、同结构数据追加

将同结构的数据追加在原数据后面,在left数据集后面追加left2数据集,left2的数据集内容如下:

left2=pd.DataFrame([[1,'陈一'],[2,'周二']],columns=['编号','姓名'])left2

python pandas中如何实现合并与拼接

left.append(left2)

python pandas中如何实现合并与拼接

2、不同结构数据追加

不同结构数据追加,原数据没有的列会增加,没有对应内容的会为空NaN。

如:left3的数据集列有"编号"、“姓名”、“工资”

left3=pd.DataFrame([[8,'孙八',10000],[9,'何九',15000]],columns=['编号','姓名','工资'])left3

python pandas中如何实现合并与拼接

left.append(left3)

python pandas中如何实现合并与拼接

当left后追加left3后的数据集会增加“工资列”,没有对应内容的会为空。

3、追加合并多个数据集

append参数可带数据集列表,可以将多个数据集追加到原数据集

如我们将left2和left3都追加到left

left.append([left2,left3])

python pandas中如何实现合并与拼接

五、combine_first

combine_first可用于合并重复数据,用其他数据集填充没有的数据。如一个DataFrame数据集中出现了缺失数据,就可以用其他DataFrame数据集中的数据进行填充。语法格式如下:

combine_first(other) #只有一个参数other,该参数用于接收填充缺失值的DataFrame对象。

如left数据集中没有"工资"的数据,我们可以用right数据集有的数据去填充left数据集中的数据。

left.combine_first(right) #用right去填充left

python pandas中如何实现合并与拼接

六、update

update和combine_first比较类似,区别在于:

填充合并方式稍有差异

combine_first:如果s1中c的值为空,用s2的值替换,否则保留s1的值

update:如果s2中的值不为空,那么替换s1,否则保留s1的值

update是更新原数据,combine_first会返回一个填充后的新数据集,对原数据不做更新。

left.update(right) #用right的数据更新left中的数据。

python pandas中如何实现合并与拼接

看完了这篇文章,相信你对“python pandas中如何实现合并与拼接”有了一定的了解,如果想了解更多相关知识,欢迎关注编程网行业资讯频道,感谢各位的阅读!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

python pandas中如何实现合并与拼接

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

python pandas中如何实现合并与拼接

小编给大家分享一下python pandas中如何实现合并与拼接,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!前言在许多应用中,数据可能来自不同的渠道,在数据处理的过程中常常需要将这些数据集进行组合合并拼接,形成更加丰富的
2023-06-29

pandas如何实现数据的合并与拼接

这篇文章将为大家详细讲解有关pandas如何实现数据的合并与拼接,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。Pandas包的merge、join、concat方法可以完成数据的合并和拼接,merge方法
2023-06-21

python如何实现列表拼接与合并

这篇文章将为大家详细讲解有关python如何实现列表拼接与合并,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。列表拼接&合并首先从字符串列表开始:colors = [red, blue, green, ye
2023-06-27

numpy如何实现数组合并和矩阵拼接

这篇文章给大家分享的是有关numpy如何实现数组合并和矩阵拼接的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。Numpy中提供了concatenate,append, stack类(包括hsatck、vstack、
2023-06-14

pandas中的concat函数如何实现合并交集

这篇文章将为大家详细讲解有关pandas中的concat函数如何实现合并交集,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。合并交集In [11]: df3 = pd.DataFrame([[c, 3, c
2023-06-17

利用python Pandas实现批量拆分Excel与合并Excel

目录一、实例演示二、读取源Excel到Pandas三、将一个大Excel等份拆成多个Excel四、合并多个小Excel到一个大Excel一、实例演示 1.将一个大Excel等份拆成多个Excel 2.将多个小Excel合并成一个大Excel
2022-06-02

如何使用Python对Excel表格进行拼接合并

这篇文章主要介绍了Python处理EXCEL基础操作篇3用Python对Excel表格进行拼接合并,文中提供了解决思路和部分实现代码,需要的朋友可以参考下
2023-03-22

SQL SERVER如何实现连接与合并查询

这篇文章主要介绍了SQL SERVER如何实现连接与合并查询,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。创建测试表MyStudentInfoCREATE table MyS
2023-06-29

Node.js中如何实现SQL拼接

在Node.js中实现SQL拼接一般可以使用第三方库来辅助,比如mysql或sequelize。以下是使用mysql库实现SQL拼接的示例代码:const mysql = require('mysql');// 创建数
Node.js中如何实现SQL拼接
2024-04-29

MySQL中如何实现SQL拼接

在MySQL中,可以使用CONCAT()函数来实现SQL拼接。CONCAT()函数可以将多个字符串拼接在一起,例如:SELECT CONCAT('Hello', ' ', 'World&#
MySQL中如何实现SQL拼接
2024-04-29

python如何实现字典合并

这篇文章将为大家详细讲解有关python如何实现字典合并,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。字典合并a = {a: 1, b: 2} b = {b: 3, c: 4} x = {**a, **b
2023-06-27

Python如何用arcpy模块实现栅格的创建与拼接

本篇内容介绍了“Python如何用arcpy模块实现栅格的创建与拼接”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!首先,相关操作所需具体代码
2023-07-05

如何使用Python实现字典合并

这篇文章给大家分享的是有关如何使用Python实现字典合并的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。1、用for循环把一个字典合并到另一个字典把a字典合并到b字典中,相当于用for循环遍历a字典,然后取出a字
2023-06-29

JS与CSS的合并压缩如何实现

本篇内容介绍了“JS与CSS的合并压缩如何实现”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!存在的问题:合并、压缩文件主要有2方面的问题:1
2023-07-04

Python如何实现Excel求和、合并居中的操作示例

这篇文章主要介绍了Python如何实现Excel求和、合并居中的操作示例,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。需求原始表格:想在Total列中对每日的Amount进行
2023-06-14

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录