我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Python之如何使用pandas操作Excel表

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Python之如何使用pandas操作Excel表

目录

1、前言

2、读取Excel

3、对Excel进行操作

3.1、获取行号、列名

 3.2、获取单元格的值,并循环输出

 3.3、对空值进行处理,替换

 3.4、增加一列,并对新增列的第一行进行赋值

3.5、将修改后数据保存到原文档

 3.6、关于循环取数

4、错误处理

5、全部代码


前言

网上也有很多关于如何使用pandas对Excel表格进行操作的文章,本文纯当记录

Excel原文件数据如下:

2、读取Excel

对Excel操作分两步:

首先要导入pandas库

设置Excel文件路径

注意:

pandas.read_excel(file, sheet_name=0, keep_default_na=False)
1、file为要读取的Excel文件
2、sheet_name表示要读取的sheet名,0表示第一个sheet,1表示第2个sheet,依次类推;也可以直接写sheet的名称,如sheet_name='Sheet1'
3、当Excel中有空值时,直接读取会显示nan,read_excel方法中加上keep_default_na=False后,
空值nan会变成:'' 空字符串,后续可用if cell_data=='' 进行判断

代码如下:

import pandas

file = r'D:\student.xlsx'

class opexcel():
    def getdata(self, file):
        data = pandas.read_excel(file, sheet_name=0, keep_default_na=False)
        print(type(data)) # 输出数据类型(DataFrame)
        print(data)  # 输出数据

if __name__ == '__main__':
    opexcel().getdata(file)

打印结果如下:

3、对Excel进行操作

3.1、获取行号、列名

        row_index = data.index.values  # 行号: 数组形式 [0 1 2 3 4 5 6 7 8]
        print('行号是:%s' % row_index)
        row_num = len(data.index.values)  # 行数
        print('行数是:%s' % row_num)
        col_index = data.columns.values  # 列名: 数组形式['姓名' '性别' '年龄' '住址' '爱好']
        print('列名是:%s' % col_index)
        col_num = len(data.columns.values)  # 列数
        print('列数是:%s' % col_num)

打印结果:

 3.2、获取单元格的值,并循环输出

        for i in range(row_num): # 循环行数
            for j in range(col_num): # 循环列数
                cell_data=data.iloc[i,j] # 获取单元格的值
                   print('第%s行,第%s列的数据是:%s ' %(i,i,cell_data))

打印结果如下:

 3.3、对空值进行处理,替换

Excel文件中,某个单元格的值可能为空,直接读取会显示nan,且各个单元格的数据类型可能不一致,如date、str、int、float。这时如果直接读取,使用numpy.isnan()或者pandas.isnull()进行判断,都可能会报错,所以在开头读取Excel文件的方法pandas.read_excel(file, sheet_name=0, keep_default_na=False)中加上keep_default_na=False后,空值nan会变成:'' 空字符串。

现在我们想要将Excel中所有为空的单元格,替换为NULL字符串,操作如下

取出所有列名

循环列名,对空值替换(据实践,只有列名才有.replace()方法)

col_index = data.columns.values  # 列名for col in col_index :    data[col].replace('','NULL',inplace=True)    # 第一个参数是替换前的值,即Excel表指定列的值,如有多个相同的值,后续都会被替换      第二个参数是替换后的值,此处为字符串'NULL',也可填数字、或其他类型      第三个参数,是否替换,True为替换    print(data)打印结果如下:

如要将上方结果中【爱好】这一列的【无】,替换为羽毛球,操作如下:

data['爱好'].replace('无','羽毛球',inplace=True)

结果如下:

 3.4、增加一列,并对新增列的第一行进行赋值

新增一列【成绩】,并赋值未None:

data['成绩']=None

打印结果如下:

 修改增列的第一行的值为50:

data['成绩'][0]=50 

打印结果如下:

 3.5、将修改后数据保存到原文档

注意:以上操作中将空值替换、新增列、修改单元格数据等编辑操作,只在控制台有效,实际文件的内容并不会被改变

file = r'D:\student.xlsx'

data.to_excel(file,sheet_name='Sheet1',index=False,header=True)

 # 用DataFrame的to_excel方法可将编辑后的数据进行保存(前面第一节已知data为DataFrame类型)

第一个参数file,表示数据将要保存到这个文件。可以是原文件(r'D:\student.xlsx'),如果写另外的文件(r'D:/test/newstudent.xlsx'),则数据将保存到另一个文件中,原文件数据不变

第二个参数sheet_name,表示将数据保存到文件的哪一个sheet工作表。如工作表不存在则会报错。

第三个参数index,表示工作表自带的序号。如果设置index=True,则保存后的数据将多出一列

第四个参数header,表示列名。设置header=True,保存后的数据将带上列名;设置header=False,保存后的数据将没有列名

注意:

读取文件的时候,sheet_name可以写成 sheet_name=0或 sheet_name='Sheet1'

data = pandas.read_excel(file, sheet_name=0,keep_default_na=False)

写入文件的时候,只能填写工作表的名称sheet_name='Sheet1'

保存后的数据如下:

设置index=True,结果如下:

 设置header=False,结果如下:

 3.6、关于循环取数

col_index = data.columns.values  # 列名 ['姓名' '性别' '年龄' '住址' '爱好' '成绩']数组,用in进行循环取值:for i in col_index:col_num = len(data.columns.values)  # 列数 6数值,用rang进行循环取数:for i in range(col_num :

7、字符串分割

url=data['URL'][0] # https://blog.csdn.net/m0_46400195/article/detailspyprint(url)print(type(url))str1=str(data['URL'][0]).split('/')# 注意: 虽然显示URL为str类型,但是仍然要先将data['URL'][0]转为str,才能使用.split方法进行分割。str(data['URL'][0]).split('/'),也可以写成str(url).split('/')print(str1) # 打印分割后的结果newstr1=str1[0]+'//'+str1[2]+'/'+str1[3]+'/'+'druid' #根据分割后的信息进行拼接newstr2 = str1[0] + '//' + str1[2] + '/' + str1[3]+'/' + 'druid/index.html'print(newstr1) #打印拼接后的字符串print(newstr2)打印结果如下:

4、错误处理

PermissionError: [Errno 13] Permission denied

这个错误出现可能是文件未关闭,关闭后再操作即可。还有可能是文件损坏了,打开文件,确认文件内容是否正常

……

5、全部代码

import pandasimport requestsfrom pandas import DataFrameimport xlwt'''1、当Excel中有空值时,直接读取会显示nan,read_excel方法中加上keep_default_na=False后,空值nan会变成:‘’ 空字符串,后续可用if cell_data=='' 进行判断2、col_index = data.columns.values  # 列名   数组col_index:['序号' '是否导出' '所属单位'],用in进行循环取值:for i in col_index:   row_num = len(data.index.values)  # 行数   数值row_num:用rang进行循环取数:for i in range(row_num):'''file = r'D:\student.xlsx'class opexcel():    def getdata(self, file):        data = pandas.read_excel(file, sheet_name=0,keep_default_na=False)        # 当Excel中有空值时,直接读取会显示nan,read_excel方法中加上keep_default_na=False后,        # 空值nan会变成:‘’ 空字符串,后续可用if cell_data=='' 进行判断        # print(type(data))        # print(data)  # 输出数据        row_index = data.index.values  # 行号: 数组形式 [0 1 2 3 4 5 6 7 8]        print('行号是:%s' % row_index)        row_num = len(data.index.values)  # 行数        print('行数是:%s' % row_num)        col_index = data.columns.values  # 列名: 数组形式['序号' '是否导出' '所属单位' '项目名称' '项目']        print('列名是:%s' % col_index)        col_num = len(data.columns.values)  # 列数        print('列数是:%s' % col_num)        # data['result']=None        # data.to_excel(r'D:\userCase11.xls', sheet_name='Sheet1', index=False, header=True)        # for i in range(row_num): # 循环行数        #     for j in range(col_num): # 循环列数        #         cell_data=data.iloc[i,j] # 获取单元格的值        #         print('第%s行,第%s列的数据是:%s ' %(i,i,cell_data))        #        # for col in col_index :        #     data[col].replace('','NULL',inplace=True)        #     print(data)        #        # data['爱好'].replace('无','羽毛球',inplace=True)        # print(data)        # data['成绩']=None        # print(data)        # data['成绩'][0]=50        # print(data)        # data.to_excel(file,sheet_name='Sheet1',index=False,header=False)if __name__ == '__main__':    opexcel().getdata(file)

来源地址:https://blog.csdn.net/qq_14945475/article/details/126240827

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Python之如何使用pandas操作Excel表

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

(新手)使用pandas操作EXCEL

import pandas as pdimport numpy as npfrom pandas import DataFrame,Series#path = r'C:\Users\tsl\Desktop\数据.xlsx'#一列数据前面添加
2023-01-30

python使用xlsx和pandas处理Excel表格的操作步骤

python的神器pandas库就可以非常方便地处理excel,csv,矩阵,表格等数据,下面这篇文章主要给大家介绍了关于python使用xlsx和pandas处理Excel表格的操作步骤,文中通过图文介绍的非常详细,需要的朋友可以参考下
2023-01-04

如何利用Python操作excel表格

这篇文章主要介绍了如何利用Python操作excel表格,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。环境linux 服务器一台,亦或者windows10电脑一台python
2023-06-29

python如何使用xlwt操作excel

这篇文章主要讲解了“python如何使用xlwt操作excel”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“python如何使用xlwt操作excel”吧!一、安装pip install x
2023-06-26

python操作Excel神器openpyxl如何使用

今天小编给大家分享一下python操作Excel神器openpyxl如何使用的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。E
2023-07-06

Windows下Python使用Pandas模块操作Excel文件的教程

安装Python环境 ANACONDA是一个Python的发行版本,包含了400多个Python最常用的库,其中就包括了数据分析中需要经常使用到的Numpy和Pandas等。更重要的是,不论在哪个平台上,都可以一键安装,自动配置好环境,不需
2022-06-04

python中怎样使用xlrd、xlwt操作excel表格

这篇文章将为大家详细讲解有关python中怎样使用xlrd、xlwt操作excel表格,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。python操作excel主要用到xlrd和xlwt这两个
2023-06-04

如何使用python修改excel表某一列内容的操作方法

这篇文章主要介绍了如何使用python修改excel表某一列内容的操作方法,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。想想你在一家公司里做表格,现在有一个下面这样的exce
2023-06-15

python数据分析之怎么用pandas搞定Excel表格

本篇内容主要讲解“python数据分析之怎么用pandas搞定Excel表格”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“python数据分析之怎么用pandas搞定Excel表格”吧!(一)读
2023-06-30

python操作Excel读写--使用x

一、安装xlrd模块   到python官网下载http://pypi.python.org/pypi/xlrd模块安装,前提是已经安装了python 环境。二、使用介绍  1、导入模块      import xlrd   2、打开Exc
2023-01-31

Python使用pandas导入xlsx格式的excel文件内容操作代码

这篇文章主要介绍了Python使用pandas导入xlsx格式的excel文件内容,基本导入是在Python中使用pandas导入.xlsx文件的方法是read_excel(),本文结合示例代码给大家介绍的非常详细,需要的朋友可以参考下
2022-12-23

flutter操作excel表的库使用方法

推荐库 spreadsheet_decoderexcel 方案一:spreadsheet_decoder 加入依赖 dependencies: flutter: sdk: flutter spreadsheet_decoder:
2023-08-17

Python利器openpyxl之操作excel表格的示例分析

这篇文章将为大家详细讲解有关Python利器openpyxl之操作excel表格的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。python处理数据时,可以将数据保存至excel文件中,此处安利一
2023-06-14

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录