位置：首页-资讯-后端开发

pandas进行数据输入和输出的方法详解

2024-04-02 19:55

短信预约 -IT技能 免费直播动态提醒

1.文本格式数据的读写

read_csv()：从文件、URL或文件型对象读取分隔好的数据，逗号是默认分隔符

read_table()：从文件、URL或文件型对象读取分隔好的数据，制表符('\t')是默认分隔符

Windows用户打印文件的原始内容

因为这个文件是逗号分隔的，我们可以使用read_csv将它读入一个DataFrame:

也可以用read_table，并指定分隔符

刚刚是文件包含表头行的情况，但有的文件并不包含表头行，比如

如果直接读取的话，默认将第一行作为表头了,也就是默认header=0，表示第一行为行。

有两种方法改，

一是允许pandas自动分配默认列名，

二是自己指定列名。

假设想要message列成为返回DataFrame的索引，可以指定位置4的列为索引，或将'message'传给参数index_col:

从多个列中形成一个分层索引

解析函数有很多附加参数处理各种发生异常的文件格式，例如，可以使用skiprows来跳过第一行，第三行，第四行。

处理缺失值

通常情况下，缺失值要么不显示(空字符串，要么用一些标识值)

默认情况下，pandas用一些常见的标识，如NaN和NULL

na_values选项可以传入一个列表或一组字符串来处理缺失值

在字典中，每列可以指定不同的缺失值标识

1.1 分块读入文本文件

如果只想读取一小部分(避免读取整个文件)，可以指明nrows

为了分块读入文件，可以指定chunksize作为每一块的行数

read_csv返回的TextParser对象允许根据chunksize遍历文件，并对'a'列聚合获得计数值

1.2 将数据写入文本格式

使用DataFrame的to_csv方法，可将数据导出为逗号分隔的文件

默认若是没有其他选项被指定的话，行和列的标签都会被写入，不过二者也都可以禁止写入

也可以仅仅写入列的子集，并且按照选择的顺序写入

默认缺失值在输出时以空字符串出现，可以用其他标识值对缺失值进行标注

(写入到sys.stdout时，控制台中打印的文本结果)

默认分隔符是逗号，可以用sep选项选择分隔符

Series也有to_csv方法

不知道为啥最后写入有，0这行？？？？

总结

本篇文章就到这里了，希望能够给你带来帮助，也希望您能够多多关注编程网的更多内容!

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉

pandas进行数据输入和输出的方法详解

下载Word文档到电脑，方便收藏和打印～

下载Word文档

猜你喜欢

pandas如何进行数据输入和输出

这篇文章将为大家详细讲解有关pandas如何进行数据输入和输出，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。1.文本格式数据的读写read_csv()：从文件、URL或文件型对象读取分隔好的数据，逗号是默

2023-06-29

Java中常用数据类型的输入输出方法是什么

这篇文章主要介绍Java中常用数据类型的输入输出方法是什么，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！1、Char型这里说的char型指的是只输入一个字符的情况。1.1 输入格式：import java.io.I

2023-06-22

C++ 函数调试详解：如何分析函数的输入和输出参数？

函数调试时，分析输入参数包括：类型匹配、范围、值和边值检查。输出参数分析包含：返回类型验证、指针有效性、引用有效性、值验证等。实战案例演示了如何测试输入和输出参数的有效性，帮助理解代码错误的定位和解决。C++ 函数调试详解：如何分析函数的输

2024-05-03

关于C++中数据16进制输出的方法

本文主要介绍了关于C++中数据16进制输出的方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

2023-03-09

C++中数据16进制输出的方法是什么

这篇文章主要讲解了“C++中数据16进制输出的方法是什么”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“C++中数据16进制输出的方法是什么”吧！比如我们得到一个数据：double b = 1

2023-07-05

Go语言输出方法详解：fmt.Print和fmt.Println的区别

2024-04-02

MySQL中数据导入和导出的方法详解

MySQL中数据导入和导出的方法详解导入和导出数据是数据库管理中常用的操作，在MySQL中也有多种方法可以实现。本文将详细介绍几种常见的方法，并提供相应的代码示例。一、导出数据使用SELECT ... INTO OUTFILE语句导出数据在

2023-10-22

详解Java中的println输入和toString方法的重写问题

2024-04-02

C#中如何使用XML和JSON数据格式进行数据存储和传输及解决方法

C#中如何使用XML和JSON数据格式进行数据存储和传输及解决方法XML和JSON是目前广泛应用于数据交换和存储的两种标准格式。在C#中，我们可以使用内置的库和工具来处理和操作XML和JSON数据。本文将详细介绍如何在C#中使用XML和JS

2023-10-22

解决Fedora14下eclipse进行android开发,ibus提示没有输入窗口的方法详解

好不容易搭建好了开发环境，可是不管怎么按Ctr + space，ibus就是不弹出来。用鼠标点吧，上面提示没有输入窗口。真是操蛋！google了一圈也没有解决办法，我是第一个遇到这问题的人么？？无奈下，干脆换输入法！将系统自带的ibus换成

2022-06-06

Linux 命令行工具解析和格式化输出 JSON的方法

jsON 是一种轻量级且与语言无关的数据存储格式，易于与大多数编程语言集成，也易于人类理解 —— 当然，如果格式正确的话。JSON 这个词代表 J ava S cript O bject N otation，虽然它以 javascript

2022-06-04

PHP如何使用xlswriter进行大数据的导入导出？（详解）

PHP如何使用xlswriter进行大数据的导入导出？下面本篇文章给大家介绍一下PHP大数据xlswriter导入导出(最优数据化)的方法，希望对大家有所帮助！本文介绍基于PHP扩展xlswriter的Vtiful\Kernel\Excel类可以支持无限层级的复杂表头导出！后续也可能会持续更新优化一、准备xlswriter扩展1、windows系统：到PECL网站下载符合自己本地PHP环境的ddl文

2022-07-07

Spring根据URL参数进行路由的方法详解

前言本文主要介绍了关于Spring根据URL参数进行路由的相关内容，分享出来供大家参考学习价值，下面来一起看看详细的介绍吧。发现问题最近在写接口的时候发现一个问题，就是两个REST接口的URL的path部分是一样的，根据query传入不同的

2023-05-30

使用pandas进行数据可视化和探索性数据分析的技巧及方法

如何使用pandas进行数据可视化和探索性分析导语：在数据分析的过程中，可视化和探索性分析是不可或缺的环节。pandas是Python中一个非常强大的数据分析库，除了具有数据处理功能外，还提供了一系列用于数据可视化和探索性分析的工具。本文

2024-01-13

阿里云服务器传输数据慢的原因和解决方法

阿里云服务器传输数据慢的原因和解决方法随着云计算的快速发展，越来越多的企业和个人选择使用阿里云服务器来存储和传输数据。然而，在实际应用中，有些用户发现他们的数据传输速度非常慢，这给他们带来了很多不便。那么，阿里云服务器传输数据慢的原因是什么？又该如何解决这个问题呢？本文将探讨阿里云服务器传输数据慢的原因，并提供解

2023-12-26

SpringBoot整合EasyExcel进行大数据处理的方法详解

2024-04-02

编程热搜

Python 学习之路 - Python
一、安装Python34Windows在Python官网（https://www.python.org/downloads/）下载安装包并安装。Python的默认安装路径是：C:\Python34配置环境变量：【右键计算机】--》【属性】-
chatgpt的中文全称是什么
chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型，它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，并协助人类完成一系列
C/C++中extern函数使用详解
C/C++可变参数的使用
可变参数的使用方法远远不止以下几种，不过在C,C++中使用可变参数时要小心，在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少，否则会产生访问越界，运气不好的话还会导致程序崩溃
css样式文件该放在哪里
php中数组下标必须是连续的吗
Python 3 教程
Python 3 教程 Python 的 3.0 版本，常被称为 Python 3000，或简称 Py3k。相对于 Python 的早期版本，这是一个较大的升级。为了不带入过多的累赘，Python 3.0 在设计的时候没有考虑向下兼容。 Python
Python pip包管理
一、前言在Python中，安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具： easy_install 和 pip ，目前官方推荐使用 pip。
ubuntu如何重新编译内核
改善Java代码之慎用java动态编译