我的编程空间,编程开发者的网络收藏夹
学习永远不晚

【Python】详解 Pandas 中的 read_csv()

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

【Python】详解 Pandas 中的 read_csv()

目录

read_csv()


read_csv()

pd.read_csv() 是 Pandas 中用于从 CSV 文件中读取数据的函数。它的语法如下:

pd.read_csv(filepath_or_buffer, sep=",", delimiter=None, header="infer", names=None, index_col=None, usecols=None, dtype=None, na_values=None, skiprows=None, skip_blank_lines=True, verbose=False, skipinitialspace=False, encoding=None, squeeze=False, memory_map=False, low_memory=True, nrows=None, parse_dates=False, infer_datetime_format=False, keep_date_col=False, dayfirst=False, date_parser=None, thousands=None, decimal=".", lineterminator=None, quotechar='"', quoting=0, doublequote=True, escapechar=None, comment=None, encoding_errors="strict", dialect=None, error_bad_lines=True, warn_bad_lines=True, on_bad_lines=None)

其中,最常用的参数是 filepath_or_buffer,它表示要读取的 CSV 文件的路径或打开的文件对象。其他参数的含义如下:

  • sep:指定分隔符,默认为逗号。
  • delimiter:指定分隔符,如果与 sep 参数同时指定,则以 delimiter 为准。
  • header:指定表头所在行,默认为第一行。
  • names:指定表头的名称列表。
  • index_col:指定索引列的名称或位置。
  • usecols:指定要读取的列的名称列表或位置列表。
  • dtype:指定每列的数据类型。
  • na_values:指定缺失值的列表。
  • skiprows:指定要跳过的行数或行号列表。
  • skip_blank_lines:指定是否跳过空行,默认为 True。
  • verbose:指定是否输出详细信息。
  • skipinitialspace:指定是否忽略分隔符后的空格,默认为 False。
  • encoding:指定编码格式。
  • squeeze:指定是否将读取的 DataFrame 转换为 Series。
  • memory_map:指定是否使用内存映射文件来读取数据。
  • low_memory:指定是否使用低内存模式来读取数据。
  • nrows:指定要读取的行数。
  • parse_dates:指定是否解析日期,默认为 False。
  • infer_datetime_format:指定是否自动推断日期格式。
  • keep_date_col:指定是否保留日期列。
  • dayfirst:指定日期表达式中是否先解释天和月的顺序。
  • date_parser:指定日期解析函数。
  • thousands:指定千位分隔符。
  • decimal:指定小数点的字符。
  • lineterminator:指定行终止字符。
  • quotechar:指定引号。
  • quoting:指定引用程度,0 表示不引用,1 表示引用非数字项,2 表示引用所有项,3 表示引用非数字项和数字项中的负数。
  • doublequote:指定是否将双引号视为转义字符。
  • escapechar:指定逃逸字符。
  • comment:指定注释字符。
  • encoding_errors:指定编码错误处理方式。
  • dialect:指定 CSV 方言。
  • error_bad_lines:指定是否忽略读取错误行,默认为 True。
  • warn_bad_lines:指定是否输出警告信息,默认为 True。
  • on_bad_lines:指定当读取出错时的处理方式。

read_csv() 函数返回一个 DataFrame,其中包含了从 CSV 文件中读取到的数据。如果只需要读取文件中的一部分数据,可以使用参数 nrows。如果文件中有多个表格,则可以使用参数 headerskiprows 跳过无关的表格。读取大型 CSV 文件时,可以使用参数 chunksize 将文件分块读取。

来源地址:https://blog.csdn.net/fanjufei123456/article/details/130889517

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

【Python】详解 Pandas 中的 read_csv()

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Pandas中resample方法详解

在Pandas中,resample方法用于对时间序列数据进行重新采样。重新采样是指将时间序列数据的频率从一个频率转换为另一个频率,比如从按天采样转换为按月采样。resample方法的基本语法是:```DataFrame.resample(r
2023-08-11

Python科学计算之Pandas详解

起步Pandas最初被作为金融数据分析工具而开发出来,因此 pandas 为时间序列分析提供了很好的支持。 Pandas 的名称来自于面板数据(panel data)和python数据分析 (data analysis) 。panel da
2022-06-04

pandas中concatenate和combine_first的用法详解

本文主要介绍了pandas中concatenate和combine_first的用法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
2023-01-11

python基础pandas的drop()用法示例详解

这篇文章主要介绍了python基础pandas的drop()用法,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
2023-05-15

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录