我的编程空间,编程开发者的网络收藏夹
学习永远不晚

如何使用pandas生成/读取csv文件

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

如何使用pandas生成/读取csv文件

这篇文章给大家分享的是有关如何使用pandas生成/读取csv文件的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

前言

csv是我接触的比较早的一种文件,比较好的是这种文件既能够以电子表格的形式查看又能够以文本的形式查看。

先引入pandas库

import pandas as pd

方法一:

我构造了一个cont_list,结构为列表嵌套字典,字典是每一个样本,类似于我们爬虫爬下来的数据的结构

利用pd.DataFrame方法先将数据转换成一个二维结构数据,如下方打印的内容所示,cloumns指定列表,列表必须是列表

to_csv方法可以直接保存csv文件,index=False表示csv文件不加行序号

如何使用pandas生成/读取csv文件

保存csv结果

如何使用pandas生成/读取csv文件

应用到我们的爬虫代码,传入的con_list就是[{},{},{}****]这样的额数据结构,encoding="utf_8_sig",encoding="gb18030”,我这边解决中文编码问题

如何使用pandas生成/读取csv文件

是不是很方便就,2行代码即可搞定保存,是不是比上次讲的方法简单好多,其实很多方法,还有python的优秀库,都使python这门语言在数据分析领域有极大的优势

如何使用pandas生成/读取csv文件

方法二:

流程:模拟登录→获取Html页面→正则解析所有符合条件的行→逐一将符合条件的行的所有列存入到CSVData[]临时变量中→写入到CSV文件中

核心代码:

####写入csv文件中 with open(self.CsvFileName, 'wb') as csvfile: spamwriter = csv.writer(csvfile, dialect='excel') #设置标题 spamwriter.writerow(["游戏账号","用户类型","游戏名称","渠道","充值类型","充值金额","返利金额","单号","日期"]) #将CsvData中的数据循环写入到CsvFileName文件中 for item in self.CsvData: spamwriter.writerow(item)

完整代码:

# coding=utf-8 import urllib import urllib2 import cookielib import re import csv import sys  class Pyw(): #初始化数据 def __init__(self): #登录的Url地址 self.LoginUrl="http://v.pyw.cn/login/check" #所要获取的Url地址 self.PageUrl="http://v.pyw.cn/Data/accountdetail/%s" # 传输的数据:用户名、密码、是否记住用户名 self.PostData = urllib.urlencode({ "username": "15880xxxxxx", "password": "a123456", "remember": "1" }) #第几笔记录 self.PageIndex=0; #循环获取共4页内容 self.PageTotal=1 #正则解析出tr self.TrExp=re.compile("(?isu)<tr[^>]*>(.*?)</tr>") #正则解析出td self.TdExp = re.compile("(?isu)<td[^>]*>(.*?)</td>") #创建cookie self.cookie = cookielib.CookieJar() #构建opener self.opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(self.cookie)) #解析页面总页数 self.Total=4 #####设置csv文件 self.CsvFileName="Pyw.csv" #####存储Csv数据 self.CsvData=[]  #解析网页中的内容 def GetPageItem(self,PageHtml): #循环取出Table中的所有行 for row in self.TrExp.findall(PageHtml): #取出当前行的所有列 coloumn=self.TdExp.findall(row) #判断符合的记录 if len(coloumn) == 9: # print "游戏账号:%s" % coloumn[0].strip() # print "用户类型:%s" % coloumn[1].strip() # print "游戏名称:%s" % coloumn[2].strip() # print "渠道:%s" % coloumn[3].strip() # print "充值类型:%s" % coloumn[4].strip() # print "充值金额:%s" % coloumn[5].strip().replace("¥", "") # print "返利金额:%s" % coloumn[6].strip().replace("¥", "") # print "单号:%s" % coloumn[7].strip() # print "日期:%s" % coloumn[8].strip() #拼凑行数据 d=[coloumn[0].strip(), coloumn[1].strip(), coloumn[2].strip(), coloumn[3].strip(), coloumn[4].strip(), coloumn[5].strip().replace("¥", ""), coloumn[6].strip().replace("¥", ""), coloumn[7].strip(), coloumn[8].strip()] self.CsvData.append(d)  #模拟登录并获取页面数据 def GetPageHtml(self): try: #模拟登录 request=urllib2.Request(url=self.LoginUrl,data=self.PostData) ResultHtml=self.opener.open(request) #开始执行获取页面数据 while self.PageTotal<=self.Total: #动态拼凑所要解析的Url m_PageUrl = self.PageUrl % self.PageTotal #计算当期第几页 self.PageTotal = self.PageTotal + 1 #获取当前解析页面的所有内容 ResultHtml=self.opener.open(m_PageUrl) #解析网页中的内容 self.GetPageItem(ResultHtml.read())  ####写入Csv文件中 with open(self.CsvFileName, 'wb') as csvfile: spamwriter = csv.writer(csvfile, dialect='excel') #设置标题 spamwriter.writerow(["游戏账号","用户类型","游戏名称","渠道","充值类型","充值金额","返利金额","单号","日期"]) #将CsvData中的数据循环写入到CsvFileName文件中 for item in self.CsvData: spamwriter.writerow(item)  print "成功导出CSV文件!" except Exception,e: print "404 error!%s" % e #实例化类 p=Pyw() #执行方法 p.GetPageHtml()

导出结果

如何使用pandas生成/读取csv文件

读取CSV

import pandas as pddata = pd.read_table('地址', sep=",")['网址'].valuesprint(data[1])

感谢各位的阅读!关于“如何使用pandas生成/读取csv文件”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

如何使用pandas生成/读取csv文件

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

如何使用pandas生成/读取csv文件

这篇文章给大家分享的是有关如何使用pandas生成/读取csv文件的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。前言csv是我接触的比较早的一种文件,比较好的是这种文件既能够以电子表格的形式查看又能够以文本的形式
2023-06-20

python使用pandas读取csv文件的方法

这篇文章主要介绍了python使用pandas读取csv文件的方法,本文结合示例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
2022-12-23

node.js生成与读取csv文件方法详解

这篇文章主要介绍了node.js生成与读取csv文件方法详解,需要的朋友可以参考下
2022-11-13

如何使用pandas正确读取txt文件

如何使用pandas正确读取txt文件,需要具体代码示例Pandas是一个广泛使用的Python数据分析库,它可以用于处理各种各样的数据类型,包括CSV文件、Excel文件、SQL数据库等。同时,它也可以用于读取文本文件,例如txt文件。
如何使用pandas正确读取txt文件
2024-01-19

pandas如何读取excel文件

本篇内容主要讲解“pandas如何读取excel文件”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“pandas如何读取excel文件”吧!pandas读取excel文件的方法:首先创建一个表格,
2023-06-20

pandas如何读取txt文件

pandas读取txt文件的步骤:1、安装Pandas库;2、使用“read_csv”函数读取txt文件,并指定文件路径和文件分隔符;3、Pandas将数据读取为一个名为DataFrame的对象;4、如果第一行包含列名,则可以通过将head
pandas如何读取txt文件
2023-11-21

如何利用Python快速读取CSV文件

使用 pandas 库可快速读取 csv 文件:首先安装 pandas。使用 read_csv() 函数读取 csv 文件并将其存储在数据框中。使用 head() 函数查看数据框的前几行。通过对数据框进行分组并使用 sum() 函数,可以快
如何利用Python快速读取CSV文件
2024-04-04

pycharm读取csv文件如何不省略

要使用 pycharm 读取 csv 文件而不省略数据,可以: 1. 调整列宽; 2. 启用换行; 3. 使用第三方库; 4. 导出为不同格式。通过这些方法,确保所有信息都可用。如何使用 PyCharm 读取 CSV 文件而不省略数据当使
pycharm读取csv文件如何不省略
2024-04-18

R语言中如何读取CSV文件

在R语言中,可以使用read.csv()函数来读取CSV文件。例如,假设我们有一个名为data.csv的CSV文件,可以使用以下代码将其读取到R环境中:data <- read.csv("data.csv")在上面的代码中,“data.c
R语言中如何读取CSV文件
2024-04-08

perl如何读取csv文件中的一行

在Perl中,可以使用Text::CSV模块来读取CSV文件。下面是一个示例代码,演示了如何读取CSV文件中的一行:```perluse strict;use warnings;use Text::CSV;my $csv = Text::C
2023-10-07

python中如何读取和写入CSV文件

本文小编为大家详细介绍“python中如何读取和写入CSV文件”,内容详细,步骤清晰,细节处理妥当,希望这篇“python中如何读取和写入CSV文件”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。CSV(Comma
2023-07-04

pandas教程:详解如何使用该库读取Excel文件

Pandas 教程:详解如何使用该库读取 Excel 文件,需要具体代码示例Pandas 是一种常用的数据处理库,具有很多强大的功能,尤其是在数据处理方面非常方便。在实际的数据处理过程中,经常需要读取 Excel 文件。本文将详解如何使用
pandas教程:详解如何使用该库读取Excel文件
2024-01-19

一步步教你如何用Python读取CSV文件

要读取一个csv文件,可以使用python的csv库,具体步骤如下:导入csv库。使用open()函数打开csv文件。使用csv.reader()函数读取文件内容并解析成一个reader对象。遍历reader对象来逐行读取csv数据。一步步
一步步教你如何用Python读取CSV文件
2024-04-04

Python文本文件与csv文件如何读取与写入

这篇“Python文本文件与csv文件如何读取与写入”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Python文本文件与cs
2023-06-29

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录