我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Python 读取 .gz 文件全过程

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Python 读取 .gz 文件全过程

Python 读取 .gz 文件

读取.gz 文件需要使用gzip 包,如果没有安装可以自行在终端安装

pip install gzip
import gzip
path = "" #你的文件路径
f = gzip.open(path, 'rb')
 
for line in f.readlines(): # 按行进行读取
    s = line.decode() # 读取之后要进行解码
    print(s) # s 为string类型,就是我们读取的文件中的一行

也可以批量读取,批量读取文件使用os包对文件夹中的所有文件进行

import gzip
import os\
 
path = "" #表示你要打开的文件夹
files = os.listdir(path) #files 是path中存放的所有文件名集合
for file in files:
    f = gzip.open(path+file, 'rb')
    for line in f.readline():
        print(line)

Python 读取gz文件,字符串与字节串的相互转换

首先是字节串转字符串,也就是str:

b = b'some byte array'
 
str(b, encoding = "utf-8")  
#or
bytes.decode(b)

然后是字符串转为字节串:

s = 'some string'
 
bytes(s, encoding = "utf8")  
#or
str.encode(s)

fastq.gz文件读取

with gzip.open(fq,'r') as fastq:
    try:
        while True:
            line1 = next(fastq).decode()  # 字节转字符串
            line2 = next(fastq).decode()
            line3 = next(fastq).decode()
            line4 = next(fastq).decode()
            
    except:
            pass

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Python 读取 .gz 文件全过程

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

在 Python 中读取 gzip 文件的过程解析

这篇文章主要介绍了在 Python 中读取 gzip 文件,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
2023-05-19

通过python读取ini配置文件

ini是啥你可以理解为就是一个配置文件的统称吧。比如test.conf,这样的你可以理解为他就是ini文件,里面一般存放一些配置信息。比如数据库的基本信息,一会我们进行讲解!那么ta的好处是啥呢?就是把一些配置信息提出去来进行单独管理,如果
2023-01-31

怎么在python中读取全部文件

本篇文章为大家展示了怎么在python中读取全部文件,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。Python主要用来做什么Python主要应用于:1、Web开发;2、数据科学研究;3、网络爬虫;4
2023-06-14

Python文件读取技巧:读取.py文件步骤

在 python 中读取 .py 文件可以通过两种方法:使用 open() 函数以只读模式打开文件并使用 read() 方法读取内容。使用 pathlib 模块的 path() 对象和 read_text() 方法读取文件。Python 文
Python文件读取技巧:读取.py文件步骤
2024-04-04

python文件读取 readlines

一、需求:有类似如下两个文件需要交差对比,进行处理。 1.txt1231 2.txtABCD二、问题:首先想到的是打开之后,两次for循环就是了#错误写法f1=open(r"D:\pytest\1.txt",'r')f2=o
2023-01-31

Python 读取大文件

在处理大数据时,有可能会碰到好几个 G 大小的文件。如果通过一些工具(例如:NotePad++)打开它,会发生错误,无法读取任何内容。那么,在 Python 中,如何快速地读取这些大文件呢?| 版权声明:一去、二三里,未经博主允许不得转载。
2023-01-31

python读取sqlite文件

import sqlite3这是python内置的,不需要pip install 包数据库里面有很多张表要操作数据库首先要连接conect数据库mydb=sqlite3.connect("alfw.sqlite")然后创建游标cursor来
2023-01-31

python读取table文件

有个table文件, 有时候需要处理header , 可以用linecache 模块#!/usr/bin/env python# -*- coding: ascii -*-import linecacheimport fileinputim
2023-01-31

python读取xlsx文件

我是在win7下读取的。 python版本是:3.5import xlrdimport reimport sqlite3def read_xlsx(): workbook = xlrd.open_workbook('E:\201603
2023-01-31

python读取xml文件

什么是xml?xml即可扩展标记语言,它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。abc.xml    
2023-01-31

python读取大文件

python读取文件对各列进行索引 可以用readlines, 也可以用readline, 如果是大文件一般就用readlined={}a_in = open("testfile.txt", "r")for line in a_in:   
2023-01-31

python读取nc文件

nc文件的处理方式比较多,可以用MATLAB、JAVA、C、python或者其他的语言。我这两天折腾用python读取nc文件,查阅很多资料,左拼右凑的终于读出来了。1)Anaconda的安装这里有详细的讲解。搜索“Anconda”,进入官
2023-01-31

解读requests.session()获取Cookies全过程

这篇文章主要介绍了解读requests.session()获取Cookies全过程,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
2023-02-25

python读取文件方法

f = open("foo.txt")             # 返回一个文件对象line = f.readline()             # 调用文件的 readline()方法while line:    print line,
2023-01-31

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录