我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Python的pickle序列化和JSON序列化实例分析

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Python的pickle序列化和JSON序列化实例分析

本文小编为大家详细介绍“Python的pickle序列化和JSON序列化实例分析”,内容详细,步骤清晰,细节处理妥当,希望这篇“Python的pickle序列化和JSON序列化实例分析”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。

常用的标准库

序列化模块

import pickle
序列化和反序列化

把不能直接存储的数据变得可存储,这个过程叫做序列化。把文件中的数据拿出来,回复称原来的数据类型,这个过程叫做反序列化。

在文件中存储的数据只能是字符串,或者是字节流,不能是其它的数据类型,但是如果想要将其存储就需要序列化。

Python中的序列化模块叫做 pickle,PHP等其它的一些语言将其称作serialize 或者unserialize,每个语言的序列化功能可以序列化它本身的一切数据类型。

使用场景

现在存在一段数据,现在并不需要他,但是说不定什么时候我就要用它,那么最好的方法就是将这段数据保存起来。

保存这段数据一般来说有那么几种方法(入库或者保存文件),但是这段数据很复杂,而保存在数据库中需要特定的数据格式,入库的话就非常的麻烦了,而且我不想破坏数据的原有格式,那么可以选择保存为文件。

如下所示:保存文件会遇到种种的麻烦问题。

# 这是我想要保存的一段数据
lst = ['A', 'B', 'C']
# 直接使用open函数不能将非字符串和非字节流的数据写入文件
with open('data.txt', 'w', encoding='UTF-8') as fp :
    fp.write(lst)
# !!! TypeError
# 将数据变成字符串就破坏了原有的数据结构(如果很复杂的数据结构几乎没有复原的可能性)
lst = str(lst)
# 将数据变成字节流:只能将字符串变成字节流数据!

现在就可以使用序列化功能,将数据序列化成为字节流的格式,然后存在文件当中,当需要的时候,再从文件中读取出来,然后反序列化成为数据原来的样子,而且保证原数据的数据结构没有变化。

而且可以序列化语言当中的任何数据类型,就是说不止是基本的数据类型,还有函数、类、对象……

dumps & loads

dumps将任意对象序列化成bytes数据,loads将序列化成为bytes的数据反序列成数据原本的格式。

注意:只能反序列化被序列化的数据

import pickle# 这是我想要保存的一段数据lst = ['A', 'B', 'C']# dumps 把任意对象序列化成bytesres = pickle.dumps(lst)print(res)  # b'\x80\x03]q\x00(X\x01\x00\x00\x00Aq\x01X\x01\x00\x00\x00Bq\x02X\x01\x00\x00\x00Cq\x03e.'print(type(res))  # <class 'bytes'># 序列化后的bytes数据可以写入文件中。# loads 把任意bytes反序列化成为原来的数据lst = pickle.loads(res)print(lst)  # ['A', 'B', 'C']print(type(lst))  # <class 'list'># 尝试反序列化其它的bytes数据char = '你好'by_char = char.encode()new_char = pickle.loads(by_char)  # _pickle.UnpicklingError: invalid load key, '\xe4'.
dump & load

含义和上述的相同,只是这个可以直接操作IO对象,省时省力。

import pickle# 这是我想要保存的一段数据lst = ['A', 'B', 'C']# dumps 和 loads 配合文件操作# 序列化后写入文件with open('test.txt', 'wb') as fp:    data = pickle.dumps(lst)    fp.write(data)# 读取文件反序列化with open('test.txt', 'rb') as fp:    data = fp.read()    lst = pickle.loads(data)# dump 和 load 配合文件操作# 序列化写入文件with open('test.txt', 'wb') as fp:    pickle.dump(lst, fp)# 读取文件反序列化with open('test.txt', 'rb') as fp:    lst = pickle.load(fp)

JSON序列化模块

import json
使用场景

序列化后的数据,如果想在多种语言中都可以流通怎么办?每种语言都有自己的语言特性,有些语言中的数据是特有的,那么序列化后的数据该怎么流通呢?

每种语言虽然各有自己的特点,但是几乎所以的语言都是师出同门,天下语言无不出C者。所以将每种语言共同存在的数据格式按照统一的标准去序列化就可以了,JSON诞生了。

json一般存储为json文件。

支持的数据类型

python中支持JSON序列化的数据一共有八种类型:

int、float、bool、str、list、tuple、dict、None

JSON序列化支持这几种数据类型是因为JSON中就只支持这几种数据类型:

如下为python中的数据类型对应json中的数据类型;

python数据类型JSON数据类型
intint
floatfloat
bool(True,False)bool(true,false)
Nonenull
strstr(必须双引号)
list([])、tuple(())Array([])
dict({})Object({})(键必须是双引号)

注意:

  1. JSON中没有元组类型,所以会变成列表;

  2. JSON中的对象必须使用字符串作为键,所以python中的字典数据中的非字符串键,会变成对应的JSON数据然后强转成为字符串;

import jsondict_var = {1: 1, 2.2: 2.2, False: True, '123': '123', "234": "234", None: None}json_obj = json.dumps(dict_var)dict_var = json.loads(json_obj)print(dict_var)# {'1': 1, '2.2': 2.2, 'false': True, '123': '123', '234': '234', 'null': None}
JSON和pickle的区别

JSON可以序列化python八种数据,序列化为字符串。

pickle可以序列化python所有的数据类型,序列化为字节流。

序列化函数

JSON序列化函数和pickle的一样,名称和使用方法基本一样:

方法含义
dumps序列化
loads反序列化
dump序列化写入文件
load读取文件反序列化

这里注意一下序列化方法的几个常用参数:

ensure_asscii 默认为True, 以ACSII格式编码,以Unicode显示;

sort_keys 默认为True, 对字典的键进行排序;

indent默认为None, json格式化默认是一行不加缩进的,如果indent是一个正整数,就以该缩进级别进行换行,增强可视化。

import json# 开启排序dict_var = {'B': '2', 'A': '1'}print(dict_var)  # {'B': '2', 'A': '1'}json_char = json.dumps(dict_var, ensure_ascii=False, sort_keys=True)dict_var = json.loads(json_char)print(dict_var)  # {'A': '1', 'B': '2'}# 关闭排序dict_var = {'B': '2', 'A': '1'}print(dict_var)  # {'B': '2', 'A': '1'}json_char = json.dumps(dict_var, ensure_ascii=False, sort_keys=False)dict_var = json.loads(json_char)print(dict_var)  # {'B': '2', 'A': '1'}# dump 也一样哦
json和pickle实际使用过程中的一些问题

在对文件进行操作的时候:

  1. json可以连续dump,但是不能连续load

  2. pickle可以连续dump和load

如下解释:

# json 可以连续dump,但是不能连续loadimport json# 序列化数据lst1 = [1, 2, 3]lst2 = [4, 5, 6]lst3 = [7, 8, 9]# 序列化写入文件with open('test.json', 'w', encoding='UTF-8') as fp:    json.dump(lst1, fp)    json.dump(lst2, fp)    json.dump(lst3, fp)# 读取文件反序列化with open('test.json', 'r', encoding='UTF-8') as fp:    data1 = json.load(fp)  # ERROR    data2 = json.load(fp)    data3 = json.load(fp)# !!! json.decoder.JSONDecodeError: Extra data: line 1 column 10 (char 9)

因为 json.dump 方法序列化写入文件的时候,写入了两个及以上的数据,之后 json.load 方法在读的时候又是一次性将整个文件中的数据读取出来,这个时候,反序列化的数据成了 [1, 2, 3][4, 5, 6][7, 8, 9] ,这明显不是一个json支持的数据格式,所以 json.load 失败了。

再来看pickle是怎么样的:

# pickle 可以连续dump,也可以连续loadimport pickle# 序列化数据lst1 = [1, 2, 3]lst2 = [4, 5, 6]lst3 = [7, 8, 9]# 序列化写入文件with open('pickle.txt', 'wb') as fp:    pickle.dump(lst1, fp)    pickle.dump(lst2, fp)    pickle.dump(lst3, fp)# 读取文件反序列化with open('pickle.txt', 'rb') as fp:    data1 = pickle.load(fp)  # [1, 2, 3]    print(data1)    data2 = pickle.load(fp)  # [4, 5, 6]    print(data2)    data3 = pickle.load(fp)  # [7, 8, 9]    print(data3)# 尝试先逐行读取,再反序列化with open('pickle.txt', 'rb') as fp:    datum = fp.readlines()    print(len(datum))  # 1        for data in datum:        data = pickle.loads(data)        print(data)  # [1, 2, 3]   # 只能读出一个

可以看到 pickle.load 将数据都读出来了,这是因为 pickle.dump 在写入数据的时候在每条数据后都加上了一个标记(有些人解释说是换行,但是文件中并没有换行,逐行使用 fp.readlines 逐行读取的时候也只能获取一条,但是在文件中所有的数据都是在同一行的,我也不太懂了(无奈)),然后 pickle.load 每次就只会读一条数据,从IO指针读到每条数据后的那个标记为止,所以,pickle 可以连续的 load

怎么解决json的这个问题?

其实上面的这个问题,我个人认为是一种不规范的操作。因为 json.load 会一次性的读取整个文件中的内容,你却在一个文件中写入了不止一条的数据,那么在反序列化的时候当然会报错了。所以我认为:

json的主要作用多语言之前的数据传递和数据存储,每个JSON文件中最好只储存一条完整的数据。

但是我就想在一个json文件中存多个数据呢?

其实思路很简单,关键就是读取文件然后反序列化的时候,必须是一条数据、一条数据的反序列化,类似如下:

import json# 序列化数据lst1 = [1, 2, 3]lst2 = [4, 5, 6]lst3 = [7, 8, 9]# 序列化写入文件,每写入一条数据插一个换行with open('test.json', 'w', encoding='UTF-8') as fp:    json.dump(lst1, fp)    fp.write('\n')    json.dump(lst2, fp)    fp.write('\n')    json.dump(lst3, fp)# 读取文件反序列化(逐行读取数据,然后反序列化)with open('test.json', 'r', encoding='UTF-8') as fp:    datum = fp.readlines()    print(len(datum))  # 3    for data in datum:        data = json.loads(data)        print(data)  # [1, 2, 3]                     # [4, 5, 6]                     # [7, 8, 9]

pickle和json的区别总结

  • json序列化后的数据为字符串,pickle序列化后的数据为字节流;

  • json支持八种数据类型(int、float、bool、str、list、tuple、dict、None),pickle支持python的一切数据类型;

  • json一般用于多语言间的数据交流,pickle一般用于python之间数据交流;

读到这里,这篇“Python的pickle序列化和JSON序列化实例分析”文章已经介绍完毕,想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会,如果想了解更多相关内容的文章,欢迎关注编程网行业资讯频道。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Python的pickle序列化和JSON序列化实例分析

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Python的pickle序列化和JSON序列化实例分析

本文小编为大家详细介绍“Python的pickle序列化和JSON序列化实例分析”,内容详细,步骤清晰,细节处理妥当,希望这篇“Python的pickle序列化和JSON序列化实例分析”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一
2023-06-30

python Json与pickle数据序列化

在程序运行的过程中,所有的变量都是在内存中。一旦程序结束,变量所占用的内存就被操作系统全部回收。为了避免数据丢失,把变量从内存中变成可存储或传输的过程称之为序列化序列化之后,就可以把序列化后的内容写入磁盘,或者通过网络传输到别的机器上。反过
2023-01-30

json序列化的示例分析

这篇文章主要为大家展示了“json序列化的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“json序列化的示例分析”这篇文章吧。json序列化(javaBean转Json的细节)Java对
2023-06-29

如何使用Python中的pickle和JSON进行对象序列化和反序列化

如何使用Python中的pickle和JSON进行对象序列化和反序列化Python是一种简单而强大的编程语言,其内置了许多有用的库和模块,使开发人员能够快速进行各种任务。其中,pickle和JSON是两个常用的模块,用于对象序列化和反序列化
2023-10-22

Java序列化和反序列化示例分析

这期内容当中小编将会给大家带来有关Java序列化和反序列化示例分析,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。序列化是为了把Java对象转化为字节序列(字节流)的过程。然后深拷贝是通过对流的操作来实现的
2023-06-26

Python中序列化与反序列化的示例分析

这篇文章将为大家详细讲解有关Python中序列化与反序列化的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。初识序列化与反序列化什么是序列化?通俗一点来说,序列化就是将 对象的信息 或者 数据结构的
2023-06-29

Ezpop pop序列化链反序列化实例分析

这篇文章主要介绍了Ezpop pop序列化链反序列化实例分析的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Ezpop pop序列化链反序列化实例分析文章都会有所收获,下面我们一起来看看吧。
2023-06-30

详解Python之数据序列化(json、pickle、shelve)

一、前言 1. 现实需求 每种编程语言都有各自的数据类型,其中面向对象的编程语言还允许开发者自定义数据类型(如:自定义类),Python也是一样。很多时候我们会有这样的需求:把内存中的各种数据类型的数据通过网络传送给其它机器或客户端;把内存
2022-06-04

Java对象的序列化和反序列化举例分析

本篇内容介绍了“Java对象的序列化和反序列化举例分析”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!1、什么是序列化与反序列化?  序列化:
2023-06-19

Java序列化与字典功能的序列化实例分析

这篇文章主要介绍了Java序列化与字典功能的序列化实例分析的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Java序列化与字典功能的序列化实例分析文章都会有所收获,下面我们一起来看看吧。两种解决方案前端查询字典数
2023-07-02

Java中序列化与反序列化的示例分析

这篇文章将为大家详细讲解有关Java中序列化与反序列化的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。一、前言序列化:将对象转换为二进制序列在网络中传输或保存到磁盘反序列化:从网络或磁盘中将二进制
2023-06-15

Python反序列化的示例分析

这篇文章给大家分享的是有关Python反序列化的示例分析的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。Python反序列化漏洞Pickle序列化:pickle.dumps() 将对象序列化为字符串、pickle.
2023-06-29

java原生序列化和Kryo序列化性能实例对比分析

简介最近几年,各种新的高效序列化方式层出不穷,不断刷新序列化性能的上限,最典型的包括:专门针对Java语言的:Kryo,FST等等跨语言的:Protostuff,ProtoBuf,Thrift,Avro,MsgPack等等这些序列化方式的性
2023-05-31

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录