我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Python 中有关中文编码解码小记

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Python 中有关中文编码解码小记

简单记录几点,以备后忘:


1、python 中的默认编码方式为ascii

In [1]: import sys
In [2]: sys.getdefaultencoding()
Out[2]: 'ascii'


2、设置python 中的默认编码方式

In [1]: import sys
In [2]: reload(sys)
<module 'sys' (built-in)>
In [3]: sys.setdefaultencoding('utf-8')
In [4]: sys.getdefaultencoding()
'utf-8'


3、python 头顶部设置的编码格式 # _*_ coding: utf-8 _*_  不会影响默认python 的默认编码格式

#! /usr/bin/env python
# _*_ coding: utf-8 _*_

import sys
print sys.getdefaultencoding()

执行后的结果为 ascii 编码格式


那么python 头顶部设置的编码格式有什么作用呢?

#1、如果代码中有中文注释,就需要此声明
#2、比较高级的编辑器(比如我的emacs),会根据头部声明,将此作为代码文件的格式
#3、程序会通过头部声明,解码初始化 u"人生苦短",这样的unicode对象,(所以头部声明和代码的存储格式要一致) 

以上观点来自于 http://python.jobbole.com/81244/ 此文


那做个测试吧:

#! /usr/bin/env python
# _*_ coding: utf-8 _*_

import sys
print sys.getdefaultencoding()

#reload(sys)
#sys.setdefaultencoding('utf-8')

# 会被编码为unicode
s1 = u"这是一个测试1"

# 会被编码为ascii
s2 = "这是一个测试2"

s1.encode('gbk')
s2.encode('gbk')
print s1
print s2

以上测试结果:

ascii
Traceback (most recent call last):
  File "testunicoding.py", line 21, in <module>
    s2.encode('gbk')
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe8 in position 0: ordinal not in range(128)

主要s2这个字符串的默认编码格式为ascii ,无法先decode 成unicode 。出了问题

将默认编码方式更改为utf-8后

#! /usr/bin/env python
# _*_ coding: utf-8 _*_

import sys
print sys.getdefaultencoding()

reload(sys)
sys.setdefaultencoding('utf-8')

print sys.getdefaultencoding()

# 会被编码为unicode
s1 = u"这是一个测试1"

# 会被编码为ascii
s2 = "这是一个测试2"

s1.encode('gbk')
s2.encode('gbk')
print s1
print s2


执行结果:

ascii
utf-8
这是一个测试1
这是一个测试2


免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Python 中有关中文编码解码小记

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Python 中有关中文编码解码小记

简单记录几点,以备后忘:1、python 中的默认编码方式为asciiIn [1]: import sysIn [2]: sys.getdefaultencoding()Out[2]: 'ascii'2、设置python 中的默认编码方式I
2023-01-31

Python中,关于读取文件编码解码的问

UnicodeDecodeError: 'gbk' codec can't decode byte 0xb1 in position 94: illegal multibyte sequence 有时候用open()方
2023-01-31

Python 中文编码

Python continue 语句跳出本次循环,而break跳出整个循环。
Python 中文编码
2024-04-23

SQLite3中文编码 Python

读取十万多条文本写入SQLite类型数据库,由于文本中存在中文字符,插入到数据库没错,取出时一直是UnicodeDecodeError,导致折腾了一天。 最后的解决方法:Python连接数据时进行如下设置:db=sqlite3.connec
2023-01-31

详解python中文编码问题

目录 1. 在Python中使用中文1.1 Windows控制台1.2 Windows IDLE(在Shell上运行)1.3 在IDLE上运行代码 1.4 Windows Eclipse1.5
2022-06-02

python如何解决中文编码乱码问题

小编给大家分享一下python如何解决中文编码乱码问题,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!一、什么是字符编码。要彻底解决字符编码的问题就不能不去了解到底
2023-06-25

Python中文编码问题

近日用Python写一个小程序,从数据库(MS SQL)中读取数据,对数据进行组织后发送到邮箱,在数据内容有中文的地方始终报错,汉字使用UTF-8进行编码倒是不报错了,但发送到邮箱的内容,从数据库中读取出来的汉字却成乱码了,经多方查找资料,
2023-01-31

关于Python中的编码规范

这篇文章主要介绍了关于Python中的编码规范,一千个程序员有一千套编码规范,统一的编码规范可以提高开发效率,需要的朋友可以参考下
2023-05-15

python中文编码&json中文输出问

python2.x版本的字符编码有时让人很头疼,遇到问题,网上方法可以解决错误,但对原理还是一知半解,本文主要介绍 python 中字符串处理的原理,附带解决 json 文件输出时,显示中文而非 unicode 问题。首先简要介绍字符串编码
2023-01-30

python中文转换url编码

今天要处理百度贴吧的东西。想要做一个关键词的list,每次需要时,直接添加 到list里面就可以了。但是添加到list里面是中文的情况(比如‘丽江’),url的地址编码却是'%E4%B8%BD%E6%B1%9F',因此需 要做一个转换。这里
2023-01-31

python 中文url编码处理

可以直接处理中英混排的urlfrom urllib.parse import quote (python3)from urllib import quote (python2)url = 'http://www.baidu.com
2023-01-31

简单解决Python文件中文编码问题

读写中文 需要读取utf-8编码的中文文件,先利用sublime text软件将它改成无DOM的编码,然后用以下代码:with codecs.open(note_path, 'r+','utf-8') as f: line=f.readli
2022-06-04

PHP中JSON编码解码遇到中文乱码怎么办?

PHP中使用JSON编码和解码时,遇到中文乱码是一个常见问题。这通常是由于服务器端和客户端之间字符编码不统一导致的。下面将详细介绍在PHP中遇到JSON编码解码中文乱码时的解决方案,同时提供具体的代码示例。首先,要明确的是,PHP中的js
PHP中JSON编码解码遇到中文乱码怎么办?
2024-03-08

Python中的字节编码和解码技巧有哪些?

Python中的字节编码和解码技巧有哪些?字节编码和解码是我们在处理文本数据时常常遇到的问题。在Python中,有许多内置的函数和模块可以帮助我们进行字节编码和解码操作。本文将介绍几种常见的字节编码和解码技巧,并给出相应的代码示例。使用en
2023-10-22

SQLite3中文编码 Python的实现

读取十万多条文本写入SQLite类型数据库,由于文本中存在中文字符,插入到数据库没错,取出时一直是UnicodeDecodeError,导致折腾了一天。 最后的解决方法: Python连接数据时进行如下设置: db=sqlite3.conn
2022-06-04

python中文转换url编码(转)

今天修改一个天气预报的东西,但输入城市不能得到天气预报,感觉是编码不对,因为你输入一个城市(比如‘杭州’),url的地址编码却是'%E4%B8%BD%E6%B1%9F',因此需 要做一个转换。这里我们就用到了模块urllib。>>> imp
2023-01-31

Python中文乱码解决

python 添加中文注释时出现运行失败。需要在顶部设置编码。# coding=UTF-8'''Created on 2013-8-28@author: xmyj-0210'''number = 23running = True#while
2023-01-31

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录