位置：首页-资讯-后端开发

Python Unicode编码

2023-01-31 03:24

短信预约 -IT技能 免费直播动态提醒

使用技巧

事实上，只要遵守以下规则，可以规避90%由于Unicode字符串处理引起的bug，剩下的10%通过python的库和模块能够解决。

程序中出现字符串时一定要加个前缀u。
不要用str()函数，用unicode()代替。
不要用过时的string模块——如果传给它的是非ASCII字符，它会把一切搞砸。
不到必须时不要在你的程序里面解码unicode字符。只在你要写入文件或数据库或者网络时，才调用encode()函数；相应地，只在你需要把数据读回来的时候才调用decode()函数。

从现实中得来的教训

失误#1：你必须在一个极有限的时间内写出一个大型的应用，而且需要其他语言的支持，但是产品经理并没有明确定义这一点。你并没有考虑Unicode的兼容，直到项目快要结束……这时候再添加Unicode的支持几乎不太可能，不是吗？

结果#1：没能预测到最终用户对其他语言界面的需求，在集成他们用的面向其他语种的应用时又没有使用Unicode支持。更新整个系统即让人觉得枯燥，又浪费时间。

失误#2：在源码中到处使用string模块或者str()和chr()函数。

结果#2：通过全局的查找替换把str()和chr()替换成unicode()和unichr(),但是这样一来很可能就不能再用pickle模块，要用的话只能把所有要pickle处理的数据存成二进制形式，这样一来就必须修改数据库的结构，而修改数据库结构意味着全部推到重来。

失误#3：不能确定所有辅助系统都完全地支持Unicode。

结果#3：不得不去为那些系统打补丁，而其中有些系统可能你根本就没有源码。修复对Unicode支持的bug可能会降低代码的可靠性，而且非常有可能引入新的bug。

总结：使应用程序完全支持Unicode，兼容其它的语言本身就是一个工程。它需要详细的考虑、计划。所有涉及的软件、系统都需要检查，包括python的标准库和其他将要用到的第三方扩展模块。你甚至有可能需要组建一个经验丰富的团队来专门负责国际化（I18N）问题。

节选自《python核心编程（第二版）》P130、P131

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Python Unicode

阅读原文内容投诉

Python Unicode编码

下载Word文档到电脑，方便收藏和打印～

下载Word文档

猜你喜欢

Python Unicode编码

使用技巧事实上，只要遵守以下规则，可以规避90%由于Unicode字符串处理引起的bug，剩下的10%通过python的库和模块能够解决。程序中出现字符串时一定要加个前缀u。不要用str()函数，用unicode()代替。不要用过时的str

2023-01-31

python编码转换(unicode /

点击(此处)折叠或打开 #-*- coding: utf-8 -*-import sys print sys.getfilesystemenco

2023-01-31

Python 编码处理-str与Unicode的区别

一篇关于STR和UNICODE的好文章整理下python编码相关的内容注意: 以下讨论为Python2.x版本, Py3k的待尝试开始用python处理中文时，读取文件或消息，http参数等等一运行，发现乱码(字符串处理，读写文件

2022-06-04

字符编码 ASCII unicode U

字符串也是一种数据类型，但是，字符串比较特殊的是还有一个编码问题。因为计算机只能处理数字，如果要处理文本，就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特（bit）作为一个字节（byte），所以，一个字节能表示的最大的整数

2023-01-30

字符编码ascii、unicode、ut

计算机是美国人发明和最早使用的，他们为了解决计算机处理字符串的问题，就将数字字母和一些常用的符号做成了一套编码，这个编码就是ASIIC码。ASIIC码包括数字大小写字母和常用符号，一共128个，1字节(byte)=8bit，8bit能表示的

2023-01-30

python解决汉字编码问题：Unicode Decode Error

前言最近由于项目需要，需要读取一个含有中文的txt文档，完了还要保存文件。文档之前是由base64编码，导致所有汉字读取显示乱码。项目组把base64废弃之后，先后出现两个错误：ascii codec can't encode chara

2022-06-04

python unicode编码设置的方法是什么

在Python中，可以使用以下方法设置Unicode编码：1. 在脚本的开头添加`# -*- coding: utf-8 -*-`，这会告诉Python解释器使用UTF-8编码处理源代码。可以根据需要选择其他编码，如`utf-16`或`la

2023-09-25

JAVA关于Unicode编码问题

在Java中，Unicode编码是用来表示字符的标准编码方式。Java中的字符类型char是基于Unicode编码的，它使用16位（2个字节）来表示一个字符。Java中的字符串类型String也是基于Unicode编码的，它可以存储任意Un

2023-08-19

在线Unicode编码转换工具

在线Unicode编码转换工具是一种用于将字符或文本转换为Unicode编码的工具。功能有：1、字符转Unicode编码；2、文本转Unicode编码：；3、Unicode编码转字符；4、Unicode编码转文本。Unicode编码是一种用

2023-07-10

C# Unicode编码解码如何实现

本文小编为大家详细介绍“C# Unicode编码解码如何实现”，内容详细，步骤清晰，细节处理妥当，希望这篇“C# Unicode编码解码如何实现”文章能帮助大家解决疑惑，下面跟着小编的思路慢慢深入，一起来学习新知识吧。Unicode是计算机

2023-07-02

Python中的字符串操作和编码Unicode详解

本文主要给大家介绍了关于 Python中的字符串操作和编码Unicode的一些知识，下面话不多说，需要的朋友们下面来一起学习吧。字符串类型str：Unicode字符串。采用''或者r''构造的字符串均为str，单引号可以用双引号或者三引号

2022-06-04

native2ascii unicode编码和中文转换

在Java编程语言中，native2ascii是一个命令行工具，用于将包含特殊字符和非ASCII字符的文本转换为Unicode编码。它主要用于处理包含中文字符的文本，将其转换为\uXXXX格式的Unicode编码。使用native2asci

2023-09-12

php中文如何转unicode编码

这篇文章主要介绍了php中文如何转unicode编码，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。php中文转unicode编码的方法：首先创建一个PHP示例文件；然后通过“

2023-06-09

php中unicode编码如何转汉字

这篇文章主要介绍php中unicode编码如何转汉字，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！php unicode编码转汉字的方法：首先创建一个PHP示例文件；然后通过“function unicodeDeco

2023-06-08

python unicode详解 python中的unicode

在Python中，Unicode是一种字符编码标准，它为全球范围内的所有字符提供了唯一的标识符。Unicode编码由一个固定的编码空间组成，目前包含超过130,000个字符，涵盖了几乎所有的语言和符号。在Python 3中，默认的字符串类型

2023-08-24

Java提供多种方法对Unicode字符进行编码和解码。编码方式包括：String.getBytes()、String.getBytes(charsetName)、Charset.encode(ByteBuffer)等。解码方式包括：String(byte[]bytes)、String(byte[]bytes,charsetName)、Charset.decode(ByteBuffer)等。选择合适的字符集（如UTF-8、UTF-16LE、UTF-32）至关重要，以确保正确处理Unicode字符。

2024-04-02

如何解决Python unicode ascii编码在windows上的问题

这期内容当中小编将会给大家带来有关如何解决Python unicode ascii编码在windows上的问题，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。unicode ascii编码在计算机的相关实际

2023-06-17

为什么说php不支持unicode编码

本篇内容介绍了“为什么说php不支持unicode编码”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！php不支持unicode是指PHP字符

2023-06-20

编程热搜

Python 学习之路 - Python
一、安装Python34Windows在Python官网（https://www.python.org/downloads/）下载安装包并安装。Python的默认安装路径是：C:\Python34配置环境变量：【右键计算机】--》【属性】-
chatgpt的中文全称是什么
chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型，它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，并协助人类完成一系列
C/C++中extern函数使用详解
C/C++可变参数的使用
可变参数的使用方法远远不止以下几种，不过在C,C++中使用可变参数时要小心，在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少，否则会产生访问越界，运气不好的话还会导致程序崩溃
css样式文件该放在哪里
php中数组下标必须是连续的吗
Python 3 教程
Python 3 教程 Python 的 3.0 版本，常被称为 Python 3000，或简称 Py3k。相对于 Python 的早期版本，这是一个较大的升级。为了不带入过多的累赘，Python 3.0 在设计的时候没有考虑向下兼容。 Python
Python pip包管理
一、前言在Python中，安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具： easy_install 和 pip ，目前官方推荐使用 pip。
ubuntu如何重新编译内核
改善Java代码之慎用java动态编译