我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Python Unicode编码

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Python Unicode编码

使用技巧

事实上,只要遵守以下规则,可以规避90%由于Unicode字符串处理引起的bug,剩下的10%通过python的库和模块能够解决。

  • 程序中出现字符串时一定要加个前缀u。

  • 不要用str()函数,用unicode()代替。

  • 不要用过时的string模块——如果传给它的是非ASCII字符,它会把一切搞砸。

  • 不到必须时不要在你的程序里面解码unicode字符。只在你要写入文件或数据库或者网络时,才调用encode()函数;相应地,只在你需要把数据读回来的时候才调用decode()函数。


从现实中得来的教训

失误#1:你必须在一个极有限的时间内写出一个大型的应用,而且需要其他语言的支持,但是产品经理并没有明确定义这一点。你并没有考虑Unicode的兼容,直到项目快要结束……这时候再添加Unicode的支持几乎不太可能,不是吗?

结果#1:没能预测到最终用户对其他语言界面的需求,在集成他们用的面向其他语种的应用时又没有使用Unicode支持。更新整个系统即让人觉得枯燥,又浪费时间。


失误#2:在源码中到处使用string模块或者str()和chr()函数。

结果#2:通过全局的查找替换把str()和chr()替换成unicode()和unichr(),但是这样一来很可能就不能再用pickle模块,要用的话只能把所有要pickle处理的数据存成二进制形式,这样一来就必须修改数据库的结构,而修改数据库结构意味着全部推到重来。


失误#3:不能确定所有辅助系统都完全地支持Unicode。

结果#3:不得不去为那些系统打补丁,而其中有些系统可能你根本就没有源码。修复对Unicode支持的bug可能会降低代码的可靠性,而且非常有可能引入新的bug。


总结:使应用程序完全支持Unicode,兼容其它的语言本身就是一个工程。它需要详细的考虑、计划。所有涉及的软件、系统都需要检查,包括python的标准库和其他将要用到的第三方扩展模块。你甚至有可能需要组建一个经验丰富的团队来专门负责国际化(I18N)问题。


节选自《python核心编程(第二版)》P130、P131


免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Python Unicode编码

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Python Unicode编码

使用技巧事实上,只要遵守以下规则,可以规避90%由于Unicode字符串处理引起的bug,剩下的10%通过python的库和模块能够解决。程序中出现字符串时一定要加个前缀u。不要用str()函数,用unicode()代替。不要用过时的str
2023-01-31

python编码转换(unicode /

点击(此处)折叠或打开 #-*- coding: utf-8 -*-import sys                                                 print sys.getfilesystemenco
2023-01-31

Python 编码处理-str与Unicode的区别

一篇关于STR和UNICODE的好文章 整理下python编码相关的内容 注意: 以下讨论为Python2.x版本, Py3k的待尝试 开始 用python处理中文时,读取文件或消息,http参数等等 一运行,发现乱码(字符串处理,读写文件
2022-06-04

字符编码 ASCII unicode U

字符串也是一种数据类型,但是,字符串比较特殊的是还有一个编码问题。因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数
2023-01-30

字符编码ascii、unicode、ut

计算机是美国人发明和最早使用的,他们为了解决计算机处理字符串的问题,就将数字字母和一些常用的符号做成了一套编码,这个编码就是ASIIC码。ASIIC码包括数字大小写字母和常用符号,一共128个,1字节(byte)=8bit,8bit能表示的
2023-01-30

python解决汉字编码问题:Unicode Decode Error

前言 最近由于项目需要,需要读取一个含有中文的txt文档,完了还要保存文件。文档之前是由base64编码,导致所有汉字读取显示乱码。项目组把base64废弃之后,先后出现两个错误:ascii codec can't encode chara
2022-06-04

python unicode编码设置的方法是什么

在Python中,可以使用以下方法设置Unicode编码:1. 在脚本的开头添加`# -*- coding: utf-8 -*-`,这会告诉Python解释器使用UTF-8编码处理源代码。可以根据需要选择其他编码,如`utf-16`或`la
2023-09-25

JAVA关于Unicode编码问题

在Java中,Unicode编码是用来表示字符的标准编码方式。Java中的字符类型char是基于Unicode编码的,它使用16位(2个字节)来表示一个字符。Java中的字符串类型String也是基于Unicode编码的,它可以存储任意Un
2023-08-19

在线Unicode编码转换工具

在线Unicode编码转换工具是一种用于将字符或文本转换为Unicode编码的工具。功能有:1、字符转Unicode编码;2、文本转Unicode编码:;3、Unicode编码转字符;4、Unicode编码转文本。Unicode编码是一种用
2023-07-10

C# Unicode编码解码如何实现

本文小编为大家详细介绍“C# Unicode编码解码如何实现”,内容详细,步骤清晰,细节处理妥当,希望这篇“C# Unicode编码解码如何实现”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。Unicode是计算机
2023-07-02

Python中的字符串操作和编码Unicode详解

本文主要给大家介绍了关于 Python中的字符串操作和编码Unicode的一些知识,下面话不多说,需要的朋友们下面来一起学习吧。 字符串类型str:Unicode字符串。采用''或者r''构造的字符串均为str,单引号可以用双引号或者三引号
2022-06-04

native2ascii unicode编码和中文转换

在Java编程语言中,native2ascii是一个命令行工具,用于将包含特殊字符和非ASCII字符的文本转换为Unicode编码。它主要用于处理包含中文字符的文本,将其转换为\uXXXX格式的Unicode编码。使用native2asci
2023-09-12

php中文如何转unicode编码

这篇文章主要介绍了php中文如何转unicode编码,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。php中文转unicode编码的方法:首先创建一个PHP示例文件;然后通过“
2023-06-09

php中unicode编码如何转汉字

这篇文章主要介绍php中unicode编码如何转汉字,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!php unicode编码转汉字的方法:首先创建一个PHP示例文件;然后通过“function unicodeDeco
2023-06-08

python unicode详解 python中的unicode

在Python中,Unicode是一种字符编码标准,它为全球范围内的所有字符提供了唯一的标识符。Unicode编码由一个固定的编码空间组成,目前包含超过130,000个字符,涵盖了几乎所有的语言和符号。在Python 3中,默认的字符串类型
2023-08-24

Java中实现Unicode编码解码的方法

Java提供多种方法对Unicode字符进行编码和解码。编码方式包括:String.getBytes()、String.getBytes(charsetName)、Charset.encode(ByteBuffer)等。解码方式包括:String(byte[]bytes)、String(byte[]bytes,charsetName)、Charset.decode(ByteBuffer)等。选择合适的字符集(如UTF-8、UTF-16LE、UTF-32)至关重要,以确保正确处理Unicode字符。
Java中实现Unicode编码解码的方法
2024-04-02

如何解决Python unicode ascii编码在windows上的问题

这期内容当中小编将会给大家带来有关如何解决Python unicode ascii编码在windows上的问题,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。unicode ascii编码在计算机的相关实际
2023-06-17

为什么说php不支持unicode编码

本篇内容介绍了“为什么说php不支持unicode编码”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!php不支持unicode是指PHP字符
2023-06-20

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录