首发 http://www.everlose.info/notes/2013/10/31/difference-between-python3-to-python2/
这篇文章总结了一些与Python2.6相比Python3.0中的新特性.Python3是一个不向后兼容的版本,有了很多的改变,这些对于Python开发者来说是非常重要的,虽然多数人说Python3真正流行起来还需要一段时间,但是Python3确实有了很大的改进,现在也是时间来学习Python3了。在真正理解Python3中的一些变化之后,会发现其实Python3的变化并没有想象的那么多,主要是修复了一些令人讨厌的地方。
一般在每一个发行版源码的Misc/NEWS
文件中详细描述了每一个细小的变化。
常见的障碍
Print是一个函数
在Python3中print
是个函数,这意味着在使用的时候必须带上小括号,并且它是带有参数的。
old: print "The answer is", 2+2
new: print("The answer is", 2+2)
old: print x, # 末尾加上逗号阻止换行
new: print(x, end="") # 使用空格来代替新的一行
old: print >>sys.staerr, "fatal error"
new: print ("fatal error", file=sys.stderr)
old: print (x, y) # 打印出元组(x, y)
new: print((x, y)) # 同上,在python3中print(x, y)的结果是跟这不同的
在Python3中还可以定义分隔符,使用参数sep来指定.
print("There are <", 2+5, ">possibilities", sep="")
上面代码的结果如下:
There are <7> possibilities
注意:
print()
函数不支持Python2.X中print "A\n", "B"
的结果是"A\nB\n";而在Python3中print("A\n", "B")
的结果是"A\n B\n"
。在刚开始使用Python3的时候,你会发现你经常在交互模式下你还是经常使用老式的语法
print x
,是时候锻炼你的手指用print(x)
来取代它啦。如果你的项目比较大,而又想升级到Python3的时候,不用担心,
2to3
这个工具会将所有的print()
函数。
使用Views和Iterators代替Lists
dict
的方法dict.keys()
,dict.items()
,dict.values()
不会再返回列表,而是返回一个易读的“views”。这样一来,像这样的语法将不再有用了:k = d.keys();k.sort()
,你可以使用k = sorted(d)
来代替。sorted(d)
在Python2.5及以后的版本中也有用,但是Python3效率更高了。
d = {'a': 1}
d.keys() # dict_keys(['a'])
d.items() # dict_items([('a', 1)])
d.values() # dict_values([1])
k = d.keys(); k.sort() # AttributeError: 'dict_keys' object has no attribute 'sort'
同样,
dict.iterkeys()
,dict.iteritems()
,dict.itervalues()
方法也不再支持。map()
和filter()
将返回iterators。如果你真的想要得到列表,list(map(...))
是一个快速的方法,但是更好的方法是使用列表推导(尤其是原代码使用了lambda表达式的时候),或者重写原来的代码,改为不需要使用列表。特别是map()
会给函数带来副作用,正确的方法是改为使用for
循环,因为创建一个列表是非常浪费的事情。Python3中的
range()
函数跟Python2.X的xrange()
函数的作用是一样的,这样可以使用任意的数字,Python3中去除了xrange()
函数。zip()
在Python3中返回的是一个迭代器。
比较符
Python3简化了比较符。
在使用比较符(<,<=,>=,>)时,当相比较的操作数的排序是没有意义的时候将会抛出
TypeError
异常,因此像1 < ''
,0 > None
,len <= len
这样的语句不再合法了。None < None
也会抛出TypeError
异常,而不是返回False
。你应该明白了,胡乱的比较是没有意义的,相比较的元素必须是能够比较的才行。需要注意的是,==
和!=
不包括在内,因为不同类型的,无法比较元素总是不等于另一个的。builtin.sorted
和list.sort()
不再有提供比较函数的cmp参数,只有参数key
和reverse
。cmp()
函数应该当做被去除了,__cmp__()
特殊方法也不再支持。在需要的时候使用__lt__
,__eg__
和__hash__
。
整型数
从本质上来说,
long
重命名了int
,因为在内置只有一个名为int
的整型,但它基本跟之前的long
一样。像
1/2
这样的语句将返回float
,即0.5。使用1//2
来获取整型,这也是之前版本所谓的“地板除”。移除了
sys.maxint
,因为整型数已经没了限制。sys.maxsize
可以用来当做一个比任何列表和字符串下标都要大的整型数。repr()
中比较大的整型数将不再带有L
后缀。八进制数的字面量使用
0o720
代替了0720
。
Text Vs. Data 代替 Unicode Vs. 8-bit
Python3中改变了二进制数据和Unicode字符串。
Python3使用文本和(二进制)数据的理念代替之前的Unicode字符串和8-bit字符串,所有的文本默认是Unicode编码。使用
str
类型保存文本,使用bytes
类型保存数据。当你混淆文本和数据的时候Python3会抛出TypeError
的错误。不能再使用
u"..."
字面量表示unicode文本,而必须使用b"..."
字面量表示二进制数据。因为
str
和bytes
不能弄混,所以你必须显式地将他们进行转换。使用str.encode()
将str
转换为bytes
,使用bytes.decode()
将bytes
转换为str
,也可以使用bytes(s, encoding=...)
和str(b, encoding=...)
。str
和bytes
都是不可变的类型,有一个分离的可变类型的bytearray
可以保存缓存的二进制数据,所有能够接受bytes
的API都能够使用bytearray
。这些可变的API是基于collections.MutableSequence
的。移除了抽象类型
basestring
,使用str
代替。文件默认使用文本类型打开,这也是
open()
函数默认的。如果要打开二进制文件必须使用b
参数,否则会出现错误,而不会默默地提供错误的数据。文件名都使用unicode字符串传入和输出。
一些关于系统的API,如
os.environ
和sys.argv
,当系统允许bytes
并且不能正常转换为unicode的话,也会出现问题。所以,将系统的LANG
设置好是最好的做法。repr()
函数不再转义非ASCII字符。代码默认为UTF-8编码。
移除了
StringIO
和cStringIO
。加入了io
模块,并分别使用io.StringIO
和io.BytesIO
分别用于text和data。
语法改变
新增语法
函数变量和返回值annotations。
Keyword-only变量。
nonlocal
声明。使用nonlocal x
可以直接引用一个外部作用域的变量,但不是全局变量。扩展了迭代的解包。
(a, *rest, b) = range(5)
a # 0
rest # [1,2,3]
b # 4
- 字典推导。
{k: v for k, v in stuff }
。
t = ((1,1), (2,2))
d = {k: v for k, v in t}
d # {1: 1, 2: 2}
集合推导。
{x for x in stuff}
,与set(stuff)
效果一样,但是更加灵活。八进制字面量
0o720
。二进制字面量
0b1010
,相当于新的内置函数bin()
。字节字面量
b
或者B
,相当于新的内置函数bytes()
。
改变的语法
将
except exc, var
改为except exc as var
。新的元类语法。
# old
class C:
__metaclass__ = M
....
# new
class C(metaclass=M):
....
列表推导不再支持
[... for var in item1, item2, ...]
,必须写成[... for var in (item1, item2,...)]
。省略号
...
作为连续表达式可以用于任何地方,之前只能用于分片中。但是必须连续写,之前带空格的. . .
不再支持。
移除的语法
移除了元组的解包。不能再写
def foo(a, (b, c)): ....
,需要写成def foo(a, b_c):b, c = b_c
。移除
<>
,使用!=
代替。exec()
不能再作为关键词,只能作为一个函数。并且exec()
不再支持流变量,如exec(f)
需写成exec(f.read())
。整型不支持
l/L
后缀。字符串不支持
'u/U'
前缀。from module import *
只能用在模块级,在函数中不可使用。所有不以
.
开始的import语句均作为绝对路径的import对待。移除了经典类。