Python 2 和 Python 3 主要区别有哪些(一)
作者:刘志军,6年+Python使用经验, 高级开发工程师,目前在互联网医疗行业从事Web系统构架工作
个人公众号:Python之禅(微信ID:vttalk)
Guido(Python之父,仁慈的独裁者)在设计 Python3 的过程中,受一篇文章 “Python warts” 的影响,决定不向后兼容,否则无法修复大多数缺陷。—-摘录自《流畅的Python》
http://web.archive.org/web/20031002184114/www.amk.ca/python/writing/warts.html
你可能没听说过学 Java 纠结是学 JDK6 还是 JDK7,也没听说学 PHP 纠结是学 PHP5 还是 PHP7,但在 Python 社区,有这么个怪现象:“学 Python 到底是学 2 还是学 3?”,就像月经一样每隔断时间就出现在你面前,也成了很多初学者的选择困惑,问题的“始作俑者”当然是 Python 它爹,大家众说纷纭,有说 Python2 是主流,大公司都在用,你应该学 2 。也有说 Python3 才是未来主流,大多数第三方框架已基本支持 Python3。
个人看法是 Python2 还会存在很长一段时间(只要那些用 Python2 的公司还没倒闭,就一直会存在),你去找工作很有可能就需要用到 2,而 Python3 也是你必须要掌握的,因为越来越多项目会优先选择 3 ,本质上,它俩是同一门语言,仅仅只是极少部分(1%?并没有严格统计)不兼容的地方,所以就没所谓学谁好,学了一个,另一个花很少时间就能掌握。
今天就给大家介绍 Python2 和 Python3 的一些主要区别。
程序调试时用得最多的语句可能就是 print
,在 Python2 中,print 是一条语句,而在 Python3 中是作为函数存在的。有人可能就有疑问了,我在 Python2 中明明也看到当函数使用:
# py2
print("hello") # 等价 print ("hello")
#py3
print("hello")
然而,你看到的只是表象,上面两个表达式有什么区别?从输出结果来看是一样的,但实质上,前者是把 ("hello")
当作一个整体,而后者 print()
是个函数,接收字符串作为参数。
# py2
>>> print("hello", "world")
('hello', 'world')
# py3
>>> print("hello", "world")
hello world
这个例子就更明显了,在 py2 中,print语句后面接的是一个元组对象,而在 py3 中,print 函数可以接收多个位置参数。如果希望在 py2 中 把 print 当函数使用,那么可以导入 future 模块 中的 print_function
# py2
>>> print("hello", "world")
('hello', 'world')
>>>
>>> from __future__ import print_function
>>> print("hello", "world")
hello world
编码
Python2 的默认编码是 asscii,这也是导致 Python2 中经常遇到编码问题的原因之一,至于是为什么会使用 asscii 作为默认编码,原因在于 Python 2 出来的时候还没出现 Unicode。Python 3 默认采用了 UTF-8 作为默认编码,因此你不再需要在文件顶部写 # coding=utf-8
了。
# py2
>>> sys.getdefaultencoding()
'ascii'
# py3
>>> sys.getdefaultencoding()
'utf-8'
网上不少文章说通过修改默认编码格式来解决 Python2 的编码问题,其实这是个大坑,不要这么干。
字符串
字符串是最大的变化之一,这个变化使得编码问题降到了最低可能。在 Python2 中,字符串有两个类型,一个是 unicode,一个是 str,前者表示文本字符串,后者表示字节序列,不过两者并没有明显的界限,开发者也感觉很混乱,不明白编码错误的原因,不过在 Python3 中两者做了严格区分,分别用 str 表示字符串,byte 表示字节序列,任何需要写入文本或者网络传输的数据都只接收字节序列,这就从源头上阻止了编码错误的问题。
True和False
True 和 False 在 Python2 中是两个全局变量(名字),在数值上分别对应 1 和 0,既然是变量,那么他们就可以指向其它对象,例如:
# py2
>>> True = False
>>> True
False
>>> True is False
True
>>> False = "x"
>>> False
'x'
>>> if False:
... print("?")
...
?
显然,上面的代码违背了 Python 的设计哲学 Explicit is better than implicit.。而 Python3 修正了这个缺陷,True 和 False 变为两个关键字,永远指向两个固定的对象,不允许再被重新赋值。
# py3
>>> True = 1
File "<stdin>", line 1
SyntaxError: can't assign to keyword
迭代器
在 Python2 中很多返回列表对象的内置函数和方法在 Python 3 都改成了返回类似于迭代器的对象,因为迭代器的惰性加载特性使得操作大数据更有效率。Python2 中的 range 和 xrange 函数合并成了 range,如果同时兼容2和3,可以这样:
try:
range = xrange
except:
pass
另外,字典对象的 dict.keys()、dict.values() 方法都不再返回列表,而是以一个类似迭代器的 “view” 对象返回。高阶函数 map、filter、zip 返回的也都不是列表对象了。有,py2的迭代器必须实现 next
方法,而 py3 改成了 __next__
nolocal
我们都知道在 py2 中可以在函数里面可以用关键字 global
声明某个变量为全局变量,但是在嵌套函数中,想要给一个变量声明为非局部变量是没法实现的,py3 新增了关键字 nolcoal
,使得非局部变量成为可能。
def func(): c = 1 def foo(): c = 12 foo() print(c) func() #1
可以对比上面两段代码的输出结果
def func(): c = 1 def foo(): nonlocal c c = 12 foo() print(count) func() # 12
其实很多内建模块也做了大量调整,Python3 中的模块组织更加清晰,类更加先进,引入了异步IO,这次先写这么多,下次再继续。
Python爱好者社区历史文章列表(每周append更新一次)
关注后在公众号内回复“课程”即可获取:
小编的Python入门视频课程!!!
崔老师爬虫实战案例免费学习视频。
丘老师数据科学入门指导免费学习视频。
陈老师数据分析报告制作免费学习视频。
玩转大数据分析!Spark2.X+Python 精华实战课程免费学习视频。
丘老师Python网络爬虫实战免费学习视频。