Guido(Python之父,仁慈的獨裁者)在設計 Python3 的過程中,受一篇文章 「Python warts」 的影響,決定不向後兼容,否則無法修復大多數缺陷。—-摘錄自《流暢的Python》
你可能沒聽說過學 Java 糾結是學 JDK6 還是 JDK7,也沒聽說學 PHP 糾結是學 PHP5 還是 PHP7,但在 Python 社區,有這麼個怪現象:「學 Python 到底是學 2 還是學 3?」,就像月經一樣每隔斷時間就出現在你面前,也成了很多初學者的選擇困惑,問題的「始作俑者」當然是 Python 它爹,大家眾說紛紜,有說 Python2 是主流,大公司都在用,你應該學 2 。也有說 Python3 才是未來主流,大多數第三方框架已基本支持 Python3。
個人看法是 Python2 還會存在很長一段時間(只要那些用 Python2 的公司還沒倒閉,就一直會存在),你去找工作很有可能就需要用到 2,而 Python3 也是你必須要掌握的,因為越來越多項目會優先選擇 3 ,本質上,它倆是同一門語言,僅僅只是極少部分(1%?並沒有嚴格統計)不兼容的地方,所以就沒所謂學誰好,學了一個,另一個花很少時間就能掌握。
今天就給大家介紹 Python2 和 Python3 的一些主要分別。
程序調試時用得最多的語句可能就是 print
,在 Python2 中,print 是一條語句,而在 Python3 中是作為函數存在的。有人可能就有疑問了,我在 Python2 中明明也看到當函數使用:
# py2
print("hello") # 等價 print ("hello")
#py3print("hello")
然而,你看到的只是表象,上面兩個表達式有什麼分別?從輸出結果來看是一樣的,但實質上,前者是把 ("hello")
當作一個整體,而後者 print()
是個函數,接收字符串作為參數。
# py2
>>> print("hello", "world")
('hello', 'world')
# py3
>>> print("hello", "world")hello world
這個例子就更明顯了,在 py2 中,print語句後面接的是一個元組對象,而在 py3 中,print 函數可以接收多個位置參數。如果希望在 py2 中 把 print 當函數使用,那麼可以導入 future 模塊 中的 print_function
# py2
>>> print("hello", "world")
('hello', 'world')
>>>
>>> from __future__ import print_function
>>> print("hello", "world")hello world
編碼
Python2 的默認編碼是 asscii,這也是導致 Python2 中經常遇到編碼問題的原因之一,至於是為什麼會使用 asscii 作為默認編碼,原因在於 Python 2 出來的時候還沒出現 Unicode。Python 3 默認採用了 UTF-8 作為默認編碼,因此你不再需要在文件頂部寫 # coding=utf-8
了。
# py2
>>> sys.getdefaultencoding()
'ascii'
# py3
>>> sys.getdefaultencoding()'utf-8'
網上不少文章說通過修改默認編碼格式來解決 Python2 的編碼問題,其實這是個大坑,不要這麼幹。
字符串
字符串是最大的變化之一,這個變化使得編碼問題降到了最低可能。在 Python2 中,字符串有兩個類型,一個是 unicode,一個是 str,前者表示文本字符串,後者表示字節序列,不過兩者並沒有明顯的界限,開發者也感覺很混亂,不明白編碼錯誤的原因,不過在 Python3 中兩者做了嚴格區分,分別用 str 表示字符串,byte 表示字節序列,任何需要寫入文本或者網絡傳輸的數據都只接收字節序列,這就從源頭上阻止了編碼錯誤的問題。
True和False
True 和 False 在 Python2 中是兩個全局變量(名字),在數值上分別對應 1 和 0,既然是變量,那麼他們就可以指向其它對象,例如:
# py2
>>> True = False
>>> True
False
>>> True is False
True
>>> False = "x"
>>> False
'x'
>>> if False:
... print("?")
...?
顯然,上面的代碼違背了 Python 的設計哲學 Explicit is better than implicit.。而 Python3 修正了這個缺陷,True 和 False 變為兩個關鍵字,永遠指向兩個固定的對象,不允許再被重新賦值。
# py3
>>> True = 1
File "<stdin>", line 1SyntaxError: can't assign to keyword
疊代器
在 Python2 中很多返回列表對象的內置函數和方法在 Python 3 都改成了返回類似於疊代器的對象,因為疊代器的惰性加載特性使得操作大數據更有效率。Python2 中的 range 和 xrange 函數合併成了 range,如果同時兼容2和3,可以這樣:
try:
range = xrange
except:pass
另外,字典對象的 dict.keys()、dict.values() 方法都不再返回列表,而是以一個類似疊代器的 「view」 對象返回。高階函數 map、filter、zip 返回的也都不是列表對象了。有,py2的疊代器必須實現 next
方法,而 py3 改成了 __next__
nolocal
我們都知道在 py2 中可以在函數裡面可以用關鍵字 global
聲明某個變量為全局變量,但是在嵌套函數中,想要給一個變量聲明為非局部變量是沒法實現的,py3 新增了關鍵字 nolcoal
,使得非局部變量成為可能。
def func():
可以對比上面兩段代碼的輸出結果
def func():
其實很多內建模塊也做了大量調整,Python3 中的模塊組織更加清晰,類更加先進,引入了異步IO,這次先寫這麼多,下次再繼續。