在Python中,一個.py文件就稱之爲一個模塊(Module)
每一個包目錄下面都會有一個__init__.py
的文件,這個文件是必須存在的,否則,Python就把這個目錄當成普通目錄,而不是一個包。__init__.py
可以是空文件,也可以有Python代碼,因爲__init__.py
本身就是一個模塊,而它的模塊名就是mycompany
一、使用模塊
Python本身就內置了很多非常有用的模塊,只要安裝完畢,這些模塊就可以立刻使用。
我們以內建的sys
模塊爲例,編寫一個hello
的模塊:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
' a test module '
__author__ = 'Michael Liao'
import sys
def test():
args = sys.argv
if len(args)==1:
print 'Hello, world!'
elif len(args)==2:
print 'Hello, %s!' % args[1]
else:
print 'Too many arguments!'
if __name__=='__main__':
test()
第1行和第2行是標準註釋,第1行註釋可以讓這個hello.py
文件直接在Unix/Linux/Mac上運行,第2行註釋表示.py文件本身使用標準UTF-8編碼;
第4行是一個字符串,表示模塊的文檔註釋,任何模塊代碼的第一個字符串都被視爲模塊的文檔註釋;
第6行使用__author__
變量把作者寫進去,這樣當你公開源代碼後別人就可以瞻仰你的大名;
以上就是Python模塊的標準文件模板,當然也可以全部刪掉不寫,但是,按標準辦事肯定沒錯。
後面開始就是真正的代碼部分。
你可能注意到了,使用sys
模塊的第一步,就是導入該模塊:
import sys
導入sys
模塊後,我們就有了變量sys
指向該模塊,利用sys
這個變量,就可以訪問sys
模塊的所有功能。
sys
模塊有一個argv
變量,用list存儲了命令行的所有參數。argv
至少有一個元素,因爲第一個參數永遠是該.py文件的名稱,例如:
運行python hello.py
獲得的sys.argv
就是['hello.py']
;
運行python hello.py Michael
獲得的sys.argv
就是['hello.py',
'Michael]
。
最後,注意到這兩行代碼:
if __name__=='__main__':
test()
當我們在命令行運行hello
模塊文件時,Python解釋器把一個特殊變量__name__
置爲__main__
,而如果在其他地方導入該hello
模塊時,if
判斷將失敗,因此,這種if
測試可以讓一個模塊通過命令行運行時執行一些額外的代碼,最常見的就是運行測試。
我們可以用命令行運行hello.py
看看效果:
$ python hello.py
Hello, world!
$ python hello.py Michael
Hello, Michael!
如果啓動Python交互環境,再導入hello
模塊:
$ python
Python 2.7.5 (default, Aug 25 2013, 00:04:04)
[GCC 4.2.1 Compatible Apple LLVM 5.0 (clang-500.0.68)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import hello
>>>
導入時,沒有打印Hello, word!
,因爲沒有執行test()
函數。
調用hello.test()
時,才能打印出Hello,
word!
:
>>> hello.test()
Hello, world!
1、別名
導入模塊時,還可以使用別名,這樣,可以在運行時根據當前環境選擇最合適的模塊。比如Python標準庫一般會提供StringIO
和cStringIO
兩個庫,這兩個庫的接口和功能是一樣的,但是cStringIO
是C寫的,速度更快,所以,你會經常看到這樣的寫法:
try:
import cStringIO as StringIO
except ImportError: # 導入失敗會捕獲到ImportError
import StringIO
這樣就可以優先導入cStringIO
。如果有些平臺不提供cStringIO
,還可以降級使用StringIO
。導入cStringIO
時,用import
... as ...
指定了別名StringIO
,因此,後續代碼引用StringIO
即可正常工作。
還有類似simplejson
這樣的庫,在Python 2.6之前是獨立的第三方庫,從2.6開始內置,所以,會有這樣的寫法:
try:
import json # python >= 2.6
except ImportError:
import simplejson as json # python <= 2.5
由於Python是動態語言,函數簽名一致接口就一樣,因此,無論導入哪個模塊後續代碼都能正常工作。
2、作用域
在一個模塊中,我們可能會定義很多函數和變量,但有的函數和變量我們希望給別人使用,有的函數和變量我們希望僅僅在模塊內部使用。在Python中,是通過_
前綴來實現的。
正常的函數和變量名是公開的(public),可以被直接引用,比如:abc
,x123
,PI
等;
類似__xxx__
這樣的變量是特殊變量,可以被直接引用,但是有特殊用途,比如上面的__author__
,__name__
就是特殊變量,hello
模塊定義的文檔註釋也可以用特殊變量__doc__
訪問,我們自己的變量一般不要用這種變量名;
類似_xxx
和__xxx
這樣的函數或變量就是非公開的(private),不應該被直接引用,比如_abc
,__abc
等;
之所以我們說,private函數和變量“不應該”被直接引用,而不是“不能”被直接引用,是因爲Python並沒有一種方法可以完全限制訪問private函數或變量,但是,從編程習慣上不應該引用private函數或變量。
private函數或變量不應該被別人引用,那它們有什麼用呢?請看例子:
def _private_1(name):
return 'Hello, %s' % name
def _private_2(name):
return 'Hi, %s' % name
def greeting(name):
if len(name) > 3:
return _private_1(name)
else:
return _private_2(name)
我們在模塊裏公開greeting()
函數,而把內部邏輯用private函數隱藏起來了,這樣,調用greeting()
函數不用關心內部的private函數細節,這也是一種非常有用的代碼封裝和抽象的方法,即:
外部不需要引用的函數全部定義成private,只有外部需要引用的函數才定義爲public。
二、安裝第三方模塊
在Python中,安裝第三方模塊,是通過setuptools這個工具完成的。Python有兩個封裝了setuptools的包管理工具:easy_install
和pip
。目前官方推薦使用pip
。
現在,讓我們來安裝一個第三方庫——Python Imaging Library,這是Python下非常強大的處理圖像的工具庫。一般來說,第三方庫都會在Python官方的pypi.python.org網站註冊,要安裝一個第三方庫,必須先知道該庫的名稱,可以在官網或者pypi上搜索,比如Python Imaging Library的名稱叫PIL,因此,安裝Python Imaging Library的命令就是:
pip install PIL
耐心等待下載並安裝後,就可以使用PIL了。
有了PIL,處理圖片易如反掌。隨便找個圖片生成縮略圖:
>>> import Image
>>> im = Image.open('test.png')
>>> print im.format, im.size, im.mode
PNG (400, 300) RGB
>>> im.thumbnail((200, 100))
>>> im.save('thumb.jpg', 'JPEG')
其他常用的第三方庫還有MySQL的驅動:MySQL-python
,用於科學計算的NumPy庫:numpy
,用於生成文本的模板工具Jinja2
,等等。
模塊搜索路徑
當我們試圖加載一個模塊時,Python會在指定的路徑下搜索對應的.py文件,如果找不到,就會報錯:
>>> import mymodule
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ImportError: No module named mymodule
默認情況下,Python解釋器會搜索當前目錄、所有已安裝的內置模塊和第三方模塊,搜索路徑存放在sys
模塊的path
變量中:
>>> import sys
>>> sys.path
['', '/Library/Python/2.7/site-packages/pycrypto-2.6.1-py2.7-macosx-10.9-intel.egg', '/Library/Python/2.7/site-packages/PIL-1.1.7-py2.7-macosx-10.9-intel.egg', ...]
如果我們要添加自己的搜索目錄,有兩種方法:
一是直接修改sys.path
,添加要搜索的目錄:
>>> import sys
>>> sys.path.append('/Users/michael/my_py_scripts')
這種方法是在運行時修改,運行結束後失效。
第二種方法是設置環境變量PYTHONPATH
,該環境變量的內容會被自動添加到模塊搜索路徑中。設置方式與設置Path環境變量類似。注意只需要添加你自己的搜索路徑,Python自己本身的搜索路徑不受影響。
三、使用__future__
Python提供了__future__
模塊,把下一個新版本的特性導入到當前版本,於是我們就可以在當前版本中測試一些新版本的特性。