整理:Jims of 肥肥世家
Copyright © 2004,2005,2006 本文遵从GNU 的自由文档许可证(Free Document License)的条款,欢迎转 载、修改、散布。
发布时间:2004年7月10日
更新时间:2006年03月01日,增加cjkcodecs模块。
Abstract
Python为开发人员提供了丰富的模块,通过这些模块,我们就可快速开发出功能强大的程序。本笔记记录我所接触或学习过的Python模块,为想学习Python的朋友提供一个参考。
Table of Contents
- 1. Python Imaging Library(PIL)
- 2. Pmw(Python megawidgets)Python超级GUI组件集
- 3. PyXML
- 4. PyGame
- 5. PyOpenGL
- 6. NumPy和Numarray
- 7. MySQLdb
- 8. Tkinter模块
- 9. PyGTK
- 10. PyQt
- 11. PyMedia
- 12. Python-ldap
- 13. ftplib – FTP protocol client
- 14. Psyco
- 15. smtplib
- 16. XMPPPY
Chapter 1. Python Imaging Library(PIL)
PIL(Python图形库)为python提供强大的图形处理的能力,并提供广泛的图形文件格式支持,当前最新的版本是1.1.4。可到以下网址http://www.pythonware.com/products/pil/index.htm了解PIL的最新动态。该库能进行图形格式的转换、打印和显示。还能进行一些图形效果的处理,如图形的放大、缩小和旋转等。是Python用户进行图象处理的强有力工具。
1.1. 安装
1.1.1. 下载相关软件
到http://www.pythonware.com/products/pil/index.htm下载最新版的PIL安装程序。这里介绍的是在linux下的安装方法。windows平台的安装方法较简单,只要双击安装程序,就可一步步安装好了。
如果要PIL支持jpeg格式文件,还需安装jpeg库文件,可到http://www.ijg.org下载,现时最新的版本是jpegsrc.v6b.tar.gz。
如果要PIL支持压缩功能,还要下载Zlib库,可到http://www.gzip.org/zlib/下载zlib-1.1.4.tar.gz。
1.1.2. 开始安装
先安装jpeg库,输入以下命令进行安装:
1
2
3
4
5
6
7tar xfz jpegsrc.v6b.tar.gz
cd jpeg-6b
./configure
make
make test
make install
make install-lib接着安装Zlib库,输入以下命令进行安装:
1
2
3
4
5tar xfz zlib-1.1.4.tar.gz
cd zlib-1.1.4
./configure
make
make install最后安装PIL,输入以下命令进行安装:
1
2
3
4
5
6
7
8tar xfz Imaging-1.1.4.tar.gz
cd Imaging-1.1.4
cd libImaging
./configure
make
cd ..
python setup.py build
python setup.py install测试安装是否成功,可以在Python的命令行界面输入以下代码:
1
2
3>import Image
"test.jpg") >im = Image.open(
>im.show()如果成功打开test.jpg图片则安装成功。注意,在linux中,需要用xv程序来显示图片,所以如果没装xv,python会提示找不到xv。可到http://www.trilon.com/xv/downloads.html下载xv。
Chapter 2. Pmw(Python megawidgets)Python超级GUI组件集
Pmw是一个在python中利用Tkinter模块构建的高级GUI组件,每个Pmw都合并了一个或多个Tkinter组件,以实现更有用和更复杂的功能。如,Pmw中的一个ScrolledListBox(滚动列表框)实现了Tkinter的Scrollbar(滚动条)和ListBox(列表框)功能,使我们编程更方便。如果你在Python中开发GUI程序,Pmw是将是你的一个好帮手。
2.1. 安装
现在最新的Pmw是1.2版,Pmw的安装比较简单,只要到http://pmw.sourceforge.net/下载软件,然后用tar -zxvf命令解压文件,把解压出来的Pmw目录拷到python的模块目录下就可以了,如site-packages 目录。windows平台使用同一压缩包,安装方法也一样。安装完成后可登录进python的命令行界面运行“import Pmw”测试是否安装成功,如果没有出错信息,则安装成功,可以使用了。
2.2. 模块功能演示
2.2.1. ScrolledListBox(滚动列表框)
1 | #ScrolledListBox used to select image. |
2.2.2. ScrolledText(滚动文本框)
1 | #Copying selected text from one text area to another. |
Chapter 3. PyXML
PyXML是一套用Python解析和处理XML文档的工具包,包中的4DOM是完全相容于W3C DOM规范的。它包含以下内容:
xmlproc: 一个符合规范的XML解析器。
Expat: 一个快速的,非验证的XML解析器。
sgmlop: a C helper module that can speed-up xmllib.py and sgmllib.py by a factor of 5.
PySAX: SAX 1 and SAX2 libraries with drivers for most of the parsers.
4DOM: A fully compliant DOM Level 2 implementation
javadom: An adapter from Java DOM implementations to the standard Python DOM binding.
pulldom: a DOM implementation that supports lazy instantiation of nodes.
marshal: a module with several options for serializing Python objects to XML, including WDDX and XML-RPC.
3.1. 安装
到http://sourceforge.net/project/showfiles.php group_id=6473下载最新版的模块,现在是PyXML-0.8.3。安装PyXML需要有python2.0以上及以上的版本。下载完成后用tar解压缩生成PyXML-0.8.3目录,进入该目录并运行python setup.py build和python setup.py install完成安装。测试方法是进入命令行交互界面运行“import xml.dom.ext”命令,如果没提示模块出错则说明安装成功。PyXML提供windows平台的安装包,下载后双击运行就可以了。
3.2. 使用
由于该模块的内容较多,所以该模块的详细使用将我在“PyXML学习笔记”中单独讨论。
Chapter 4. PyGame
PyGame是一组用于多媒体开发和游戏软件开发的模块。
Chapter 5. PyOpenGL
PyOpenGL模块封装了“OpenGL应用程序编程接口”,通过该模块python程序员可在程序中集成2D和3D的图形。
Chapter 6. NumPy和Numarray
NumPy是Python的一个扩展库,主要用于处理任意维数的固定类型数组,它的低层代码使用C来编写,所以速度的优势很明显。Numarray是NumPy的一个改进版,用于取代NumPy。
Chapter 7. MySQLdb
MySQLdb模块用于连接MySQL数据库。源码位于http://sourceforge.net/projects/mysql-python,这里还有用于zope的ZMySQLDA模块,通过它就可在zope中连接mysql数据库。
7.1. 安装
安装的方法在解压目录的README文件中有详细说明。不难,这里就不详细讲了。要注意的一点是,如果你的mysql不是安装在默认的路径,而是安装在/usr/local/mysql这样的路径的话,libmysqlclient.so.12这个动态库python可能会找不到,造成import出错,解决方法是在/usr/lib下做一个符号连接,ln -s /usr/local/mysql/lib/mysql/libmysqlclient.so.12 libmysqlclient.so.12。最后在python中用import MySQLdb测试,如果没有出错信息就说明安装成功,可以连接mysql数据库了。
7.2. 模块功能
connect()方法用于连接数据库,返回一个数据库连接对象。如果要连接一个位于host.remote.com服务器上名为fourm的MySQL数据库,连接串可以这样写:
1
db = MySQLdb.connect(host="remote.com",user="user",passwd="xxx",db="fourm" )
connect()的参数列表如下:
host,连接的数据库服务器主机名,默认为本地主机(localhost)。
user,连接数据库的用户名,默认为当前用户。
passwd,连接密码,没有默认值。
db,连接的数据库名,没有默认值。
conv,将文字映射到Python类型的字典。默认为MySQLdb.converters.conversions
cursorclass,cursor()使用的种类,默认值为MySQLdb.cursors.Cursor。
compress,启用协议压缩功能。
named_pipe,在windows中,与一个命名管道相连接。
init_command,一旦连接建立,就为数据库服务器指定一条语句来运行。
read_default_file,使用指定的MySQL配置文件。
read_default_group,读取的默认组。
unix_socket,在unix中,连接使用的套接字,默认使用TCP。
port,指定数据库服务器的连接端口,默认是3306。
连接对象的db.close()方法可关闭数据库连接,并释放相关资源。
连接对象的db.cursor([cursorClass])方法返回一个指针对象,用于访问和操作数据库中的数据。
连接对象的db.begin()方法用于开始一个事务,如果数据库的AUTOCOMMIT已经开启就关闭它,直到事务调用commit()和rollback()结束。
连接对象的db.commit()和db.rollback()方法分别表示事务提交和回退。
指针对象的cursor.close()方法关闭指针并释放相关资源。
指针对象的cursor.execute(query[,parameters])方法执行数据库查询。
指针对象的cursor.fetchall()可取出指针结果集中的所有行,返回的结果集一个元组(tuples)。
指针对象的cursor.fetchmany([size=cursor.arraysize])从查询结果集中取出多行,我们可利用可选的参数指定取出的行数。
指针对象的cursor.fetchone()从查询结果集中返回下一行。
指针对象的cursor.arraysize属性指定由cursor.fetchmany()方法返回行的数目,影响fetchall()的性能,默认值为1。
指针对象的cursor.rowcount属性指出上次查询或更新所发生行数。-1表示还没开始查询或没有查询到数据。
7.3. 模块功能演示
1 | #!/usr/bin/python |
Chapter 8. Tkinter模块
8.1. Tkinter简介
Tkinter是Python默认的图形界面接口,Tkinter是一个和Tk接口的Python模块,Tkinter库提供了对Tk API的接口,它属于Tcl/Tk的GUI工具组。Tcl/Tk是由John Ousterhout发展的书写和图形设备。Tcl(工具命令语言)是个宏语言,用于简化shell下复杂程序的开发,Tk工具包是和Tcl一起开发的,目的是为了简化用户接口的设计过程。Tk工具包由许多不同的小部件,如一个按钮、一个滚动条等。通过Tk提供的这些小部件,我们就可快速地进行GUI开发。Perl、Scheme等语言也利用Tk库进行GUI开发。Tkinter是跨平台,在各种平台下都能使用。
Chapter 9. PyGTK
PyGTK是一个用于python GUI程序开发的GTK+库,当前版本的PyGTK需要GTK+ 2.0以上版本支持和Python 2.2以上版本支持才能运行。
9.1. 安装
如果是在Debian系统中,则安装python2.3-gtk2软件包即可。如果要从源码安装,可到http://www.pygtk.org下载最新的软件包。安装方法也很简单,和其它开源软件差不多,通过configure、make和make install三步操作就可完成。具体操作你可参考源码目录下的README和INSTALL文档,里面有详细的安装说明。注意,要成功安装PyGTK,要有相应版本的GTK+和Python支持。在源码目录下有一个examples目录,这是一个宝贵的资源,里面有很多有用的PyGTK示例代码,对我们学习PyGTK很有帮助。
9.2. 示例
下面是一个PyGTK的示例,演示了PyGTK的基本概念。
1 | #!/usr/bin/env python |
有关PyGTK的详细介绍请参考我整理的“PyGTK学习笔记”。
Chapter 10. PyQt
PyQt是一套用于python的Qt开发库,由一系列的模块组成,有qt, qtcanvas, qtgl, qtnetwork, qtsql, qttable, qtui and qtxml,包含有300个类和超过5750个的函数和方法。
PyQt还支持一个叫qtext的模块,它包含一个QScintilla库。该库是Scintillar编辑器类的Qt接口。
10.1. 安装
到http://www.riverbankcomputing.co.uk/pyqt/download.php下载最新的版本。安装PyQt需要先安装SIP,到以这里下载。SIP是一个把C\C++库转换成Python模块的工具。
安装SIP
1
2
3
4
5tar -zxvf sip-4.1.1.tar.gz
cd sip-4.1.1
python configure.py -l qt # -l qt 选项指定qt版本
make
make install安装PyQt
1
2
3
4
5tar -zxvf PyQt-x11-gpl-3.13.tar.gz
cd PyQt-x11-gpl-3.13
python configure.py
make
make install
Chapter 11. PyMedia
PyMedia模块是一个用于多媒体操作的python模块。它提供了丰富而简单的接口用于多媒体处理(wav, mp3, ogg, avi, divx, dvd, cdda etc)。可在Windows和Linux平台下使用。
Chapter 12. Python-ldap
Python-ldap模块提供一组面向对象的API,可方便地在python中访问ldap目录服务,它基于OpenLDAP2.x。
12.1. 示例
以下示例在python-ldap网站上有列出,这里作一下简要说明:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37#!/usr/bin/python
#-*- coding:utf-8 -*- #设置源码文件编码为utf-8
import ldap
try:
conn = ldap.open("server_name") #server_name为ldap服务器名
conn.protocol_version = ldap.VERSION3 #设置ldap协议版本
username = "cn=admin,dc=company,dc=com" #用户名
password = "123" #访问密码
conn.simple_bind(username,password) #连接
except ldap.LDAPError, e: #捕获出错信息
print e
baseDN = "dc=employees,dc=company,dc=com" #设置目录的搜索路径起点
searchScope = ldap.SCOPE_SUBTREE #设置可搜索子路径
retrieveAttributes = None #None表示搜索所有属性,['cn']表示只搜索cn属性
searchFilter = "cn=test" #设置过滤属性,这里只显示cn=test的信息
try:
ldap_result_id = conn.search(baseDN,searchScope,searchFilter,retrieveAttributes)
#调用search方法返回结果id
result_set = []
while 1:
result_type, result_data = conn.result(ldap_result_id, 0) #通过结果id返回信息
if result_data == []:
break
else:
if result_type == ldap.RES_SEARCH_ENTRY:
result_set.append(result_data)
print result_set[0][0][1]['o'][0] #result_set是一个复合列表,需通过索引返回组织单元(o)信息
except ldap.LDAPError, e:
print e这里采用的是非同步方式,同步方式的连接和搜索命令后有“_s”后缀,如search_s。非同步方式需通过一个结果id来访问目录服务信息。
下面是一个修改目录信息的示例:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19#!/usr/bin/python
# -*- coding:utf-8 -*-
import ldap
try:
conn = ldap.open("server_name")
conn.protocol_version = ldap.VERSION3
username = "cn=admin,dc=company,dc=com"
password = "123"
conn.simple_bind_s(username,password)
except ldap.LDAPError, e:
print e
try:
dn = "cn=test,dc=employees,dc=company,dc=com"
conn.modify_s(dn,[(ldap.MOD_ADD,'mail','[email protected]')]) #增加一个mail属性
except ldap.LDAPError, e:
print eldap.MOD_ADD表示增加属性,ldap.MOD_DELETE表示删除属性,ldap.MOD_REPLACE表示修改属性。
下面是一个增加目录项的示例:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29#!/usr/bin/python
# -*- coding:utf-8 -*-
import ldap,ldap.modlist #ldap.modlist是ldap的子模块,用于格式化目录服务的数据项
try:
conn = ldap.open("server_name")
conn.protocol_version = ldap.VERSION3
username = "cn=admin,dc=company,dc=com"
password = "123"
conn.simple_bind_s(username,password)
except ldap.LDAPError, e:
print e
try:
dn = "cn=test,dc=card,dc=company,dc=com"
modlist = ldap.modlist.addModlist({ #格式化目录项,除对象类型要求必填项外,
'cn': ['test'], #其它项可自由增减
'objectClass': ['top', 'person', 'organizationalPerson', 'inetOrgPerson'],
'o': ['\xe5\xb9\xbf\xe5\xb7\x9e'], #这些为utf-8编码的中文
'street': ['\xe5\xb9\xbf\xe5\xb7\x9e'],
'sn': ['tester'],
'mail': ['[email protected]', '[email protected]'],
'homePhone': ['xxxxxxxx'], 'uid': ['test'] })
# print modlist #显示格式化数据项,格式化后是一个元组列表
conn.add_s(dn,modlist) #调用add_s方法添加目录项
except ldap.LDAPError, e:
print e其实我们也可按格式化后元组列表的形式把目录项直接写到add_s()里,省却转换的步骤。
下面是一个删除目录项的示例:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20#!/usr/bin/python
# -*- coding:utf-8 -*-
import ldap
try:
conn = ldap.open("server_name")
conn.protocol_version = ldap.VERSION3
username = "cn=admin,dc=company,dc=com"
password = "123"
conn.simple_bind_s(username,password)
except ldap.LDAPError, e:
print e
try:
dn = "cn=sale,dc=company,dc=com"
conn.delete_s(dn)
except ldap.LDAPError, e:
print e
Chapter 13. ftplib – FTP protocol client
ftplib模块定义了FTP类和一些方法,用以进行客户端的ftp编程。我们可用python编写一个自已的ftp客户端程序,用于下载文件或镜像站点。如果想了解ftp协议的详细内容,请参考RFC959。
13.1. 示例
该模块是python的通用模块,所以默认应该已安装。ftplib模块使用很简单,暂时只有一个FTP类和十几个函数。下面用一个交互方式演示一下ftplib的主要功能。
1 | >>> from ftplib import FTP |
下面一个下载文件的示例
1 | #!/usr/bin/env python |
下面一个上传文件的示例,要成功运行该脚本,需在ftp服务器上有上传文件的权限。
1 | #!/usr/bin/env python |
是不是很简单,其它功能可查询python的官方网站,网址是http://docs.python.org/lib/module-ftplib.html。
Chapter 14. Psyco
Psyco是一个Python代码加速度器,可使Python代码的执行速度提高到与编译语言一样的水平。
14.1. 安装
安装Psyco很简单,它有两种安装方式,一种是源码方式,一种是二进制码方式:
如果用源码方式安装,你需在源码的目录中调用python setup.py install命令编译生成psyco子目录,再把该子目录整个拷贝到python的site-packages目录下。
如果用二进制码方式安装,按这个网址列表中的python与psyco版本对应表下载合适的二进制文件,解压后会生成一个psyco-1.x的目录,把该目录下的psyco目录整个拷贝到python的site-packages目录下即可。
Chapter 15. smtplib
15.1. 示例
smtplib模块以发送电子邮件。下面是一个示例,可发送附件。
1 | #!/usr/bin/python |
Chapter 16. XMPPPY
Jabber服务器采用开发的XMPP协议,Google Talk也是采用XMPP协议的IM系统 。在Python中有一个xmpppy模块支持该协议。也就是说,我们可以通过该模块与Jabber服务器通信,是不是很Cool。
16.1. 示例
下面是一个简单的示例,可使大家对该模块有一个大概的了解。
1 | 导入xmpppy模块 |
16.2. cjkcodecs
在python2.4版以前,python不能处理cjk(中国,日本和韩国)的编码,所以就有了cjkcodecs模块。安装该模块后Python就能处理cjk字符了。下载网址:http://cjkpython.i18n.org/。