Foundations of Python Network Programming - 读书笔记系列(2) - Web Services

by CoderZh 2008年06月23日 1331 Words ~ 3min reading time | Improve on

Web Client Access

HTTP(Hypertext Transfer Prototol)协议是如今使用最广的协议之一。Python中通常使用urllib2模块来实现HTTP协议。

urllib和urllib2的区别？urllib2更据扩展性，同时和urllib一样具备了基本的功能。而urllib提供了较多的一些实用的功能。

1. Fetching Web Pages

urllib2.urlopen()返回的是一个File-like对象，因此可以调用read()方法，比如：

Authenticating

通常，某些网页需要HTTP安全性验证才能访问(SSL)，比如需要提供用户名和密码的信息。如果我们没有提供不要的信息去访问一个需要安全性验证的网页，将会返回一个HTTP401(Authorization Required)，urllib2模块能够处理这种情况，看下面的例子：

仔细分析一下上面的代码，第一步还是一样调用了Request()方法，第二步使用了urlib2.build_opener()方法创建一个opener，里面的参数是类似委托类型，当网页需要安全性验证时，HTTPBasicAuthHandler将会自动调用委托的方法TerminalPassword，而这个TerminalPassword是一个继承自urllib2.HTTPPasswordMgr的类，用于在需要用户名和密码时提供相应的信息。其实，在我们的第一个例子中（不需要安全性验证的例子），build_opener()在urlopen()的内部自动被调用了，传的参数为空，因为网页不需要安全性验证。

Submitting Form Data – Get

提交表单数据其实有很多种，本书提到了是两种：Get和Post，其实还有比如：Put方式（不知道Python里有没有提供）。先来看Get方式，Get方式是直接把要提交的数据放在URL里的，每个参数之间用&号隔开。看下面的代码：

Submitting From Data – Post

Post方式是把要提交的数据单独放在一个地方而不是简单的放在URL中，主要用于发送一些比较大的数据。使用起来其实也很简单，如下：

6. Cathing Data Errors

前面是捕捉了连接时的异常，同样，在读数据或写数据时，也会发生异常。有两种情况：一是当使用read()时，连接出现异常(communication error)，会抛出socket.error，这时我们捕获这个异常就可以了。二是读取的文件读到一半意外被中断，比如服务器的某个程序崩溃了，这时，连接会被正常的关闭，你接受不到任何异常的信息。这时，你就必须从header里找Content-Length，然后和自己接收的数据大小进行比较。（Content-Length在其他非HTTP协议中通常是没有的）

urllib2模块不仅仅支持HTTP协议，同样支持其他非HTTP协议，比如FTP。不同的是，比如FTP协议你不会在有header的信息，因此你当你调用info()函数时会出错的。不过通常情况下，使用urllib2来进行其他非HTTP协议也是非常方便的，基本上不需要再额外做什么，比如最前面第二个例子，我们讲传入的参数设置为FTP地址，同样使用。

[温馨提示]：该文章由原博客园导入而来，如排版效果不佳，请移步：http://www.cnblogs.com/coderzh/archive/2008/06/23/1228429.html

微信扫一扫交流

作者：CoderZh
微信关注：hacker-thinking （代码随想）
本文出处：https://blog.coderzh.com/2008/06/23/1228429/
文章版权归本人所有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接，否则保留追究法律责任的权利。

Foundations of Python Network Programming - 读书笔记系列(2) - Web Services

Web Client Access

1. Fetching Web Pages

6. Cathing Data Errors

Search

Categories