校内爬虫 0点1 - [python]

 需要两个第三方模块: BeautifulSoup.py ClientForm.py ( http://wwwsearch.sourceforge.net/ ) 在文件setting里 填上自己的用户名和密码,直接运行就可以了。 SECURITY NOTE!!! 用户名和密码是以明文形式保存的,所以...(有某种程度上的危险?) Features: * Automatically travelling around ...

python实现一个简单的web browser - [python]

 超级简单的browser,能干什么呢?能获取HTML,有cookie的处理,还能处理纯HTML的forms。用到ClientForm.py参考了:http://wwwsearch.sourceforge.net/ (在这里学了很多,主要是关于python的web client-side programming)以及Python Module References

 Python语言: 临时自用代码@代码发芽网 from url...

BeautifulSoup解析实例,获取校内个人页面的好友列表 - [python]

需求是这样的:

* 获取某位用户页面右侧好友的信息( ID 和 名字)

假设已经抓取到该页面的HTML  

>>> print doc

# part of the strings

        <div class="box-body">
 &nb...

urllib2的urlopen - [python]

今天被一个小问题困住了:
urllib2的response object是一个类似于file object的东西,当调用read()一次读出后就不应再读了,否则读到的将是个空白文件。
在一段代码中,定义了一个类,其中一个方法用来读取指定URL的html源文件,并且打印。另一个方法用来作为ClientForm里ParseResponse()的参数。

class Browser:
    ...
 ...

urllib2初尝 - [python]

快速一瞥:

import urllib2
response = urllib2.urlopen("http://www.example.com")
print response.read()

我想让脚本登录网站,要有cookie的支持:

import urllib2
import cookielib
cj = cookielib.CookieJar()
o...

校内好友漫游 - [python]

校内网的个人主页右下侧有一栏“我的好友“,它显示页面主人部分好友名单,点击其中一个人的名字,可以进入到他(她)的个人主页。写一python脚本:

1。选取一个好友,进入其主页。

2。重复步骤一(条件是不得选取重复的人)

如此,程序将在人际网中开始漫游....

 

博客大巴 提供程序服务器托管支持,GimpStyle theme design by Horacio Bella
版权声明:本站文章使用《署名 3.0 Unported》授权,转载时请注意标明文章原始出处和作者信息及本声明