H.P 琥珀
Free Software, Python, Linux etc.
校内爬虫 0点1 - [python]
canri62 发表于 2008-12-15 18:06:48需要两个第三方模块: BeautifulSoup.py ClientForm.py ( http://wwwsearch.sourceforge.net/ ) 在文件setting里 填上自己的用户名和密码,直接运行就可以了。 SECURITY NOTE!!! 用户名和密码是以明文形式保存的,所以...(有某种程度上的危险?) Features: * Automatically travelling around ...
python实现一个简单的web browser - [python]
canri62 发表于 2008-12-09 23:19:20超级简单的browser,能干什么呢?能获取HTML,有cookie的处理,还能处理纯HTML的forms。用到ClientForm.py参考了:http://wwwsearch.sourceforge.net/ (在这里学了很多,主要是关于python的web client-side programming)以及Python Module References
Python语言: 临时自用代码@代码发芽网 from url...
BeautifulSoup解析实例,获取校内个人页面的好友列表 - [python]
canri62 发表于 2008-12-09 22:56:43需求是这样的:
* 获取某位用户页面右侧好友的信息( ID 和 名字)
假设已经抓取到该页面的HTML
>>> print doc
# part of the strings
<div class="box-body">
&nb...
urllib2的urlopen - [python]
canri62 发表于 2008-12-05 23:15:30今天被一个小问题困住了:
urllib2的response object是一个类似于file object的东西,当调用read()一次读出后就不应再读了,否则读到的将是个空白文件。
在一段代码中,定义了一个类,其中一个方法用来读取指定URL的html源文件,并且打印。另一个方法用来作为ClientForm里ParseResponse()的参数。
class Browser:
...
...
urllib2初尝 - [python]
canri62 发表于 2008-12-05 01:35:15快速一瞥:
import urllib2
response = urllib2.urlopen("http://www.example.com")
print response.read()
我想让脚本登录网站,要有cookie的支持:
import urllib2
import cookielib
cj = cookielib.CookieJar()
o...
校内好友漫游 - [python]
canri62 发表于 2008-10-25 19:39:35校内网的个人主页右下侧有一栏“我的好友“,它显示页面主人部分好友名单,点击其中一个人的名字,可以进入到他(她)的个人主页。写一python脚本:
1。选取一个好友,进入其主页。
2。重复步骤一(条件是不得选取重复的人)
如此,程序将在人际网中开始漫游....
共1页 1
博客大巴 提供程序服务器托管支持,GimpStyle theme design by Horacio Bella
版权声明:本站文章使用《署名 3.0 Unported》授权,转载时请注意标明文章原始出处和作者信息及本声明。