六狼论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博账号登陆

只需一步,快速开始

搜索
查看: 31|回复: 0

用python搜google

[复制链接]

升级  96%

54

主题

54

主题

54

主题

秀才

Rank: 2

积分
194
 楼主| 发表于 2013-2-7 03:39:50 | 显示全部楼层 |阅读模式
昨天上网查了一下资料,终于可以用python下载google的搜索页了。
如果直接用urllib.urlopen(url)会返回一个forbidden的,其实加一个add_header就可以了.
给出一个关键字
word 就会返回搜索结果了。
import urllibimport urllib2def search(word): url=r'http://www.google.cn/search?hl=zh-CN&newwindow=1&q='+word+"&start=10&sa=N" req=urllib2.Request(url) req.add_header("User-Agent",'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.2; .NET CLR 1.1.4322)') opener=urllib2.build_opener() text=opener.open(req).read() return text
您需要登录后才可以回帖 登录 | 立即注册 新浪微博账号登陆

本版积分规则

快速回复 返回顶部 返回列表