农村哥们 发表于 2013-2-7 03:48:38

抓取谷歌网页问题

当使用
URL url = new URL("http://www.google.cn/search?hl=zh-CN&newwindow=1&q=北京&start=0&sa=N");
url.openStream() 时候发现报403访问拒绝错误,是由于谷歌对java 程序进行限制,缺少Agent。

解决办法:
URL url = new URL("http://www.google.cn/search?hl=zh-CN&newwindow=1&q=北京&start=0&sa=N");
URLConnection con = url.openConnection();
con.setRequestProperty("User-Agent","Mozilla/4.0 (compatible; MSIE 5.0; Windows XP; DigExt)");
InputStream in = con.getInputStream();
页: [1]
查看完整版本: 抓取谷歌网页问题