六狼论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博账号登陆

只需一步,快速开始

搜索
查看: 1562|回复: 0

Python抓取网站图片

[复制链接]
 楼主| 发表于 2014-11-21 12:10:18 | 显示全部楼层 |阅读模式
使用Python抓取网站图片
#!/usr/bin/env python#coding:utf8import re,urlliburl='http://blog.linuxeye.com/'def getHtml():    page = urllib.urlopen(url)    html = page.read()    return htmldef getImg(html):    reg = r'<img src="(.*?\.\w{3,4})"'    imgre = re.compile(reg)    imglist = re.findall(imgre,html)    n = 0    print imglist    for imgurl in imglist:        n=n+1        pic_suffix = imgurl.split('.')[-1]        if imgurl[0:4] == 'http':            print imgurl            urllib.urlretrieve(imgurl,'%d.%s' % (n,pic_suffix))        else:            print url + imgurl            urllib.urlretrieve(url + imgurl,'%d.%s' % (n,pic_suffix))U=getHtml()getImg(U)
        Wed Jun 26 18:12:02 CST 2013
摘自:http://blog.linuxeye.com/336.html

该会员没有填写今日想说内容.
您需要登录后才可以回帖 登录 | 立即注册 新浪微博账号登陆

本版积分规则

快速回复 返回顶部 返回列表