chembo 发表于 2013-1-15 01:56:22

python 正则表达式使用笔记

import os,urllib,urllib2import re,sysurl = "http://www.iteye.com"page = urllib.urlopen(url).read()str = re.compile('<script([\S\s]*?)<\/script>')b = str.sub('',page)str = re.compile('<.*?>')b = str.sub('',b)wordlist = re.findall('{3,}',b)for aword in wordlist:    print aword
页: [1]
查看完整版本: python 正则表达式使用笔记