六狼论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博账号登陆

只需一步,快速开始

搜索
查看: 76|回复: 0

不懂正则,却写过爬虫

[复制链接]

升级  23.33%

19

主题

19

主题

19

主题

秀才

Rank: 2

积分
85
 楼主| 发表于 2013-2-7 00:20:14 | 显示全部楼层 |阅读模式
正则一大堆东西,我不知道。

但是写爬虫要用到正则,尤其我以前写过智能型爬虫

举例爬取:<a href="a.html" target=_blank>test</a>

php我通常会写成 $p = "/<a href="(.+?)".*?>(.+?)<\/a>/is";

.*? 理解成过滤信息

(.+?) 你要拿得信息


这样的写法 C# 也可以。。如果java可以,请回下。
您需要登录后才可以回帖 登录 | 立即注册 新浪微博账号登陆

本版积分规则

快速回复 返回顶部 返回列表