六狼论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博账号登陆

只需一步,快速开始

搜索
查看: 75|回复: 0

nutch 1.2 学习

[复制链接]

升级  24.67%

23

主题

23

主题

23

主题

秀才

Rank: 2

积分
87
 楼主| 发表于 2013-2-7 03:38:37 | 显示全部楼层 |阅读模式
现在开始对它进行研究和应用,有兴趣的可以加q:15541307 一起討論。
 
研究目的:
1.海量数据情况下hadoop的继续深入
2.分布式下爬虫和搜索的探索
3.pagerank的实际分析
4.对开源架构的学习
 
 
references:
eclipse上布置(是java project而不是web project)
 
应用心得]nutch1.2 的eclipse windows 集成
 
网络爬虫调研报告
Nutch架构

 
您需要登录后才可以回帖 登录 | 立即注册 新浪微博账号登陆

本版积分规则

快速回复 返回顶部 返回列表