leibnitz 发表于 2013-2-7 03:38:37

nutch 1.2 学习

现在开始对它进行研究和应用,有兴趣的可以加q:15541307 一起討論。
 
研究目的:
1.海量数据情况下hadoop的继续深入
2.分布式下爬虫和搜索的探索
3.pagerank的实际分析
4.对开源架构的学习
 
 
references:
eclipse上布置(是java project而不是web project)
 
应用心得]nutch1.2 的eclipse windows 集成
 
网络爬虫调研报告
Nutch架构

 
页: [1]
查看完整版本: nutch 1.2 学习