首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 软件管理 > 软件架构设计 >

nutch汉语分词(修改源码的方式)

2012-09-07 
nutch中文分词(修改源码的方式)1、需要的jar包???? je-analysis-1.5.3.jar? javacc工具? ant2、部署nutch工

nutch中文分词(修改源码的方式)

1、需要的jar包

???? je-analysis-1.5.3.jar? javacc工具? ant

2、部署nutch工程到eclipse中,这一步网上有很多的参考。

3、nutch工程部署好后直接修改org.apache.nutch.analysis包下面的NutchDocumentAnalyzer.java的? tokenStream方法?? 即将以下代码

??????

<property>    <name>searcher.dir</name>    <value>存放爬虫结果的目录</value>  </property>

?

在浏览器中输入http://localhost:8080/nutch-1.0 ,回车后查看结果!

热点排行