首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 软件管理 > 软件架构设计 >

compass配备paoding中文分词器

2012-10-26 
compass配置paoding中文分词器在hibernate search和compass间最后还是选择了compass,从用法两者的差别不是

compass配置paoding中文分词器
在hibernate search和compass间最后还是选择了compass,从用法两者的差别不是特别大,都很简单,只是compass支持的持久框架更多一些

先说说为什么用paoding而不用lunece自带的ChineseAnalyzer
我用ChineseAnalyzer创建了索引后,然后搜索‘山东’这个关键字 能够搜索出包含‘山东’的文本,但是改成‘山东人在北京’啥都搜不出来,看看了其分词算是是一个字一个字的切分,可以说是相当的笨 完全仿照切分英文的方式切中文,这显然不行
后来网上搜索了一下中文分词器,决定采用qieqie兄的paoding
测试了一下效果基本能够达到

废话不多说 直接说说paoding的配置,在spring配置文件中添加庖丁分析器

<property name="compassSettings"><props><prop key="compass.engine.connection">file://c:/compass</prop><prop key="compass.transaction.factory">org.compass.spring.transaction.SpringSyncTransactionFactory</prop><prop key="compass.engine.analyzer.default.type">net.paoding.analysis.analyzer.PaodingAnalyzer</prop></props></property>

classpath下创建 paoding-dic-home.properties文件
文件内容就一句:paoding.dic.home=e:/paoding
在e;/paoding目录下创建自己的词典文件 *.dic
OK 配置结束
1 楼 卡拉阿风 2008-10-19   <prop key="compass.engine.analyzer.default.type">net.paoding.analysis.analyzer.PaodingAnalyzer</prop>

这里好像许多热门写法都不同 2 楼 xly_971223 2008-11-03   卡拉阿风 写道
&lt;prop key="compass.engine.analyzer.default.type"&gt;net.paoding.analysis.analyzer.PaodingAnalyzer&lt;/prop&gt; 这里好像许多热门写法都不同

自己选择合适的分词器
3 楼 allwefantasy 2010-02-07   现在我也在使用compass,想问下,如果我将程序部署到了多台机器上(负载均衡),那么他们读写同一个目录(存放索引文件)会不会有问题?有什么解决方案?gigaspace是不是为了解决这个问题的?

热点排行