compass配置paoding中文分词器
在hibernate search和compass间最后还是选择了compass,从用法两者的差别不是特别大,都很简单,只是compass支持的持久框架更多一些
先说说为什么用paoding而不用lunece自带的ChineseAnalyzer
我用ChineseAnalyzer创建了索引后,然后搜索‘山东’这个关键字 能够搜索出包含‘山东’的文本,但是改成‘山东人在北京’啥都搜不出来,看看了其分词算是是一个字一个字的切分,可以说是相当的笨 完全仿照切分英文的方式切中文,这显然不行
后来网上搜索了一下中文分词器,决定采用qieqie兄的paoding
测试了一下效果基本能够达到
废话不多说 直接说说paoding的配置,在spring配置文件中添加庖丁分析器
<property name="compassSettings"><props><prop key="compass.engine.connection">file://c:/compass</prop><prop key="compass.transaction.factory">org.compass.spring.transaction.SpringSyncTransactionFactory</prop><prop key="compass.engine.analyzer.default.type">net.paoding.analysis.analyzer.PaodingAnalyzer</prop></props></property>