ubuntu 安装solr中文分词(转载)
这个简短的教程描述了如何在 Ubuntu Server 上安装 Solr 4,我使用的版本是:Ubuntu Server 12.04 和 Apache Solr 4.0-BETA. 我同时将展示如何测试安装以及执行一个简单的索引和查询任务。
1. 安装包
1apt-get?install?tomcat6 curl?
2. 从 http://lucene.apache.org/solr 上下载 Solr 4 (写文章是的最新版本是 apache-solr-4.0.0-BETA.tgz)
3. 为 solr 选择一个目录,并使用 SOLR_HOME 环境变量指向这个目录,我这里选择的是 /opt/solr ,因此我的 SOLR_HOME=/opt/solr. 如果你想选择不同的目录请替换 /opt/solr
4. 解压缩文件并复制到 $SOLR_HOME:
5. 编辑 /opt/solr/collection1/conf/solrconfig.xml 中的 dataDir 配置项
1<dataDir>${solr.data.dir:/opt/solr/data}</dataDir>?
6. 为 Solr 创建数据目录,并给 tomcat 设置可读写权限
1%?mkdir?/opt/solr/data2%?sudo?chown?tomcat6 /opt/solr/data?
下面是我的 /opt/solr 目录的结构:
1<?xml?version="1.0"?encoding="utf-8"?>2<Context?docBase="/opt/solr/solr.war"?debug="0"?crossContext="true">3??<Environment?name="solr/home"?type="java.lang.String"value="/opt/solr"?override="true"/>4</Context>?
8. 重启 tomcat
1/etc/init.d/tomcat6 restart?
9. 你可以在浏览器上打开?http://localhost:8080/solr?来验证是否安装成功
solr 面板
索引测试以及 UTF-8 测试
solr 安装文件包含一个简单的 schema.xml (我们已经复制到了 $SOLR_HOME 目录) 和一些包含示例数据的 xml 文件,我们将使用这些数据来测试 UTF-8 编码是否正常。
1. 进入 solr 解压目录然后使用 curl 导入 utf8-example.xml 文件
1URL=http://localhost:8080/solr/update2curl $URL --data-binary @example/exampledocs/utf8-example.xml -H'Content-type:application/xml'?
来自服务器的响应类似如下XML信息:
view source?print?1<?xml?version="1.0"?encoding="UTF-8"?>2<response>3<lst?name="responseHeader"><int?name="status">0</int><intname="QTime">22</int></lst>4</response>5</xml>?
2. 提交文档
1curl?"$URL?softCommit=true"?
3. 通过测试搜索字符串?êa????,使用 Solr 管理界面或者使用 GET 请求访问
http://localhost:8080/solr/collection1/select?q=êa???
你将看到返回一个搜索结果。
?
转载自:?http://www.oschina.net/question/12_71342