基于lucene实时分布式搜索引擎ElasticSearch

ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。

下载地址: http://www.elasticsearch.org/download/

 

一、elasticSearch安装方法:

1.设置jdk环境变量,至少jdk1.6.

2.设置环境变量 ES_HOME,配置path后重启
a. ES_HOME  : ElasticSearch安装路径

b. ES_MAX_MEM : 设置 ElasticSearch 的最大使用内存

c. EX_MIN_MEM :  设置ElasticSearch 的最小使用内存

d.  ES_HEAP_SIZE: 环境变量,保证 JVM 使用的最大和最小内存用量相同。

例子linux

export ES_HOME="/home/weblogic/elasticsearch-0.90.0";export PATH=$ES_HOME/bin:$PATH;export ES_MAX_MEM="25g";export ES_MIN_MEM="1024M";

 

3.windows直接运行bin\elasticsearch.bat  ; linux 运行elasticsearch.sh

4.推荐学习资料:http://www.searchtech.pro/

 

一、插件安装方法:

服务器管理插件:  https://github.com/mobz/elasticsearch-head 

1.进入elasticsearchbin目录 cd D:\elasticsearch-0.20.5

2. 执行bin\plugin.bat  如:bin\plugin -install mobz/elasticsearch-head  

3.es服务开启访问http://localhost:9200/_plugin/head/

 

服务器启动运行工具:https://github.com/elasticsearch/elasticsearch-servicewrapper

1.直接解压到bin目录(bin\service)。service目录下有个elasticsearch.conf配置文件,主要是设置一些java运行环境参数

参数:

#eshome路径,不用用默认值就可以

set.default.ES_HOME=<Path to ElasticSearch Home>

#分配给es的最小内存

set.default.ES_MIN_MEM=256

#分配给es的最大内存

set.default.ES_MAX_MEM=1024

启动等待超时时间(以秒为单位)

wrapper.startup.timeout=300

关闭等待超时时间(以秒为单位)

wrapper.shutdown.timeout=300

# ping超时时间(以秒为单位)

wrapper.ping.timeout=300

2.运行命令:

bin/service/elasticsearch +

console 在前台运行es

start 在后台运行es

stop 停止es

install 使es作为服务在服务器启动时自动启动

remove 取消启动时自动启动

 

集群监控工具 https://github.com/lukas-vlcek/bigdesk

bigdeskelasticsearch的一个集群监控工具;

1.插件安装运行:bin\plugin -install lukas-vlcek/bigdesk

2.运行es

3.打开http://localhost:9200/_plugin/bigdesk/

客服端开发工具 Jest

Jest:https://github.com/searchbox-io/Jest

它是ESjava开源客户端,基于http restful方式。

 

ES操作工具 CURL

CURL:http://curl.haxx.se/download.html

curl是利用URL语法在命令行方式下工作的文件传输工具。

创建索引 curl -XPUT ‘http://localhost:9200/music_reviews/’

 

中文分词插件(ik,mmseg) ES默认的分词器为standard,自定义的analyzer配置为:index.analysis.analyzer.default.type:ik  

1.安装:plugin -install medcl/elasticsearch-analysis-ik/1.1.0  

2.配置词典config目录

cd config

wget http://github.com/downloads/medcl/elasticsearch-analysis-ik/ik.zip –no-check-certificate

unzip ik.zip

rm ik.zip

3.ik分词配置elasticsearch.yml文件

index.analysis.analyzer.ik.type : “ik”

或者
index:

analysis:

analyzer:

ik:

alias: [ik_analyzer]

type: org.elasticsearch.index.analysis.IkAnalyzerProvider

“基于lucene实时分布式搜索引擎ElasticSearch”的2个回复

发表评论

电子邮件地址不会被公开。 必填项已用*标注

3 × 5 =

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据