elasticsearch 6.5.4 - ik 단어 플러그 인 설치, 테스트, 확장 사전 설정
메모: ik 단어 기 는 elasticsearch 버 전과 일치 해 야 합 니 다. 설정 이 완료 되면 기본 단어 도 구 를 설정 할 수 있 고 색인 파일 을 만 들 때 ik 단어 도 구 를 사용 할 수 있 습 니 다.
1. elasticsearch - ik 단어 환경 은 elasticsearch 와 일치 해 야 합 니 다.
제 elasticsearch 버 전 은 elasticsearch - v 6.5.4 이기 때문에 다운로드 해 야 할 ik 분사 기 버 전 은 elasticsearch - ik - v 6.5.4 입 니 다.
파일 다운로드:
wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.5.4.tar.gz
wget https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.5.4/elasticsearch-analysis-ik-6.5.4.zip
elasticsearch 의 설치 디 렉 터 리 에 들 어가 서 ik 분사 기 내 파일 을 plugin 디 렉 터 리 로 압축 해제 합 니 다.
root @ localhost in /data/elasticsearch-6.5.4 [17:18:23]
$ l
4.8M
drwxrwxr-x 9 euser euser 198 12 11 11:26 .
drwxr-xr-x. 7 root root 90 1 16 16:35 ..
drwxrwxr-x 3 euser euser 4.0K 12 11 11:13 bin
drwxrwxr-x 2 euser euser 178 12 11 11:32 config
drwxrwxr-x 3 euser euser 19 12 11 11:25 data
-rwxrwxr-x 1 euser euser 4.3M 12 6 22:30 elasticsearch-analysis-ik-6.5.4.zip
drwxrwxr-x 3 euser euser 4.0K 11 30 08:02 lib
-rwxrwxr-x 1 euser euser 14K 11 30 07:55 LICENSE.txt
drwxrwxrwx 2 euser euser 8.0K 2 11 01:30 logs
drwxrwxr-x 28 euser euser 4.0K 11 30 08:02 modules
-rwxrwxr-x 1 euser euser 395K 11 30 08:01 NOTICE.txt
drwxrwxr-x 3 euser euser 25 12 11 11:29 plugins
-rwxrwxr-x 1 euser euser 8.4K 11 30 07:55 README.textile
plugin 디 렉 터 리 에 들 어가 폴 더 만 들 기
mkdir analysis-ik/
ik 분사 기 에 있 는 파일 을 analysis - ik 디 렉 터 리 로 압축 풀기:
# root @ iZ2zedtbewsc8oa9i1cb4tZ in /data/elasticsearch-6.5.4 [18:01:37]
$ cd plugins/
# root @ iZ2zedtbewsc8oa9i1cb4tZ in /data/elasticsearch-6.5.4 [18:01:37]
$ mkdir analysis-ik
# root @ iZ2zedtbewsc8oa9i1cb4tZ in /data/elasticsearch-6.5.4 [18:01:37]
$ mv ../../../analysis-ik analysis-ik
# root @ iZ2zedtbewsc8oa9i1cb4tZ in /data/elasticsearch-6.5.4/plugins [18:04:29]
$ ls
analysis-ik
# root @ iZ2zedtbewsc8oa9i1cb4tZ in /data/elasticsearch-6.5.4/plugins [18:04:34]
$ ls -l ./analysis-ik/
total 1432
-rw-r--r-- 1 root root 263965 May 6 2018 commons-codec-1.9.jar
-rw-r--r-- 1 root root 61829 May 6 2018 commons-logging-1.2.jar
drwxr-xr-x 2 root root 4096 Aug 26 17:52 config
-rw-r--r-- 1 root root 54693 Dec 23 11:26 elasticsearch-analysis-ik-6.5.4.jar
-rw-r--r-- 1 root root 736658 May 6 2018 httpclient-4.5.2.jar
-rw-r--r-- 1 root root 326724 May 6 2018 httpcore-4.4.4.jar
-rw-r--r-- 1 root root 1805 Dec 23 11:26 plugin-descriptor.properties
-rw-r--r-- 1 root root 125 Dec 23 11:26 plugin-security.policy
기본 단어 도 구 를 ik 단어 로 설정 합 니 다. ElasticSearch 의 설정 파일 config / elasticsearch. yml 의 마지막 줄 에 인자 추가: index. analysis. analysis. analyser. default. type: ik (모든 색인 의 기본 단어 기 를 ik 단어 로 설정 합 니 다. 이렇게 하지 않 아 도 됩 니 다. mapping 설정 을 통 해 ik 단 어 를 사용 할 수 있 습 니 다)
# root @ iZ2zedtbewsc8oa9i1cb4tZ in /data/elasticsearch-6.5.4 [18:33:16]
$ cd config/
# root @ iZ2zedtbewsc8oa9i1cb4tZ in /data/elasticsearch-6.5.4/config [18:33:21]
$ echo "index.analysis.analyzer.default.type:ik" >> elasticsearch.yml
2. eleasticsearch 를 시작 하고 ik 단 어 를 테스트 합 니 다.
테스트 가 편리 하고 일반 모드 로 시작 합 니 다:
./bin/elasticsearch
색인 파일 생 성:
curl -XPUT http://localhost:9200/class
ik 단 어 를 사용 하여 효과 보기:
curl -XGET -H "Content-Type: application/json" 'http://localhost:9200/class/_analyze?pretty' -d '
{
"analyzer": "ik_max_word",
"text": " , "
}'
{
"tokens" : [
{
"token" : " ",
"start_offset" : 0,
"end_offset" : 1,
"type" : "CN_CHAR",
"position" : 0
},
{
"token" : " ",
"start_offset" : 1,
"end_offset" : 2,
"type" : "CN_CHAR",
"position" : 1
},
{
"token" : " ",
"start_offset" : 2,
"end_offset" : 5,
"type" : "CN_WORD",
"position" : 2
},
{
"token" : " ",
"start_offset" : 2,
"end_offset" : 4,
"type" : "CN_WORD",
"position" : 3
},
{
"token" : " ",
"start_offset" : 3,
"end_offset" : 5,
"type" : "CN_WORD",
"position" : 4
},
{
"token" : " ",
"start_offset" : 6,
"end_offset" : 7,
"type" : "CN_CHAR",
"position" : 5
},
{
"token" : " ",
"start_offset" : 7,
"end_offset" : 9,
"type" : "CN_WORD",
"position" : 6
},
{
"token" : " ",
"start_offset" : 9,
"end_offset" : 10,
"type" : "CN_CHAR",
"position" : 7
},
{
"token" : " ",
"start_offset" : 10,
"end_offset" : 12,
"type" : "CN_WORD",
"position" : 8
},
{
"token" : " ",
"start_offset" : 12,
"end_offset" : 13,
"type" : "CN_CHAR",
"position" : 9
},
{
"token" : " ",
"start_offset" : 13,
"end_offset" : 15,
"type" : "CN_WORD",
"position" : 10
}
]
}
3. 테스트 완료 후 데 몬 으로 시작
./data/elasticsearch/bin/elasticsearch -d
계속...
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
spark 의 2: 원리 소개Google Map/Reduce 를 바탕 으로 이 루어 진 Hadoop 은 개발 자 에 게 map, reduce 원 어 를 제공 하여 병렬 일괄 처리 프로그램 을 매우 간단 하고 아름 답 게 만 들 었 습 니 다.S...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.