elasticsearch 학습노트 고급편(15)-실전 검색 추천
5239 단어 elasticsearch
데이터 준비
PUT _bulk
{"index": {"_index": "test_index", "_id": "1"}}
{"test_field": "hello world"}
{"index": {"_index": "test_index", "_id": "2"}}
{"test_field": "hello win"}
{"index": {"_index": "test_index", "_id": "3"}}
{"test_field": "hello dog"}
{"index": {"_index": "test_index", "_id": "4"}}
{"test_field": "hello cat"}
검색 추천: match_phrase_prefix
match_phrase_prefix 원리와 match_phrase와 유사하지만 유일한 차이점은 마지막term을 접두사로 검색하는 것이다.검색 시간
hello w를 검색하는 것을 예로 들자.
hello는 match 검색을 하고 대응하는 문서를 검색합니다. w는 접두사로 전체 역렬 인덱스를 스캔하고 w로 시작하는 모든 문서를 찾습니다. 그리고 모든 문서에서 hello와 w로 시작하는 문자를 포함하는 문서를 찾습니다.마지막으로 이 문서에서 당신의 slop에 따라 계산합니다. slop의 범위 내에서 Hello와 w가 문서의 Hello와 w로 시작하는 단어의position과 일치하는지 확인하십시오.검색 코드는 다음과 같습니다.
GET /test_index/_search
{
"query": {
"match_phrase_prefix": {
"test_field": "hello w"
}
}
}
출력 결과:
{
"took" : 40,
"timed_out" : false,
"_shards" : {
"total" : 1,
"successful" : 1,
"skipped" : 0,
"failed" : 0
},
"hits" : {
"total" : {
"value" : 2,
"relation" : "eq"
},
"max_score" : 2.5133061,
"hits" : [
{
"_index" : "test_index",
"_type" : "_doc",
"_id" : "1",
"_score" : 2.5133061,
"_source" : {
"test_field" : "hello world"
}
},
{
"_index" : "test_index",
"_type" : "_doc",
"_id" : "2",
"_score" : 2.5133061,
"_source" : {
"test_field" : "hello win"
}
}
]
}
}
검색 추천:ngram
ngram 검색 추천과 접두사가 일치하는 큰 차이점은 ngram은 index time에 속하는 것으로 index를 할 때 이를 분할한다. 예를 들어 세계는 w, o, r, l, d로 분할된다.하지만 검색의 본질과 match_phrase_prefix는 똑같아요.
hello w를 검색하는 것을 예로 들자.
hello는 match 검색을 하고 대응하는 문서를 검색합니다. w는 접두사로 전체 역렬 인덱스를 스캔하고 w로 시작하는 모든 문서를 찾습니다. 그리고 모든 문서에서 hello와 w로 시작하는 문자를 포함하는 문서를 찾습니다.마지막으로 이 문서에서 당신의 slop에 따라 계산합니다. slop의 범위 내에서 Hello와 w가 문서의 Hello와 w로 시작하는 단어의position과 일치하는지 확인하십시오.
색인을 만들려면 다음과 같이 하십시오.
PUT test_index
{
"settings": {
"analysis": {
"filter": {
"autocomplete_filter": {
"type": "edge_ngram",
"min_gram": 1,
"max_gram": 20
}
},
"analyzer": {
"autocomplete": {
"type": "custom",
"tokenizer": "standard",
"filter": [
"lowercase",
"autocomplete_filter"
]
}
}
}
},
"mappings": {
"properties": {
"test_field": {
"type": "text",
"analyzer": "autocomplete",
"search_analyzer": "standard"
}
}
}
}
데이터 삽입
PUT _bulk
{"index": {"_index": "test_index", "_id": "1"}}
{"test_field": "hello world"}
{"index": {"_index": "test_index", "_id": "2"}}
{"test_field": "hello win"}
{"index": {"_index": "test_index", "_id": "3"}}
{"test_field": "hello dog"}
{"index": {"_index": "test_index", "_id": "4"}}
{"test_field": "hello cat"}
조회
GET /test_index/_search
{
"query": {
"match_phrase": {
"test_field": "hello w"
}
}
}
출력:
{
"took" : 1,
"timed_out" : false,
"_shards" : {
"total" : 1,
"successful" : 1,
"skipped" : 0,
"failed" : 0
},
"hits" : {
"total" : {
"value" : 2,
"relation" : "eq"
},
"max_score" : 1.1620307,
"hits" : [
{
"_index" : "test_index",
"_type" : "_doc",
"_id" : "1",
"_score" : 1.1620307,
"_source" : {
"test_field" : "hello world"
}
},
{
"_index" : "test_index",
"_type" : "_doc",
"_id" : "2",
"_score" : 1.1620307,
"_source" : {
"test_field" : "hello win"
}
}
]
}
}
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
kafka connect e elasticsearch를 관찰할 수 있습니다.No menu lateral do dashboard tem a opção de connectors onde ele mostra todos os clusters do kafka connect conectados atu...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.