Elasticsearch 핵심 개념

2968 단어

elasticsearch의 핵심 개념


(1) NRT(Near Realtime)가 실시간에 가깝다는 두 가지 뜻으로 데이터를 쓸 때부터 데이터에 이르기까지 작은 지연(대략 1초)을 검색할 수 있다.es 기반 검색 및 분석 수행 초급
(2)Cluster: 집단, 여러 개의 노드를 포함하고 각 노드가 어느 집단에 속하는지는 하나의 설정(집단 이름, 기본값은elasticsearch)을 통해 결정된다. 중소형 응용 프로그램에 있어 처음에 하나의 집단은 하나의 노드가 정상이었다. (3)Node: 노드, 집단의 한 노드, 노드에도 하나의 이름이 있다.노드 이름은 매우 중요합니다. (운영 관리 작업을 실행할 때) 기본 노드는'elasticsearch'라는 이름의 집단을 추가합니다. 만약에 한 무더기의 노드를 직접 시작하면 자동으로 elasticsearch 집단을 구성합니다. 물론 한 노드도 하나의 elasticsearch 집단으로 구성할 수 있습니다.
(4) Document &field: 문서,es의 최소 데이터 단위,document는 고객 데이터, 상품 분류 데이터, 주문 데이터로 나눌 수 있습니다. 보통 JSON 데이터 구조로 모든 index의 type에 여러 개의 document를 저장할 수 있습니다.하나의 문서에 여러 개의 필드가 있는데, 각각의 필드는 하나의 데이터 필드입니다.
product document

{
  "product_id": "1",
  "product_name": " ",
  "product_desc": " ",
  "category_id": "2",
  "category_name": " "
}


(5) Index: 인덱스는 비슷한 구조의 문서 데이터를 포함한다. 예를 들어 고객 인덱스, 상품 분류 인덱스, 주문 인덱스, 인덱스의 이름이 있다.하나의 index는 많은 문서를 포함하는데, 하나의 index는 유사하거나 같은 문서를 대표한다.예를 들어 제품 인덱스, 상품 인덱스를 만들면 모든 상품 데이터, 모든 상품document가 저장될 수 있습니다.(6) Type: 유형, 모든 색인에 하나 이상의 type이 있을 수 있다. type은 index의 논리적 데이터 분류이고 하나의 type 아래의document는 모두 같은field가 있다. 예를 들어 블로그 시스템, 하나의 색인이 있는데 사용자 데이터 type, 블로그 데이터 type, 평론 데이터 type을 정의할 수 있다.
상품 index, 안에 모든 상품 데이터, 상품 문서 저장
그러나 상품은 여러 종류로 나뉘는데 각 종류의document의field는 그다지 같지 않을 수 있다. 예를 들어 전기 상품은 판매 후 시간 범위와 같은 특수한field를 포함할 수 있다.생선 유통기한 같은 특수field도 포함되어 있다
type, 일본 상품 type, 전기 상품 type, 생선 상품 type
일본화 상품.전기 상품.생선 상품type:product_id,product_name,product_desc,category_id,category_name
모든 type에document가 포함되어 있습니다
{
  "product_id": "2",
  "product_name": " ",
  "product_desc": "4k ",
  "category_id": "3",
  "category_name": " ",
  "service_period": "1 "
}
-------------------------------------------------------
{
  "product_id": "3",
  "product_name": " ",
  "product_desc": " , ",
  "category_id": "4",
  "category_name": " ",
  "eat_period": "7 "
}

(7)shard: 한 대의 기계가 대량의 데이터를 저장할 수 없습니다.es는 한 인덱스의 데이터를 여러 개의shard로 나누어 여러 서버에 분포하여 저장할 수 있습니다.shard가 있으면 가로로 확장하고 더 많은 데이터를 저장하여 검색과 분석 등 조작을 여러 서버에 분포하여 실행하고 토출량과 성능을 향상시킬 수 있다.모든shard는 루틴 인덱스입니다.
(8)replica: 어떤 서버든 언제든지 고장나거나 다운될 수 있습니다. 이 때shard는 잃어버릴 수 있기 때문에 각각shard에 여러 개의 replica 사본을 만들 수 있습니다.리플리카는shard가 고장났을 때 데이터를 잃어버리지 않도록 예비 서비스를 제공할 수 있으며, 여러 개의 리플리카는 검색 작업의 흡수량과 성능을 향상시킬 수 있다.primaryshard (인덱스를 만들 때 한 번의 설정, 수정할 수 없음, 기본 5개), replicashard (수시적으로 수량을 수정, 기본 1개), 기본 인덱스당 10개의shard, 5개의primaryshard, 5개의replicashard, 최소한의 고가용 설정, 2대의 서버입니다.

elasticsearch 핵심 개념 vs. 데이터베이스 핵심 개념


Elasticsearch
데이터베이스
Document
데이터 테이블의 한 줄 데이터
Index
데이터베이스
type
데이터 테이블

좋은 웹페이지 즐겨찾기