[Elasticsearch] 집합의 중요 개념 - Buckets(배럴) 및 Metrics(지표)
하이레벨 개념(High-Level Concepts)
DSL을 조회하는 것과 마찬가지로 집합(Aggregations)도 조합 가능한 문법을 가지고 있다. 독립된 기능 단원은 함께 혼합되어 당신의 요구를 만족시킬 수 있다.이것은 배워야 할 기본 개념이 비록 많지 않지만 그들의 조합 방식은 거의 무궁무진하다는 것을 의미한다.
집합을 파악하기 위해서는 두 가지 주요 개념만 알아야 한다.
버킷:
어떤 조건을 충족시키는 문서 집합.
Metrics(지표):
어떤 통의 문서를 위해 계산된 통계 정보.
그렇습니다!모든 집합은 간단하게 한 개 혹은 여러 통, 제로 또는 여러 개의 지표로 조합될 뿐이다.대충 SQL로 변환할 수 있습니다.SELECT COUNT(color)
FROM table
GROUP BY color
이상의 COUNT(color)는 하나의 지표에 해당한다.GROUP BY color는 한 통에 해당합니다.
배럴과 SQL의 그룹(Grouping)은 비슷한 개념을 가지고 있으며, 지표는 COUNT(), SUM(), MAX() 등과 비슷하다.
우리 이 개념들을 자세히 봅시다.
배럴(Buckets)
하나의 통은 특정 조건을 충족하는 문서 모음입니다.
직원 한 명이 남성통이나 여성통에 속하거나..
도시 Albany는 뉴욕주에 속합니다. 이 통은..
날짜 2014-10-28은 10월에 이 통에 속한다..
집합이 실행됨에 따라, 모든 문서의 값은 통의 조건과 일치하는지 여부를 결정하기 위해 계산됩니다.일치하면 이 문서는 이 통에 설치되고 집합은 계속 실행됩니다.
통도 다른 통에 끼워 넣을 수 있어 차원이나 조건을 구분할 수 있다.예를 들어 Cincinnati는 Ohio주라는 통에 넣을 수 있고 전체 Ohio주는 미국이라는 통에 넣을 수 있다.
ES에는 다양한 종류의 통이 있어 문서를 다양한 방식으로 구분할 수 있습니다(시간별, 가장 유행하는 단어별, 연령대별, 지리적 위치별, 그리고 더 많음).그러나 근본적으로 그들은 모두 같은 원리에 따라 작동한다. 조건에 따라 문서를 구분한다.
지표(Metrics)
통은 우리로 하여금 문서에 대해 의미 있는 구분을 하게 할 수 있지만, 결국 우리는 모든 통의 문서에 대해 어떤 지표를 계산해야 한다.유통을 나누는 것은 최종 목적을 달성하는 수단이다. 문서를 구분하는 방법을 제공하여 당신이 필요한 지표를 계산할 수 있도록 한다.
대부분의 지표는 간단한 수학 연산(예를 들어min,mean,max 및sum)일 뿐, 문서의 값을 사용하여 계산한다.실제 응용에서 지표는 평균 임금, 최고 매각 가격, 또는 95퍼센트의 조회 지연을 계산할 수 있다.
둘을 결합시키다
하나의 집합은 일부 통과 지표의 조합이다.하나의 집합은 단지 하나의 통, 또는 하나의 지표, 또는 하나하나만 있을 수 있다.통 안에 심지어 여러 개의 끼워 넣은 통이 있을 수 있다.예를 들어 우리는 문서를 소속 국가에 따라 배럴을 나누어 배럴당 평균 임금(하나의 지표)을 계산할 수 있다.
통은 끼워 넣을 수 있기 때문에 우리는 더욱 복잡한 집합 조작을 실현할 수 있다.
문서를 국가에 따라 유통하다.(통)
그리고 나라마다 통을 성별에 따라 나누세요.(통)
그리고 각 성별의 통을 연령대별로 나누어 줍니다.(통)
마지막으로 연령별로 평균 임금을 계산한다.(지표)
이때 각 국가, 성별, 연령 조합의 평균 임금 정보를 얻을 수 있다.그것은 하나의 요청을 통해 한 번의 데이터로 여러 차례 완성할 수 있다.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
elasticsearchnested 삽입 대상 전체 텍스트 검색 및 정렬
ES Nested 중첩 유형은 무엇입니까?Elasticsearch에는 다음과 같은 다양한 데이터 유형이 있습니다.
기본 데이터 형식:string 형식.ES 7.x에서string 형식은:text와 키워드로 업그레이드됩...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.
SELECT COUNT(color)
FROM table
GROUP BY color
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
elasticsearchnested 삽입 대상 전체 텍스트 검색 및 정렬ES Nested 중첩 유형은 무엇입니까?Elasticsearch에는 다음과 같은 다양한 데이터 유형이 있습니다. 기본 데이터 형식:string 형식.ES 7.x에서string 형식은:text와 키워드로 업그레이드됩...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.