변환을 사용하여 데이터 프레임 분석을 위한 데이터 준비

| | |
데이터 프레임(다변량 분석)을 사용할 때 데이터 준비 단계에서 변환이 유용하고 변환이 생성한 완전한 특징 인덱스에서 이득을 볼 수 있다.
기존 Elasticsearch 인덱스를 요약 인덱스로 변환합니다. 이 인덱스를 다른, 이해하기 쉬운 형식으로 변환하는 기능으로 새로운 견해와 분석에 기회를 제공합니다.변환을 한 번 실행할지 연속으로 실행할지 결정할 수 있습니다.
이 예에서, 우리는 논평을 저장하는 원본 인덱스에서 세 개의 문서를 얻었는데, 그 중에는 사용자 id, 공급자, 평론이 포함되어 있다.
Source Index (reviews)
{
...
user-id: 123,
vendor: abc,
review: 4
},
{
...
user-id: 123,
vendor: def,
review: 3
},
{
...
user-id: 123,
vendor: ghi,
review: 5
}
변환을 통해 우리는 사용자 id에 따라Dest 인덱스를 그룹화할 수 있습니다. 예를 들어 각 사용자의 평론 수 (이 예는 3편의 평론) 와 평론의 간단한 평균치 (4+3+5)/4.
Dest Index (reviews-result)
{
...
user-id: 123,
num_reviews(sum): 3,
avg_review: 4
}
만약 연속적으로 실행된다면, 이것은 우리가 필요로 하는 방식으로 우리가 필요로 하는 데이터를 사용할 수 있다는 것을 의미한다. 예를 들어sum,max,cardinality 등이다.
| | |

This post is part of a series that covers , aiming to introduce and exemplify the possibilities and options available, in addition to addressing the context and usability.

좋은 웹페이지 즐겨찾기