변환을 사용하여 데이터 프레임 분석을 위한 데이터 준비

| | |
데이터 프레임(다변량 분석)을 사용할 때 데이터 준비 단계에서 변환이 유용하고 변환이 생성한 완전한 특징 인덱스에서 이득을 볼 수 있다.
기존 Elasticsearch 인덱스를 요약 인덱스로 변환합니다. 이 인덱스를 다른, 이해하기 쉬운 형식으로 변환하는 기능으로 새로운 견해와 분석에 기회를 제공합니다.변환을 한 번 실행할지 연속으로 실행할지 결정할 수 있습니다.
이 예에서, 우리는 논평을 저장하는 원본 인덱스에서 세 개의 문서를 얻었는데, 그 중에는 사용자 id, 공급자, 평론이 포함되어 있다.

Source Index (reviews)
{
...
user-id: 123,
vendor: abc,
review: 4
},
{
...
user-id: 123,
vendor: def,
review: 3
},
{
...
user-id: 123,
vendor: ghi,
review: 5
}

변환을 통해 우리는 사용자 id에 따라Dest 인덱스를 그룹화할 수 있습니다. 예를 들어 각 사용자의 평론 수 (이 예는 3편의 평론) 와 평론의 간단한 평균치 (4+3+5)/4.

Dest Index (reviews-result)
{
...
user-id: 123,
num_reviews(sum): 3,
avg_review: 4
}

만약 연속적으로 실행된다면, 이것은 우리가 필요로 하는 방식으로 우리가 필요로 하는 데이터를 사용할 수 있다는 것을 의미한다. 예를 들어sum,max,cardinality 등이다.
| | |

This post is part of a series that covers , aiming to introduce and exemplify the possibilities and options available, in addition to addressing the context and usability.

Reference

이 문제에 관하여(변환을 사용하여 데이터 프레임 분석을 위한 데이터 준비), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/elastic/data-preparation-for-data-frame-analysis-with-transforms-2bp6

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다