Amazon Elasticsearch Service로 Embulk를 사용하여 데이터 로드
4207 단어 EmbulkElasticsearchServiceAWS
소개
AWS ElasticSearch Service는 완전 관리형으로 운영할 필요가 없으며, 지금까지 (2017/5/18) 다른 추종을 용서하지 않는 매력이 있습니다 (필자는 Elastic사의 Elastic Cloud는 사용한 적이 없습니다)
Azure의 경우 MarketPlace에서 Elastic-Stack을 제공하여 완전 점유 클러스터를 자동으로 구축할 수 있습니다. GCP도 blog에 있는 대로 Azure와 거의 같다. 완전 점유 클러스터의 장점? 있을 것 같은 반면, ElasticCluster의 운영/관리가 trade-off로 되어 있습니다.
당초에는 Azure에서 개별 클러스터를 사용하고 있었습니다만 트러블이 계속되어, 운용 등은 하고 싶지 않기 때문에 AWS에 바람피워 보았으므로 그 기록과 Tips를 정리합니다
환경
설정
실행
이하의 순서로 실시
in:
type: azure_blob_storage
account_name: <BLOB NAME>
account_key: <BLOB KEY>
container: <CONTAINER NAME>
path_prefix: <PREFIX as you like>
decoders:
- {type: gzip}
parser:
charset: UTF-8
newline: CRLF
type: jsonl
schema:
out:
type: elasticsearch_using_url
mode: normal
nodes:
- url: "<YOUR ElasticSearch Domain>.us-east-2.es.amazonaws.com:80"
index: "sample"
index_type: "sample"
$ embulk preview config.yml
$ embulk run config.yml -l warn -r resume_state_aws.yml &>> embulk_awses.log
확인
요약
여담
AWS
Azure
GCP
비용
\$250 - $300 정도
\$530
미확인
Reference
이 문제에 관하여(Amazon Elasticsearch Service로 Embulk를 사용하여 데이터 로드), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/fabregas4you/items/4bbed11de5760aa82ffb텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)