Snowflake, BigQuery, Redshift 비교

DWH 비교에 매우 유익한 동영상을 배견했으므로, 자신용으로 정리했습니다.

Data Engineering Study #5 「소문의 Snowflake Deep Dive」1:13:40 로부터의 사례 소개1
DWH 미카야의 각 특징과 선택 방법에 대해~Snowflake와 BigQuery와 Redshift와~

요점



1. 성능, 보안, 백업 기능 등에는 큰 차이가 없습니다.
2. 자체 플랫폼 통합을 고려할 때 BigQuery(=GCP) 또는 Redshift(=AWS)
3. 확장성과 비용이 비교 포인트

확장성



스노우플레이크
가상 웨어하우스 크기 조정

BigQuery
자동

Redshift
인스턴스 유형 및 노드 수 변경

관리가 가장 편안한 것은 BigQuery이지만 사용자가 개입할 수 있는 여지가 없기 때문에 요구 사항에 따라 단점이 된다.


【인용】 2020 Cloud Data Warehouse Benchmark: Redshift, Snowflake, Presto and BigQuery

비용



스노우플레이크
가상 웨어하우스 가동 시간(초)

BigQuery
쿼리할 데이터 스캔 양

Redshift
인스턴스 시작 시간

스노우플레이크


  • ETL 및 BI 용 워크로드별로 가상 웨어하우스를 준비하여 가동 시간을 조정합니다.

    BigQuery


  • 파티셔닝과 같은 쓸데없는 스캔을 피하기위한 기술 필요
  • 스캔 데이터 양에 대한 요금이므로 LIMIT 절은 비용 대책이 아닙니다.

    Redshift


  • 쿼리 처리 시간이나 스캔 양을 고려할 필요가 없습니다
  • 도입 전에 비용을 추정하기 쉽다
  • 좋은 웹페이지 즐겨찾기