AWS Lake Formation의 개요를 그래픽 및 용어로 정리

대략적인 이해AWS Lake Formation를 위해 도형과 용어로 기본 개념과 구성 요소를 정리한다.

AWS Lake Formation이란 무엇입니까?


  • AWS에서 데이터 지연을 구축하고 운용하기 위한 관리 서비스
  • 실체는 대체적으로 AWS의 각종 서비스를 휘감은 것(Glue, IAM, S3, etc.)
  • IAM과 달리 데이터 지연 전용 액세스 제어를 위한 별도의 권한 관리 기구

  • AWS Glue는 보안 및 권한 관리를 용이하게 하기 위해 실제 데이터도 저장하는 것으로 인식됨
  • IAM과 Glue를 개별적으로 사용하여 데이터 호수를 구축하고 운용하는 것보다 데이터 호수를 처리하기 쉽다
  • 대략적인 개념도


    그림을 만들면 상당히 간단하다.

    시험을 준비하다


  • 공식 문서(2012/02/04시 영어만)

  • 있어요. 공식 만화
  • Lake Fromation의 뿌리는 AWS Glue로 AWS Glue의 개요를 그림과 용어로 정리와 함께 보면 이해하기 쉬울 것 같다
  • 용어


    AWS Lake Formation의 용어 정의
    용어
    의향
    데이터 지연(데이터 Lake)
    Lake Formation 데이터 디렉토리의 엔티티로 S3에 저장된 데이터입니다.정형 데이터든 비정형 데이터든 모두 저장해야 한다
    데이터 액세스(데이터 액세스)
    LF(Lake Formation)에서 데이터에 대한 액세스 권한을 관리합니다.개체는 IAM
    파란색 인쇄(Blueprint)
    데이터 로깅에 데이터를 간단하게 저장하는 데 사용되는 템플릿입니다.블루 프린트로 작업 절차를 제작할 수 있습니다.
    워크플로우(Workflow)
    관련 작업의 컨테이너입니다.파란색 인쇄로 생성됩니다.실체는 AWS Glue의 크로럴과 트리거입니다.글루의 여러 가지 골치 아픈 일들을 나열하고 있다
    데이터 카탈로그(Data Catalog)
    메타데이터 상점.Apache Hive처럼 메타데이터로 데이터를 관리합니다.실질적으로는 Glue의 데이터 디렉터리입니다.1 AWS 계정, 1 영역은 1 개만 만들 수 있음
    Underlying Data
    데이터 디렉토리 테이블에서 참조하는 원본 데이터
    선도 펄스
    직접 IAM의 주요 펄스
    데이터 지연 관리자(Data Lake Administrator)
    Lake Formation에서 리소스에 대한 모든 권한을 관리할 수 있는 주요 정보를 제공합니다.LF를 시작할 때 가장 먼저 작성된 사용자입니다.데이터 호수 전용 관리자로서 IAM의 권한 관리 기능과 별도로 정의되며, IAM을 보유한AdministratorAccess도 자동으로 데이터 호수 관리자가 되지 않는다(스스로 자신을 지정할 수 있다).※ 상세 정보

    메모지

  • LF와 Glue의 데이터 카탈로그 공유
  • 안 돼, 안 돼.
  • 좋은 웹페이지 즐겨찾기