빅데이터 저장 장소로서의 데이터 호수의 특징

년 봄 오전 문제
빅데이터 저장 장소인 데이터 호수의 특징은 어느 것이 적당한가.

1. 데이터 지연(Data Lake)은
그것은 거대한 저수호로 강처럼 끊임없이 유입되는 각양각색의 원시 데이터를 그 규모와 상관없이 원래의 격식을 보존하고 있다.저장된 데이터의 생성원은 사이트, 소셜미디어, 모바일 애플리케이션, IoT 기기 등이다.
축적된 데이터는 머신러닝, 예측 분석, 데이터 탐지, 아카이빙 등에 도움이 되지만, 어떻게 사용할지는 기본적으로 사용자가 결정한다.수집 범위를 결정하지 않고 그런 데이터가 일괄적으로 관리되기 때문에 분석할 때 필요한 데이터가 부족하거나 다른 시스템에서 수집되는 문제가 없어진다.
・데이터 복제는 규모와 종류에 상관없이 모든 데이터를 직접 저장할 수 있는 창고이다.
• 원래의 양식으로 보존한다.
・용도와 목적을 미리 결정한 것이 아니므로 데이터 모델을 정의하지 않습니다.
• 다양한 데이터를 혼합하여 단일 데이터 호수에 보관한다.
데이터 지연의 정의
데이터 호수는 구조화된 데이터와 비구조화된 데이터를 저장하는 장소로 각종 데이터 원본에서 수집한 데이터를 관리하고 활용하는 예처리를 하는 환경이다.
Hadoop 또는 개체 저장소 + Spark로 구성되어 있습니다.
참조:
https://www.ap-siken.com/kakomon/31_haru/q29.html

좋은 웹페이지 즐겨찾기