빅데이터 저장 장소로서의 데이터 호수의 특징
1008 단어 AP 시험공부기록 31춘
빅데이터 저장 장소인 데이터 호수의 특징은 어느 것이 적당한가.
1. 데이터 지연(Data Lake)은
그것은 거대한 저수호로 강처럼 끊임없이 유입되는 각양각색의 원시 데이터를 그 규모와 상관없이 원래의 격식을 보존하고 있다.저장된 데이터의 생성원은 사이트, 소셜미디어, 모바일 애플리케이션, IoT 기기 등이다.
축적된 데이터는 머신러닝, 예측 분석, 데이터 탐지, 아카이빙 등에 도움이 되지만, 어떻게 사용할지는 기본적으로 사용자가 결정한다.수집 범위를 결정하지 않고 그런 데이터가 일괄적으로 관리되기 때문에 분석할 때 필요한 데이터가 부족하거나 다른 시스템에서 수집되는 문제가 없어진다.
・데이터 복제는 규모와 종류에 상관없이 모든 데이터를 직접 저장할 수 있는 창고이다.
• 원래의 양식으로 보존한다.
・용도와 목적을 미리 결정한 것이 아니므로 데이터 모델을 정의하지 않습니다.
• 다양한 데이터를 혼합하여 단일 데이터 호수에 보관한다.
데이터 지연의 정의
데이터 호수는 구조화된 데이터와 비구조화된 데이터를 저장하는 장소로 각종 데이터 원본에서 수집한 데이터를 관리하고 활용하는 예처리를 하는 환경이다.
Hadoop 또는 개체 저장소 + Spark로 구성되어 있습니다.
참조:
https://www.ap-siken.com/kakomon/31_haru/q29.html
Reference
이 문제에 관하여(빅데이터 저장 장소로서의 데이터 호수의 특징), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/lymansouka2017/items/763c4e098c8e5b65c5d8텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)