08-18 Document DB 데이터 모델링
4881 단어 BigdataLessonBigdataLesson
1. MongoDB 데이터 모델링
데이터 모델링
- 실세계의 내용을 그림과 도형으로 나타내는 것
- 데이터가 저장되어 있는 모양
모델링 절차
개념적 모델링 -> 논리적 모델링 -> 물리적 모델링
- 개념적 모델링: 비즈니스 영역으로부터 데이터를 추출하는 단계
- 논리적 모델링 : Document 구조에 맞게 분석 설계하는 과정
- 물리적 모데링: MongoDB의 물리적 구조에 맞게 설계하는 단계
분석/설계 단계
2. MongoDB 설계의 주요 특징
Data& 프로세스 설계의 중심
- HOST 환경기반 파일 시스템 : 프로세스 중심의 데이터 구조설계
- 클라이언트/서버 환경의 관계형 DB : 트랜잭션의 효율적인처리를 위한 Data 중심의 설계 기법을 지향
- 클라우드 컴퓨팅 환경의 NoSQL : Data와 프로세스 모두를 설계의 중심에 둠. (Big Data의 수집 및 저장이 중심)
Rich Document Structure
- 관계형 DB는 정규화를 통해 데이터 중복을 제거하며 무결성을 보장하는 설계 기법을 지향.
- NoSQL은 데이터의 중복을 허용하며 역정규화된 설계를 지향.
- 관계형 DB가 요구되었던 당시와 달리 저장장치의 비약적 발전과 저렴한 가격 요인도 설계에 중요한 요소임
N:M 관계 구조를 설계 가능
- 관계형 DB는 Entity 간의 N:M 관계 구조를 설계할 수 없지만 NoSQL은 N:M 관계 구조를 설계할 수 있고 구축 가능
불필요한 JOIN을 최소화 시킴
- 관계형 DB는 Entity 간의 Relationship을 중심으로 데이터의 무결성을 보장하지만 불필요한 JOIN을 유발시킴으로써 코딩양을 증가시키고 검색성능을 저하시키는 원인을 제공.
- NoSQL은 중첩 데이터 구조를 설계할 수 있기 때문에 불필요한 JOIN을 최소화시킴
Schema 없음
- Document DB는 기본적으로 Schema가 없기 때문에 유연한 데이터구조를 설계 가능.
관계형 DB에 비해 빠른 쓰기/읽기
- 기존의 업무 영역에서 처리할 수 없었던 비정형 데이터에 대한 저장과관리가 가능하며 관계형 DB에 비해 빠른 쓰기와 읽기가 가능한 데이터설계가 가능.
유연성이 있는 서버 구조 제공
- 관계형 DBMS는 서버에 설치할때 DBMS전용 메모리 영역 활당하여 제한된 크기의 메모리만 사용 가능
- NoSQL은 유연한 자원 할당 기술을 사용
3. MongoDB 설계 기준
데이터 조작은 어떻게 수행되는가?
ACCESS PATTERN은 어떤가?
SCHEMA 설계시 고려 사항은?
4. MongoDB 설계 주요 패턴
Embedded Document(Rich Document)구조
Extent Document(Rich Document) 구조
Link 구조
Inheritence (OODBMS) 구조
계층형 데이터 구조
관계형 DBMS
Embeded Document(Rich Document)
Extent Document(Rich Document)
Rich Document 구조의 장단점
- Query가 단순함
- Join문 실행할 필요가 없기 때문에 도큐먼트 단위의 데이터 저장에 효과적이고 빠른 성능 보장
- 데이터 보안에 효과적
- Embedded되는 도큐먼트의 크기는 최대 16MB범위에서 가능
- Embedded 되는 도큐먼트가 존재하지 않는 컬렉션에는 부적합
Manual Link
Link 구조의 장단점
- 별도의 논리적 구조로 저장되기 때문에 도큐먼트 크기에 제한 받지 않는다.
- 비즈니스 룰 상 별도로 처리되는 데이터 구조에 적합
- 매번 논리적 구조 간에 Link 해야하기 때문에 Embedded보다 성능이 떨어짐
- 컬렉션 개수가 증가하며 관리 비용이 높아짐
Inheritence (OODBMS)
Single Table Inheritence (RDBMS)
Single Table Inheritence (MongoDB)
계층형 데이터 구조
Self Reference Join (RDBMS)
Ancestor Reference (MongoDB)
- 기업에서 발생하는 데이터 구조 중에는 계층형 데이터 구조가 발생할 수 밖에 없는데 이런 경우 적용하면 가장 이상적인 데이터 모델.
- ANCESTORS와 PARENT Field로 표현할 수 있으며 하나의 Document는 하나 이상의 ANCESTORS와 PARENT를 가질 필요는 없다
Vallidator
- RDBMS의 제약조건 역할
- MongoDB v3.2에 추가
db.createCollection("emp", { validator : { $and : [{ empno : {$type :"string"}},
{ deptno : {$in : [10,20,30]}}]}})
db.emp.insert({empno : "1111", ename : "JMJOO", deptno : 10})
db.emp.insert({empno : "1112", ename : "JMJOO", deptno : 20})
db.emp.insert({empno : "1113", ename : "JMJOO", deptno : 30})
db.emp.insert({empno : "1114", ename : "JMJOO", deptno : 40})
ddb.createCollection("emp", { validator : { $and : [{ empno : {$type :"double"}},
{ ename : {$type :"string"}},
{ job : {$type :"string"}},
{ sal : {$type :"double"}},
{ hiredate : {$type : "date"}},
{ deptno : {$type : "double"}},
{ deptno : {$in : [10,20,30]}}]}})
db.emp.insert({empno : 1111, ename : "JMJOO", job : "MANAGER",
sal : 1200, hiredate : ISODate(), deptno : 10 })
db.emp.insert({empno : 2222, ename : "JMJ", job : "MANAGER",
sal : 1200, hiredate : ISODate(), deptno : 40 })
Author And Source
이 문제에 관하여(08-18 Document DB 데이터 모델링), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://velog.io/@ruinak_4127/08-18-Document-DB-데이터-모델링저자 귀속: 원작자 정보가 원작자 URL에 포함되어 있으며 저작권은 원작자 소유입니다.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)