【그라레코풍 독서 메모】 「데이터 매니지먼트가 30분으로 아는 책」을 읽고

「데이터 매니지먼트가 30분으로 아는 책」이란



『데이터 매니지먼트가 30분으로 아는 책』유자타소과 Haseryo가 프로젝트 관리의 PMBOK 데이터 관리 버전, 입니다.
Kindle 버전과 종이 버전이 있었고 Kindle 버전은 Kindle Unlimited 대상이되었습니다. (2020/7/19 현재)

각 지식체계에 대해 구체적도를 서서히 올리는 구성으로 망라적으로 해설되고 있습니다. 추상적(30초 코스)을 단번에 통독할지, 하나 하나의 항목을 케이스 스터디(3시간 코스)까지 파헤치면서 진행할지는 독자에게 맡겨지고 있습니다.

  • 30초 코스 「한마디로」

  • 3분 코스 「뭐야 그것」

  • 30분 코스 「어째서, 골, 구체적으로 어떻게 한다」

  • 3시간 코스 「케이스 스터디」

  • 저자의 경험에 근거한 해석이 들어있는 덕분에 추상화를 위해 그대로는 읽기 어려워지기 쉬운 지식 체계와 비교하여 실무의 감촉을 느끼면서 읽을 수 있습니다.

    요전날 화제가 되고 있던 유자타소씨의 강연 자료( DMBOK (데이터 관리 지식 체계) )가 계기로, 이 책을 알고, 손에 들었습니다.

    데이터 관리, DMBOK란?



    데이터 관리



    인용합니다.

    데이터 관리는 문자 그대로 데이터를 관리하는 것입니다.

    다만, 일단 「관리」라고 해도 그 내용은 폭넓습니다. 주요 업무로는 데이터를 등록·갱신·신규·활용하는 것을 들 수 있습니다.
    - Data Platform Guide - 비즈니스를 성장시키는 데이터 기반을 만드는 방법 #DataEngineeringStudy / 20200715 - Speaker Deck

    이전에 소개한 데이터 관리란 무엇입니까?이 데이터 활용 단계, 그리고 기계 학습 접근법이라고 하면, 그 전에 두어야 할 데이터 축적, 정비에 필요한 기술, 프로세스 양면이 프레임워크로서 정리되어 있습니다.

    DMBOK



    DMBOK(Data Management Body of Knowledge)는 업무 요건에 부응하여 데이터 관리의 구조를 정하고 지속적으로 개선해 나가기 위해 무엇을 주의해야 하는지를 프레임워크로 정리하여 제시해 준다. 있습니다.
    DMBOK 자체는 이런 모습을 하고 있습니다. 이것을 실례를 포함해 해석해 나가면, 다음과 같이 됩니다.

    메르카리 「기계 학습 시스템의 설계 패턴」

    출처:

    거친 정리



    1회째의 대충 통독입니다만, 자신의 2회째 이후, 나머지 사람과 이야기를 할 때를 위해, 간단한 요약을 만들었습니다.

    DMBOK 포털 | 주식회사 데이터 총연

    이 책에서는 DMBOK의 순서도 정리를 위해 다음과 같이 단계별로 재구성되어 있습니다.

  • 계획
  • 데이터 아키텍처


  • 실장·운용(시스템편)
  • 데이터 저장 및 운영
  • 데이터 통합 ​​및 상호 운용성


  • 실장·운용(로직편)
  • 데이터 모델링 및 디자인
  • 마스터 데이터 관리
  • 문서 및 콘텐츠 관리


  • 신뢰성(안심 실현)
  • 데이터 보안
  • 데이터 품질


  • 신뢰성(편리한 실현)
  • 데이터웨어 하우징 및 비즈니스 인텔리전스
  • 메타데이터 관리


  • 전체 지침 및 규칙
  • 데이터 거버넌스


  • 마지막으로



    이하 함께 흥미를 가져오면 일독을 추천합니다.
  • 『데이터 매니지먼트가 30분으로 아는 책』
  • 좋은 웹페이지 즐겨찾기