데이터 카탈로그 사용(분류 기본편)

분류란?



분류는 간단히 말하면 카탈로그에 등록하는 데이터 자산에 라벨링하는 기능입니다. 겉보기에는 태그와 매우 비슷하지만 태그는 자유로운 의미를 부여하고 사용하는 것에 대해 분류는 주로 기밀 수준(Restricted,Confidential 등), 비즈니스 중요도(Critical,Important) )나 개인정보의 기미성 등을 표현하는데 사용됩니다. 예를 들면 다음과 같은 분류입니다.

기밀 레벨


  • 극비
  • 부외비
  • 사외 비밀

  • 비즈니스 심각도


  • 가장 중요한
  • 중요
  • 유용한

  • 데이터 카탈로그의 제품에 따라 기본적으로 미리 설정되어 있습니다. 예를 들어, Cloud Pak for Data(CP4D)의 Watson Knowledge Catalog(WKC)에서는 다음과 같은 분류가 미리 정의되어 있습니다.

    Personally Identifiable Information 개인을 식별할 수 있는 정보(PII)는 특정 개인을 식별할 수 있는 모든 데이터로 정의됩니다. 한 개인과 다른 개인을 구별하는 데 사용할 수 있는 모든 정보는 PII로 간주됩니다.
    Sensitive Personal Information 민감한 개인 데이터는 인종 또는 민족적 출자, 정치적 의견, 종교적 신조 또는 기타 유사한 성질의 신조, 노동 조합 가입, 신체적 또는 정신적 건강 상태 또는 상태 , 성생활 또는 개인의 범죄력 또는 범죄 용의력에 대한 정보로 구성된 개인 데이터로 정의됩니다.
    Confidential 민감한 데이터란 어떤 형태로 위태롭게 되면 해당 데이터가 속한 기관 및/또는 개인에게 심각하고/또는 장기적인 위험을 초래할 수 있는 데이터를 의미합니다.

    새로운 분류를 만드는 방법



    이 섹션에서는 IBM Cloud Pak for Data(CP4D)의 Watson Knowledge Catalog(WKC)를 예로 들어 새로운 분류를 작성하는 방법을 소개합니다.
    CP4D에 로그인한 직후의 화면입니다.

    왼쪽 상단의 메뉴 버튼을 눌러 거버넌스 -> 분류를 선택합니다.

    오른쪽 상단의 새 분류 -> 새 분류 만들기를 누릅니다. 덧붙여 이번은 소개하지 않습니다만, 분류의 파일 임포트도 대응하고 있습니다.

    분류 이름과 분류가 속한 카테고리를 선택합니다. 또한 분류의 정의를 작성하고 초안으로 저장을 선택합니다.

    분류가 초안으로 저장되었습니다. CP4D의 WKC는 분류가 공개 및 초안 상태에서 관리됩니다. 초안 상태인 경우 사용자에게는 보이지 않는 상태가 됩니다.
    분류는 1차 카테고리로서 메인 카테고리 이외에 여러 카테고리에 2차 카테고리로 저장할 수 있습니다.
    이 외에도 상위 분류와 종속 분류를 설정할 수 있습니다. 여기에서는 공백으로 둡니다.

    필요한 정보를 설정한 후 오른쪽 상단의 공개 버튼을 누릅니다.


    댓글을 남기고 게시할 버튼을 누르면 분류가 초안 상태에서 게시되었습니다.

    기본 설정에서는 게시 버튼을 누르면 그대로 게시되지만 CP4D의 WKC 워크플로 기능을 이용하면 적절한 승인 프로세스를 거쳐 분류를 게시하는 흐름을 만들 수 있습니다. 합니다.

    이상으로 분류를 작성했습니다.

    좋은 웹페이지 즐겨찾기