Dataiku의 variables를 사용해 보십시오.

사건 등에서 Dataiku를 정식으로 사용할 때 피할 수 없는 variables를 소개한다.
참조 사이트: https://academy.dataiku.com/variables-101/608267
이른바 variables
Dataiku의 흐름과 시나리오, python 레시피와 R 레시피 등에 사용되는 변수다.
Applications와 시나리오를 결합하면 Dataiku가 할 수 있는 일의 범위가 크게 넓어진다.
variables의 정의
항목 상단의 메뉴에서 Variables로 화면을 설정할 수 있습니다.

위의 Variables 를 클릭하면 Project variables 설정 화면이 표시됩니다.

프로젝트 variables는 글로벌 variables와 Local varialbes 두 종류로 나뉘는데 모두 프로젝트 고유의 변수다.다음과 같은 차이가 있다.
  • Local variables에 정의된 변수는 인스턴스 고유입니다.Design node에서 Automation node로 설계된 번들에는 포함되지 않습니다.
  • Global variables는 Automation node를 분해 처리하는 번들에 포함될 수 있습니다.
  • 실제 운용에 사용되는 variables를 글로벌 variables로 설정해야 한다는 것이다.
    variables 해볼게요.
    Visual recipe에서 variables를 간단하게 시도해 보십시오.
    프로젝트 가져오기
    [+New PROJECT] [DSS tutorials][Advanced Designer] [Dataiku Applications(Tutorial)]에서 Tutorial용 항목을 가져옵니다.

    절차는 다음과 같다.원래는 Application이라는 다른 기능의 설명을 빌려서 Tutorial로 사용했다.이번에 사용한 것은 그중의 일부분이다.

    처음에 Build 프로세스가 없었기 때문에 먼저 Build 프로세스를 실행합니다.
    오른쪽 버튼으로 맨 왼쪽에 있는 주황색 동그라미(레시피 다운로드)를 클릭하고 [Build Flowoutputs reachable from here]를 클릭합니다.

    기본적으로 Build required dependencies가 지정되어 있으므로 [BUILD]를 직접 누릅니다.

    만약 첫 번째 다운로드가 네트워크 문제로 순조롭게 진행되지 못한다면 아래 내용을 수동으로 다운로드하십시오.
    https://archive.ics.uci.edu/ml/machine-learning-databases/00502/online_retail_II.xlsx
    이번에는 한번 해 보자.
    흐름의 오른쪽 하단과 빨간 상자 부분에 처리를 추가합니다.

    items 데이터 세트에서 "Customer ID"열을 확인할 수 있습니다.
    각 상품의 구매 고객 ID가 기재된 것 같습니다.
    items 데이터 세트의 다음 필터 레시피에서 Customer ID는 13758의 고객 데이터 세트만을 대상으로 합니다.

    실제로 itemsof_one_customer 데이터 집합의 Customer ID 열을 보면 고객 ID는 모두 13758이다.
    이 하드코딩된 13758에 대해variables를 설정합니다.
    variables 설정 및 실행
    시작 부분에 나타나는 Project variables 화면에서 Local varialbes를 다음과 같이 설정합니다.겸사겸사 제이슨 형식입니다.

    아까 필터 메뉴 13758과 하드 인코딩된 부분을 '${customer id}' 로 바꾸고 오른쪽 상단에 있는 [SAVE] 를 누르십시오

    이렇게 하면 RUN 단추를 누르면 프로젝트 variables의customer를 실현할 수 있습니다ID에 설정된 고객 ID 데이터만 추출하는 레시피입니다.
    15362로 설정해 보세요.

    필터 레시피를 실행하면 다음itemsof_one_customer 데이터 세트의 Customer ID는 15362입니다.

    총결산
    Dataiku DSS의 variables 설정 방법에 대한 기본적인 시도는 해봤습니다.
    이번에는 비주얼 리cipe에서 사용했습니다. 이것은 psyhon 코드, 대본, Applications, 웹 앱과 조합하여 사용한 것으로 매우 실제적으로 활용할 때 뒤집을 수 있는 기능입니다.
    그중에서도 Application과 코드의variables에 대한 방법은 시간이 있으면 정리해 보려고 합니다.

    좋은 웹페이지 즐겨찾기