데이터 분석가 - Week13

1297 단어
SAS 기술
  • 중국어 txt 데이터 세트 가져오기
  • *endocing                  ;
    filename my_file "/Users/PyProjects/kaggle/titanic.txt" encoding="utf-8";
    
    *procedure            ,            ;
    proc import datafile=my_file out=my_data(rename=(varo=id) keep=var0 -- var2) 
      replace dbms=dlm;
      delimiter="|";
      getnames=yes;
      guessingrows=23333;
    run;
    
  • 큰 시계를 분리하여 처리하여 서버의 자원 소모를 줄인다.
  •                  ,                。
                      ,                     。
      ,              ,        ,        。
    
    %macro test();
      %do i=2016 to 2018;
        %do j=1 to 12;
          %let yyyymm=i*100+j;
          %if &yyyymm.<=201801 and &yyyymm.>=201609 %then %do; *           ;
            data events_&yyyymm.;
              set lib.events_&yyyymm.(keep=var0--var10);
              length ratio 8.;
              if var10 ^= 0 then ratio=var9/var10;
              else ratio=.;
            run;
            
            proc sql noprint;
              create events_temp_&yyyymm. as 
              select *
              from events_&yyyymm.
              where var0 in (select id from lib.test); * lib.test  ,       merge;
            quit;
          %end;
        %end;
      %end;
    
      data events_all;
        set events_temp_:; *           ;
      run;
    %mend test;
    

    좋은 웹페이지 즐겨찾기