WEKA 사용법

WEKA란?



기계 학습 통합 환경 Weka 및 벤치 마크 데이터 - 야마모토 연구소

무료 기계 학습 통합 환경
- 연구, 교육, 실무 등 폭넓은 이용이 가능
- 데이터 전처리, 다양한 학습 알고리즘 및 평가 기법을 이해할 수 있습니다.
- 데이터 시각화와 같은 GUI를 갖추고 있습니다.

그렇습니다.
처음으로 기계 학습에 접하기에는 빠른 방법입니다.
직접 가져온 데이터를 다양한 기계 학습 알고리즘으로 분류 할 수 있습니다.

설치



아래 링크에서 자신의 OS에 맞게 다운로드
Weka 3



분류할 데이터 준비



WEKA는 자신이 준비한 데이터를 읽고 분류할 수 있습니다.
이 때 arff라는 형식이어야합니다.

test.arff
@relation keyboard

@attribute time real
@attribute speed real
@attribute angle real
@attribute curve real
@attribute emotion {sad, happy}

@data
1,0.1,46,1.81,sad
2,0.6,187,4.7,happy

@relation [문자열]



keyboard는 데이터 세트의 이름입니다.
원하는대로 설정합니다.

@attribute [속성 이름] [속성 유형]



속성의 이름과 속성의 형태를 기술합니다.
속성의 유형은 데이터가 숫자이면 real.
그렇지 않으면 {}로 묶습니다.
또한 분류하고 싶은 것을 마지막으로 설명합니다.

@data



그 이후에 자신의 데이터를 입력합니다.
자신이 기술한 속성 데이터에 맞추어 기술합니다.
이번에는 time, speed, angle, curve, emotion의 값이 한 줄에 들어갑니다.

결정 트리에서 기계 학습


  • Explorer를 엽니다.
  • Open file에서 방금 만든 test.arff를 선택
  • Classify 탭 선택
  • Choose에서 weka>classifiers>trees>J48을 선택

  • Test option에서 어떤 검정을 할지 설정할 수 있습니다. 디폴트라면 10분할 교차 검정.
  • Test option 아래에 표시되는 것이 분류되는 대상의 데이터가 됩니다.
    test.arff의 속성의 마지막 줄에 설명 된 것을 볼 수 있지만 탭하여 변경할 수도 있습니다.
  • Start 버튼을 누르면!

  • Summary의 Correctly Classified Instances에 작성된 것이 분류 정밀도입니다.
    이번이라면 79.1683%입니다.



    요약



    WEKA를 처음 사용할 때 참고가 되시면 감사하겠습니다.
    Classifier를 선택할 때 다른 것을 선택하는 것만으로 SVM이나 Random Forest 등도 간단하게 할 수 있습니다.

    좋은 웹페이지 즐겨찾기