머신러닝 야학 4일차

🤖 강화 학습

  • 강화 학습(reinforcement learning)
    • 일단 해보는 것
    • 경험을 통해 실력을 키워나가는 것
    • 행동의 결과가 유리한 것이었다면 상을 받는다
    • 행동의 결과가 불리한 것이었다면 벌을 받는다
    • 위 과정을 매우 많이 반복하면 더 많은 보상을 받을 수 있는 더 좋은 답을 찾아낼 수 있다
    • 더 많은 보상을 받을 수 있는 정책을 만드는 것
    • 경험을 통해 점점 더 똑똑해지는 기계
    • 알파고, 자율주행 자동차
  • 게임의 실력자가 되는 과정
    • 게임은 게이머에게 현재 상태를 보여준다
      • 캐릭터의 위치와 장애물의 위치, 현재의 점수
      • 점수가 높아지는 것은 상
      • 장애물에 부딪혀 목숨을 잃는 것은 벌
    • 관찰의 결과에 따라 어떤 상태에서 어떻게 행동해야 더 많은 상을 받고 더 적은 벌을 받을 수 있는지 알게 된다
      • 판단력의 강화
    • 판단에 따라 다음 행동을 한다
    • 행동은 게임에 변화를 준다
  • 게임과 머신러닝
    • 게임 >> 환경(Environment)
    • 게이머 >> 에이전트(Agent)
    • 게임 화면 >> 상태(State)
    • 게이머의 조작 >> 행동(Action)
    • 상과 벌 >> 보상(Reward)
    • 게이머의 판단력 >> 정책(Policy)
  • 스스로 수련을 통해서 더 좋은 선택을 하는 기능이 필요하다면 강화 학습을 선택

🤖 나에게 필요한 머신러닝은?

  • 머신러닝 지도
  • 레모네이드 카페 사례(회귀)
    • 과거의 데이터를 가지고 있다
    • 가지고 있는 데이터가 많다
    • 추측하고 싶은 미지의 종속 변수가 있다
    • 미지의 종속 변수가 범주형 데이터다
    • 미지의 종속 변수가 양적 데이터다
  • 알파고(강화 학습)
    • 과거의 데이터를 가지고 있다
    • 보상을 되돌려주는 환경이 있다
  • 장바구니 분석(연관 규칙 학습)
    • 과거의 데이터를 가지고 있다
    • 가지고 있는 데이터가 많다
    • 추측하고 싶은 미지의 종속 변수가 있다
    • 비슷한 관측치를 그룹핑하고 싶다
    • 특성 사이의 상관 관계를 찾고 싶다

🍊 Orange3

오리엔테이션

  • Orange3
    • 드래그 앤 드롭 방식 활용
    • 표의 분석, 시각화, 머신러닝 가능
    • 통계, 데이터 마이닝, 데이터 과학 분야에 활용
    • 표를 다루는 도구

시나리오와 전략

  • Orange에서 할 수 있는 것
    • 데이터 표에 익숙해지기
      • 원하는 행을 검색
      • 원하지 않는 열 감추기
      • 열의 값을 계산 >> 새로운 행을 동적으로 만들기
    • 표의 시각화
      • 좌표 평면
      • 그래프
    • 머신러닝
      • 현재에 대한 결정
      • 미래 예측

설치

  • Orange3 다운로드 페이지 접속
  • Download Orange 클릭
  • 오류를 방지하려면 설치 경로에 한글이 없어야 한다
    • 사용자 계정이 한글이면 C드라이브에 orange 폴더 생성하고 해당 경로에 설치하기
  • Orange3 실행
출처: 생활코딩 - 머신러닝 야학 

좋은 웹페이지 즐겨찾기