머신러닝 야학 4일차
🤖 강화 학습
- 강화 학습(reinforcement learning)
- 일단 해보는 것
- 경험을 통해 실력을 키워나가는 것
- 행동의 결과가 유리한 것이었다면 상을 받는다
- 행동의 결과가 불리한 것이었다면 벌을 받는다
- 위 과정을 매우 많이 반복하면 더 많은 보상을 받을 수 있는 더 좋은 답을 찾아낼 수 있다
- 더 많은 보상을 받을 수 있는 정책을 만드는 것
- 경험을 통해 점점 더 똑똑해지는 기계
- 알파고, 자율주행 자동차
- 게임의 실력자가 되는 과정
- 게임은 게이머에게 현재 상태를 보여준다
- 캐릭터의 위치와 장애물의 위치, 현재의 점수
- 점수가 높아지는 것은 상
- 장애물에 부딪혀 목숨을 잃는 것은 벌
- 관찰의 결과에 따라 어떤 상태에서 어떻게 행동해야 더 많은 상을 받고 더 적은 벌을 받을 수 있는지 알게 된다
- 판단력의 강화
- 판단에 따라 다음 행동을 한다
- 행동은 게임에 변화를 준다
- 게임은 게이머에게 현재 상태를 보여준다
- 게임과 머신러닝
- 게임 >> 환경(Environment)
- 게이머 >> 에이전트(Agent)
- 게임 화면 >> 상태(State)
- 게이머의 조작 >> 행동(Action)
- 상과 벌 >> 보상(Reward)
- 게이머의 판단력 >> 정책(Policy)
- 스스로 수련을 통해서 더 좋은 선택을 하는 기능이 필요하다면 강화 학습을 선택
- 강화 학습을 통해서 할 수 있는 일
🤖 나에게 필요한 머신러닝은?
- 머신러닝 지도
- 레모네이드 카페 사례(회귀)
- 과거의 데이터를 가지고 있다
- 가지고 있는 데이터가 많다
- 추측하고 싶은 미지의 종속 변수가 있다
미지의 종속 변수가 범주형 데이터다- 미지의 종속 변수가 양적 데이터다
- 알파고(강화 학습)
과거의 데이터를 가지고 있다- 보상을 되돌려주는 환경이 있다
- 장바구니 분석(연관 규칙 학습)
- 과거의 데이터를 가지고 있다
- 가지고 있는 데이터가 많다
- 추측하고 싶은 미지의 종속 변수가 있다
비슷한 관측치를 그룹핑하고 싶다- 특성 사이의 상관 관계를 찾고 싶다
🍊 Orange3
오리엔테이션
- Orange3
- 드래그 앤 드롭 방식 활용
- 표의 분석, 시각화, 머신러닝 가능
- 통계, 데이터 마이닝, 데이터 과학 분야에 활용
- 표를 다루는 도구
시나리오와 전략
- Orange에서 할 수 있는 것
- 데이터 표에 익숙해지기
- 원하는 행을 검색
- 원하지 않는 열 감추기
- 열의 값을 계산 >> 새로운 행을 동적으로 만들기
- 표의 시각화
- 좌표 평면
- 그래프
- 머신러닝
- 현재에 대한 결정
- 미래 예측
- 데이터 표에 익숙해지기
설치
- Orange3 다운로드 페이지 접속
Download Orange
클릭- 오류를 방지하려면 설치 경로에 한글이 없어야 한다
- 사용자 계정이 한글이면 C드라이브에 orange 폴더 생성하고 해당 경로에 설치하기
- Orange3 실행
출처: 생활코딩 - 머신러닝 야학
Author And Source
이 문제에 관하여(머신러닝 야학 4일차), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://velog.io/@tataki26/머신러닝-야학저자 귀속: 원작자 정보가 원작자 URL에 포함되어 있으며 저작권은 원작자 소유입니다.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)