AI에게 CartPole 게임을 즐겼다.

배경

FAQ 봇에 관해서, 「유익한가?」의 질문으로, 여러분의 Yes/No의 응답에 의해, 보다 응답의 정밀도를 올리고 싶다.

강화 학습은 상기를 대응할 수 있을 것 같다. 현재는 그 중 하나의 수법(Deep Q-learning)을 공부중.

입문편은 CartPole이라는 게임을 AI가 배우고 한다.

참고 코드를 DL하고 여러가지 Fuck해 보았다.

어떤 게임

AI 학습의 모습

데모

$ python3 dqn.py

실현 방법

의사 코드


ゲーム状態初期化(state)

    冒険か・推測かを決める

    アクション(action)を選択する

    報酬(reward)及び次の状態(new_state)を入手

    上記の経験を記憶する

    状態を更新（state = new_state）

    記憶した経験から訓練用データを抽出

    学習（推測精度を高めるようパラメータ更新）

    繰り返し（アクション）

繰り返し（ゲーム）

향후 발전

FAQ 봇 개선

게임의 자동 플레이? ?

Usage

$ python3 dqn.py

참고

[1] htp : // f ぅ xml. 아이 / 에 x 페리 멘 ts / 카 rt 포 /

[2] htps : // 메이 m. f 레코데카 mp. 오 rg / an-in t rose c chi-on-re-infu r semen t-u r-n g 4339519 419

[3] htps : // 케온. 이오/데에 p-q-ぇあrニンg/

Reference

이 문제에 관하여(AI에게 CartPole 게임을 즐겼다.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/thunderz99/items/c9f68bc444d25b222773

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다