unity의 ml-agents GridWorld를 사용해보십시오.
1536 단어 TensorFlow강화 학습ML-AgentsUnity
소개
지난주, unit ML-Agents의 tennis 샘플을 시험해 보았다. 이번 주는 다음 샘플 GridWorld도 시도했다.
unity의 ml-agents에서 tensorflow를 사용한 강화 학습을 사용해보십시오.
htps : // m / kz x / / ms / b0614b08 052bd95 df
GridWorld 샘플
무작위로 놓인 장애물을 피하고 목표에 도달하는 것을 배우는 샘플. 디폴트라면 장애물이 하나로, 영역도 5x5로 작기 때문에, 영역을 넓혀 장애물의 수를 늘려 보았다. 변경점은 아래와 같다.
무작위로 놓인 장애물을 피하고 목표에 도달하는 것을 배우는 샘플. 디폴트라면 장애물이 하나로, 영역도 5x5로 작기 때문에, 영역을 넓혀 장애물의 수를 늘려 보았다. 변경점은 아래와 같다.
tensorboard
일단 훈련은 진행되고 있는 것처럼 보이지만・・・
학습 결과
이번 주에는 GridWorld의 샘플을 시도했지만 그리 현명하지 않습니다. 학습이 잘 진행되지 않은 것 같다. reinforcement learning by unity ml-agents, GridWorld example htps // t. 코 / PjTSYKSZCD via @YouTube — Kazutoshi Nakano (@kznx) February 3, 2018
마지막으로
이번 주에는 GridWorld의 샘플을 시도했지만 그리 현명하지 않습니다. 학습이 잘 진행되지 않은 것 같다. reinforcement learning by unity ml-agents, GridWorld example htps // t. 코 / PjTSYKSZCD via @YouTube — Kazutoshi Nakano (@kznx) February 3, 2018
마지막으로
조금 더 하이퍼 파라미터를 조정하지 않으면 학습이 진행되지 않고 현명해지지 않는 것 같다.
Reference
이 문제에 관하여(unity의 ml-agents GridWorld를 사용해보십시오.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/kznx/items/b37c044e31ac7d3ae0aa텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)