unity의 ml-agents GridWorld를 사용해보십시오.

소개



지난주, unit ML-Agents의 tennis 샘플을 시험해 보았다. 이번 주는 다음 샘플 GridWorld도 시도했다.

unity의 ml-agents에서 tensorflow를 사용한 강화 학습을 사용해보십시오.
htps : // m / kz x / / ms / b0614b08 052bd95 df

GridWorld 샘플



무작위로 놓인 장애물을 피하고 목표에 도달하는 것을 배우는 샘플. 디폴트라면 장애물이 하나로, 영역도 5x5로 작기 때문에, 영역을 넓혀 장애물의 수를 늘려 보았다. 변경점은 아래와 같다.
  • unity의 Hierarchy 탭에서 GridAcademy를 ​​선택합니다.
  • Inspector에 표시되는 gridSize의 Value를 10, numObstacles의 Value를 20으로 해 보았다.

  • tensorboard



    일단 훈련은 진행되고 있는 것처럼 보이지만・・・



    학습 결과



    이번 주에는 GridWorld의 샘플을 시도했지만 그리 현명하지 않습니다. 학습이 잘 진행되지 않은 것 같다. reinforcement learning by unity ml-agents, GridWorld example htps // t. 코 / PjTSYKSZCD via @YouTube — Kazutoshi Nakano (@kznx) February 3, 2018


    마지막으로



    조금 더 하이퍼 파라미터를 조정하지 않으면 학습이 진행되지 않고 현명해지지 않는 것 같다.


    좋은 웹페이지 즐겨찾기