Juria OpenAI Gym에서

5410 단어 JuliaGym

OpenAI Gym


OpenAI Gym는 학습 환경을 강화하는 틀을 제공하고 파이톤에 제공한다.
샘플 프로그램은 다음과 같은 느낌입니다.환경은 CartPole-v1에 지정되어 있습니다.이런 상황에서 이른바 물구나무 진자다.
import gym
env = gym.make("CartPole-v1")
observation = env.reset()
for _ in range(1000):
  env.render()
  action = env.action_space.sample() # your agent here (this takes random actions)
  observation, reward, done, info = env.step(action)

  if done:
    observation = env.reset()
env.close()
이 작업을 수행하면 다음 그림과 애니메이션이 표시됩니다.이 예env.action_space.sample()에서 확정action.원래 이 부분에서 학습 생성과 상태에 대응하는action.

OpenAI Gym을 설치하려면 OpenGL을 설치해야 하기 때문에 상당히 번거롭다.

PyCall


Gym뿐만 아니라 Python의 라이브러리도 Juria에서 사용할 수 있습니다.그거 사용PyCall.
패키지의 설치는 여느 때와 마찬가지로 패키지 관리자add로 할 수 있지만 이 패키지의 경우 환경 변수에 사용할 파이톤 해석기를 미리 지정하는 것이 중요하다.기본적으로 줄리아는 콘다 내의 파이톤을 스스로 맡아서 귀찮아요.
julia> ENV["PYTHON"]="/Users/nakada/.pyenv/shims/python"
일단 놔두고.
(@v1.6) pkg> add PyCall
그럼 됐어.시간이 오래 걸리다.설치 후 해석기를 다시 시작하라고 문서에 적혀 있다.

Juria OpenAI Gym에서


설치한 후 의외로 간단합니다. 아래 코드로 이동할 수 있습니다.
gym = pyimport("gym")

env = gym.make("CartPole-v1")
observation = env.reset()
for _ in 1:1000
    env.render()
    action = env.action_space.sample()
    observation, reward, done, info = env.step(action)

    if done 
        observation = env.reset()
    end
end
env.close()
Python처럼 보이는 문법은 사실 Juria의 코드입니다.위의 코드와 비교하면 기본적으로 원형이라는 것을 알 수 있다.잘했다.

문제점

  • 좀 느려요.파이톤으로 실행하면 무작위 제어로 눈 깜짝할 사이에 실패했지만 무슨 이유에서인지 실패하지 않은 것처럼 보였다.디스플레이가 너무 느려서 초기 상태만 보일 수도 있어요.
  • 창문이 닫히지 않습니다.제대로 멈추지 못한 것 같아.
  • 어쨌든 움직일 거면 움직일 거니까 많이 해봤어요.

    좋은 웹페이지 즐겨찾기