AWS DeepRacer를 힘과 기세로 달려 보았습니다.
AWS DeepRacer를 힘과 기세로 달려 보았습니다.
전치
우선 평가 함수 (동
def reward_function(params):
# 入力パラメータを読む
track_width = params['track_width']
distance_from_center = params['distance_from_center']
# トラック幅から3区画幅を計算
marker_1 = 0.1 * track_width
marker_2 = 0.25 * track_width
marker_3 = 0.5 * track_width
# 中央線との距離に応じた報酬を設定
if distance_from_center <= marker_1:
reward = 1.0
elif distance_from_center <= marker_2:
reward = 0.5
elif distance_from_center <= marker_3:
reward = 0.1
else:
reward = 1e-3 # クラッシュ/オフトラックに近い
speed = params['speed'] / 5.0
steeringStatus = params['steering_angle']
steeringVal = 1.0 if steeringStatus==0.0 else 0.75
reward *= (speed * steeringVal)
return float(reward)
파라미터 정보
내용의 명기는 피합니다만, 스티어링의 각도를 와자와 얕게 설정하고 있습니다.
속도는 처음이었기 때문에 변조 설정을 채용 (베타 밟아도 좋았다)
학습 결과
4시간 학습한 결과가 이쪽이 됩니다(봉○분 쿠킹
지와 오르지만 곳곳에서 급강하하고 있기 때문에 평가식을 재검토해야 할 것입니다. . .
(무슨 일인지 와카라나이 에로 사람 가르쳐줘)
주행 결과
완주할 수는 있었지만, 여하한 속도가 극복되지 않은 것 같아서 느립니다.
요약
DeepRacer 재미 (이것 소중)
다른 사람도 쓰여 있다고 생각합니다만, 파라미터등의 자료는 공식 문서를 참조하는 것이 좋다.
참고
Train and Evaluate AWS DeepRacer Models Using the AWS DeepRacer Console - AWS DeepRacer
htps : // / cs. 아 ws. 아마존. 이 m / 데에 p 라세 r / ㅁ st /에서 ゔ ぉ ぺ r 굉장히 / 에에 p 라 r こんそぇ t ら ー え ゔ ぅ 아테도 LS. HTML
AWS DeepRacer 강화 보상 함수 구현 패턴 저것 | DevelopersIO
htps : //에서 v.ぁsss d. jp / 마치 네 - r r g / 아 ws - 에 p 라 r 빠 r r- r-re rd 훈 c chion /
AWS DeepRacer에서 보상 함수를 구현해 보았습니다.
htps : // 코 m / 카이 _ 코 / MS / 8 A 45c687 바보 8c9465f6
Reference
이 문제에 관하여(AWS DeepRacer를 힘과 기세로 달려 보았습니다.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/BlackEllis/items/cac620ab779cdfa8bf65텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)