AWS DeepRacer를 힘과 기세로 달려 보았습니다.

5055 단어 강화 학습 DeepRacer AWS

AWS DeepRacer를 힘과 기세로 달려 보았습니다.

전치

김과 기세만으로 평가 함수를 작성하고 있기 때문에, 별로 도움이되지 않을지도 모른다

잡히지 않기 때문에 싱크대를 추천합니다 (오이

우선 평가 함수 (동

def reward_function(params):
    # 入力パラメータを読む
    track_width = params['track_width']
    distance_from_center = params['distance_from_center']

    # トラック幅から3区画幅を計算
    marker_1 = 0.1 * track_width
    marker_2 = 0.25 * track_width
    marker_3 = 0.5 * track_width

    # 中央線との距離に応じた報酬を設定
    if distance_from_center <= marker_1:
        reward = 1.0
    elif distance_from_center <= marker_2:
        reward = 0.5
    elif distance_from_center <= marker_3:
        reward = 0.1
    else:
        reward = 1e-3  # クラッシュ/オフトラックに近い

    speed = params['speed'] / 5.0
    steeringStatus = params['steering_angle']
    steeringVal = 1.0 if steeringStatus==0.0 else 0.75

    reward *= (speed * steeringVal)
    return float(reward)

파라미터 정보

내용의 명기는 피합니다만, 스티어링의 각도를 와자와 얕게 설정하고 있습니다.
속도는 처음이었기 때문에 변조 설정을 채용 (베타 밟아도 좋았다)

학습 결과

4시간 학습한 결과가 이쪽이 됩니다(봉○분 쿠킹

지와 오르지만 곳곳에서 급강하하고 있기 때문에 평가식을 재검토해야 할 것입니다. . .
(무슨 일인지 와카라나이 에로 사람 가르쳐줘)

주행 결과

완주할 수는 있었지만, 여하한 속도가 극복되지 않은 것 같아서 느립니다.

요약

DeepRacer 재미 (이것 소중)
다른 사람도 쓰여 있다고 생각합니다만, 파라미터등의 자료는 공식 문서를 참조하는 것이 좋다.

참고

Train and Evaluate AWS DeepRacer Models Using the AWS DeepRacer Console - AWS DeepRacer
htps : // / cs. 아 ws. 아마존. 이 m / 데에 p 라세 r / ㅁ st /에서 ゔぉぺ r 굉장히 / 에에 p 라 r こんそぇ t らーえゔぅ 아테도 LS. HTML

AWS DeepRacer 강화 보상 함수 구현 패턴 저것 | DevelopersIO
htps : //에서 v.ぁsss d. jp / 마치 네 - r r g / 아 ws - 에 p 라 r 빠 r r- r-re rd 훈 c chion /

AWS DeepRacer에서 보상 함수를 구현해 보았습니다.
htps : // 코 m / 카이 _ 코 / MS / 8 A 45c687 바보 8c9465f6

Reference

이 문제에 관하여(AWS DeepRacer를 힘과 기세로 달려 보았습니다.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/BlackEllis/items/cac620ab779cdfa8bf65

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

Epsilon-Greedy 법으로 만족도가 높은 레스토랑을 찾는 방법을 생각해 보았습니다.

심층 강화 학습 프레임 워크 machina를 사용해 보았습니다.

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다