AWS DeepRacer를 힘과 기세로 달려 보았습니다.

AWS DeepRacer를 힘과 기세로 달려 보았습니다.



전치


  • 김과 기세만으로 평가 함수를 작성하고 있기 때문에, 별로 도움이되지 않을지도 모른다
  • 잡히지 않기 때문에 싱크대를 추천합니다 (오이

  • 우선 평가 함수 (동


    def reward_function(params):
        # 入力パラメータを読む
        track_width = params['track_width']
        distance_from_center = params['distance_from_center']
    
        # トラック幅から3区画幅を計算
        marker_1 = 0.1 * track_width
        marker_2 = 0.25 * track_width
        marker_3 = 0.5 * track_width
    
        # 中央線との距離に応じた報酬を設定
        if distance_from_center <= marker_1:
            reward = 1.0
        elif distance_from_center <= marker_2:
            reward = 0.5
        elif distance_from_center <= marker_3:
            reward = 0.1
        else:
            reward = 1e-3  # クラッシュ/オフトラックに近い
    
        speed = params['speed'] / 5.0
        steeringStatus = params['steering_angle']
        steeringVal = 1.0 if steeringStatus==0.0 else 0.75
    
        reward *= (speed * steeringVal)
        return float(reward)
    

    파라미터 정보



    내용의 명기는 피합니다만, 스티어링의 각도를 와자와 얕게 설정하고 있습니다.
    속도는 처음이었기 때문에 변조 설정을 채용 (베타 밟아도 좋았다)

    학습 결과



    4시간 학습한 결과가 이쪽이 됩니다(봉○분 쿠킹


    지와 오르지만 곳곳에서 급강하하고 있기 때문에 평가식을 재검토해야 할 것입니다. . .
    (무슨 일인지 와카라나이 에로 사람 가르쳐줘)

    주행 결과



    완주할 수는 있었지만, 여하한 속도가 극복되지 않은 것 같아서 느립니다.



    요약



    DeepRacer 재미 (이것 소중)
    다른 사람도 쓰여 있다고 생각합니다만, 파라미터등의 자료는 공식 문서를 참조하는 것이 좋다.

    참고



    Train and Evaluate AWS DeepRacer Models Using the AWS DeepRacer Console - AWS DeepRacer
    htps : // / cs. 아 ws. 아마존. 이 m / 데에 p 라세 r / ㅁ st /에서 ゔ ぉ ぺ r 굉장히 / 에에 p 라 r こんそぇ t ら ー え ゔ ぅ 아테도 LS. HTML

    AWS DeepRacer 강화 보상 함수 구현 패턴 저것 | DevelopersIO
    htps : //에서 v.ぁsss d. jp / 마치 네 - r r g / 아 ws - 에 p 라 r 빠 r r- r-re rd 훈 c chion /

    AWS DeepRacer에서 보상 함수를 구현해 보았습니다.
    htps : // 코 m / 카이 _ 코 / MS / 8 A 45c687 바보 8c9465f6

    좋은 웹페이지 즐겨찾기