[서베이] 카글레 - 카르바나 5위 해법 정리

Kaggle - Carvana Image Masking Challenge 1 의 5위 해법 2 의 조사 기사입니다.

Title: LB0.9972 - 5th Place Overview
Name: Kyle Y. Lee
Kaggle Discussion : htps //w w. 꺄gぇ. 코 m / c / 카 r

개발 환경


  • GTX1080Ti : 대회 종료 전에 구입. 1918x1280과 2010x1340에 이용.
  • GTX1080
  • GTX1070 : 추론과 TTA 만

  • 모델




    포럼 2
  • 학습 된 ResNet 50 레이어에서 마스크 데이터 생성 (U-Net이 아님)
  • Optimzier: Adam
  • learning rate: 1e-6

  • 자세한 내용은 아래의 7 가지 모델의 앙상블로 예측.
  • 1918x1280(HQ, TTA6x) [weight=0.2,public LB=0.9970+, private=0.9969]
  • 1918x1280(TTA6x) [weight=0.3,public LB=0.9970+,private=0.9969]
  • 1918x1280(HQ, TTA2x), Fold 2 [weight=0.2,public LB=0.9970+,private=0.9969]
  • 1600x1280(TTA4x) [weight=0.1,LB=0.9969]
  • 2010x1340(TTA2x) [weight=0.1,LB=0.9969]
  • 1280x1280(TTA6x) [weight=0.05,LB=0.9968]
  • 1280x1280(TTA6x, using only dice loss) [weight=0.05,LB=0.9968]

  • 비고: 1918x1280 및 2010x1340은 8GB보다 큰 메모리가 필요

    Augmentation


  • 좌우 반전
  • 회전 (10도)
  • 평행 이동(약 5%)
  • 배율 (10%)
  • TTA를 좌우 반전과 평행 이동으로 6회 실행.

  • 로컬에서 점수
  • 0.9970: 1918x1280
  • 0.9969: 1600x1280 및 2010x130
  • 0.9968: 1280x1280

  • 손실 함수
  • binary cross entropy - log(dice) (dice만 보다 약간 개선)
  • Batch Size: 1

  • 후처리


  • 안테나 부분 보정
  • 주 윤곽에서 일정한 거리에있는 아티팩트 제거
  • 휠 부분이 닫히지 않게 했다.

  • 테스트 데이터 검증



    과 학습하지 않았는지 하기 처리로 시각적으로 테스트 데이터를 확인.
  • 앙상블의 안정성 (예 : 각 모델의 픽셀의 총 값 변동 등).
  • 윤곽의 수 (윤곽이 너무 많으면 잡음이 들어 버린다)
  • 두 번째로 큰 윤곽의 면적

    향후 개선


  • 더 다양한 네트워크에서 앙상블.
  • ResNet 101 층과 152 층을 이용한다. (이번에는 ResNet 50 레이어 사용

  • References





    Kaggle, Carvana Image Masking Challenge , 2017. 

    Kyle Y. Lee, LB0.9972 - 5th Place Overview , 2017. 

    좋은 웹페이지 즐겨찾기