자료『JETSON AGX XAVIER AND THE NEW ERA OF AUTONOMOUS MACHINE』 읽기

목적



자료『JETSON AGX XAVIER AND THE NEW ERA OF AUTONOMOUS MACHINE』을 읽는다.
자료는 다음과 같습니다.
h tp : ///인후아. 응아아. 이 m / rs / 156-오 F-742 / 속눈썹 s / ぇつぉん_아 GX_ゔぃ에 r_네 w_에라_아우토의 이미 s_거야 s. pdf

이 기사의 첫 번째 목적은 위의 문서가 DNN 모델 당 처리량 (GOPS)을 설명하기 때문에 그 양을 참조하는 것입니다.


GOP(Giga Operations)
GOPS(Giga Operations per Second)

DNN의 모델 당 처리량 (GOP)



인용 페이지: VISION NETWORKS Compute Demand


모델
Gop
비고


Image Recognition


MobileNet
0.6
224x224,17GOPS@30Hz

AlexNet
0.7
227x227,22GOPS@30Hz

GoogleNet
2
224x224,60GOPS@30Hz

ResNet-50
4
224x224,120GOPS@30Hz

VGG19
20
224x224,600GOPS@30Hz

Object Detection


YOLO-v3
65
416x416,1,950GOPS@30Hz

SSD-VGG
91
512x512,2,730GOPS@30Hz

Faster-RCNN
172
600x850,5,160GOPS@30Hz


성능



(그림 출처: h tp : ///인후아. 응아아. 이 m / rs / 156-오 F-742 / 속눈썹 s / ぇつぉん_아 GX_ゔぃ에 r_네 w_에라_아우토의 이미 s_거야 s. pdf )


(그림 출처: h tp : ///인후아. 응아아. 이 m / rs / 156-오 F-742 / 속눈썹 s / ぇつぉん_아 GX_ゔぃ에 r_네 w_에라_아우토의 이미 s_거야 s. pdf )



(그림 출처: h tp : ///인후아. 응아아. 코 m / rs / 156 - F-
742/images/Jetson_AGX_Xavier_New_Era_Autonomous_Machines.pdf)



(그림 출처: h tp : ///인후아. 응아아. 이 m / rs / 156-오 F-742 / 속눈썹 s / ぇつぉん_아 GX_ゔぃ에 r_네 w_에라_아우토의 이미 s_거야 s. pdf )



성능 한계값과의 비교



TX2 ResNet-50



그래프보다 눈 분량으로 32batch의 경우 110images로 읽었다.
1 image 로 4 G-op 이므로, 1 초 440 G-op 가 된다.
TX2의 경우, 반정밀도라면, 1.333 TOP이므로, 성능 한계의 1/3 나오게 된다.
단정밀도라면 더 나아가게 된다. 어느 쪽이겠지

요약



DNN의 모델별 처리량(GOPS)을 정리하는 일환으로 NVIDIA의 자료를 확인했다.

미래



적당히, 추기한다.
코멘트 등 있으면 부탁드립니다.

관련(본인)



DNN의 모델별 처리량(GOP) 요약

좋은 웹페이지 즐겨찾기