단일 부트 컴퓨터의 단일 Shot Multi Box Detector Inference 성능 비교

개요


SBC(Single Board Computer)이기 때문에 Deep Learning이라도 훈련된 성능이 아니라 주로 Inference(추정)의 속도에 신경을 쓴다.가능한 한 실제 이벤트 근처에서 색인을 실행하기를 원할 수도 있습니다.그러나 Deep Learning의 경우 모델이 매우 커서 메모리와 CPU의 속도가 필요하다.나는 가능한 한 조정을 해서 Inference의 속도를 비교해 보았다.
XNET에서 구현된 SSD(Single Shut Mutibox Detector)입니다.
다음 항목에서 클론을 생성하고 구성합니다.
https://githhub.com/zreshold/mxnet-ssd
단계 참조여기
또한 SBC는 Ubuntu를 구성했습니다.(beagle born black은 Ubuntu 14.04이고 나머지는 16.04에 해당)
SBC
CPU
Memory
Raspberry Pi3
ARM Cortex-A53 1.2GHz 4Core
1GB
pcDuino4
ARM Cortex-A7 1.5GHz 4Core
1GB
PINE64+
ARM Cortex-A53 1.2GHz 4Core
2GB
Beagle Born Black
ARM Cortex-A8 1.0GHz 1Core
512MB
odroid XU4
ARM Coretex-A15/A7 4Core/4Core
2GB

(왼쪽 위쪽은 Raspberry Pi3pcDuino4PINE64 Beagle Born Black)

평가 및 비교


XNET에서 구현된 SSD는 Openblas를 사용하는 것이 가장 빠릅니다.결과에 따라 다음과 같은 매개 변수로 구축한다.
config.나는 mk에서 아래는 다음과 같은 내용이라고 생각한다.USE_OPENMP = 1표준은atlas를 선형 계산 라이브러리로 사용하지만,openblas로 변경합니다.
UNAME_S := $(shell uname -s)
ifeq ($(UNAME_S), Darwin)
USE_BLAS = apple
else
USE_BLAS = openblas
endif
나는 표준에 설치되지 않았다고 생각하기 때문에 문장의 절차 외에 다음과 같은 내용을 구성할 것이다.sudo apt-get install libopenblas-dev `
demo.py를 사용하여 몇 번 실행하면 평균 실행 시간은 다음과 같다.beagle born black은 규격상 무리인 것 같습니다. Swap 구역을 확대하지 않으면 동작할 수 없습니다.SBC는 아니지만 Intel의 Compute Stick을 비교하기 위한 실행 결과도 제시됩니다.

SBC
운행 시간
Raspberry Pi3
14s
pcDuino4
34s
PINE64+
8s
Beagle Born Black
180s
odroid XU4
12s
Intel Compute Stick(CSTK-32W)
8s
카탈로그 규격상 라즈베리 Pi3와 차이가 많지 않을 것 같은 Pine64가 가장 고속이다.운영체제의 64비트화는 매우 클 수 있다.
odroid-XU4는 8Core로 규격상 가장 유리하지만 비대칭으로 인해 거의 라즈베리 파이와 같은 실행 시간일 수 있습니다.
애니메이션 처리는 불가능하지만 10초 정도 처리가 끝나면 정지 화면의 감시 용도 등이다.사용할 수 있는 분야도 있다.
또한 한 대가 상당히 싸기 때문에 Edge를 설정하고 최소한의 처리를 하는 방향에서 사용할 수 있다.

좋은 웹페이지 즐겨찾기