FPGA 보드 Ultra96에 대해 조사 중
4537 단어 FPGAultra96DeepLearningYOLO심층 학습
에 다음 기사가 있습니다.
【제3부 최강 FPGA 보드로 인공 지능 바삭바삭 화상 인식】
64비트 Cortex-A/GPU/FPGA 칩 탑재로 3만엔
제 1 장 임베디드 인공 지능에 딱! 최강 Arm FPGA 보드 "Ultra96"
개발 환경 준비부터 Linux&My 회로 생성까지
제 2 장 최강 Arm 코어 FPGA 보드 Ultra96의 기본 사용법
Youtube 【최강 FPGA 보드】Ultra96 보드로 YOLO를 고속화
Youtube 【최강 FPGA 보드】Ultra96 보드를 사용한 인베이더 게임
Youtube 【Ultra96 보드의 신AI】 DeePhi 소개
SlideShare Good Arm FPGA Board Ultra96 and Google AI YOLO
SlideShare Ultra96 보드로 YOLO 가속화
Ultra96에서 실행
YOLO v3 19.4초
YOLO v3 tiny 1.03초
역시, 네트워크의 구조의 규모가, 처리 시간이 계속되고 있다.
이 슬라이드로 나타낸 모델에서는, 「부동 소수점의 행렬 연산을 PL로 오프로드」하는 것이다.
github Ultra96-yolo
SlideShare NEON에 의한 YOLO 고속화 p.21
tinier-YOLO
추가
Xilinx의 github 페이지에서 각종 심층 학습을 Ultra96의 디바이스로 구현했을 때 얼마나 레이턴시와 처리량이 나오는지를 기록하고 있다.
htps : // 기주 b. 코 m / ぃ ぃ x / 아이 - 모 l
"Click here to view details"라는 부분을 클릭하면 각종 모델에서의 레이턴시, end to end 의 처리량을 볼 수 있다.
yolov3의 각종 모델도 있고,
face_landmark
Openpose_pruned_0_3
도 있다.
XILINX의 FPGA를 사용하여 이미지 처리를 가속화하려면
YoloV3 예제
htps : // 기주 b. 이 m/ぃぃ x/ゔぃち s-아이/bぉb/마s테 r/ゔぃちs-아이-ぃb 등 ry/요ぉ v3/에서 st/에서 st_요ぉ v3. cp
추가
제2회 AI 엣지 콘테스트에서 FPGA 구현을 생각해 본다
또, 이 그림은 가로축이 연산 비용, 세로축이 ImageNet인 Top-1의 인식률이 됩니다.
원형 차트는 파라미터 수입니다.
이상은 인식률이 높고 연산 비용이 낮고 파라미터 수가 작은 것이 될까 생각합니다.
상기의 링크처로부터 인용
추가
NNgen
SlideShare DNN 모델 전문 하드웨어를 생성하는 오픈 소스 컴파일러 NNgen 데모
Reference
이 문제에 관하여(FPGA 보드 Ultra96에 대해 조사 중), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/nonbiri15/items/a9ae1a48610da06c7edc텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)