ff-faster-rcnn은 자신의 데이터를 훈련시킨다

1712 단어 화상 알고리즘
코드 참조:git clonehttps://github.com/endernewton/tf-faster-rcnn.git훈련 과정 참고:https://blog.csdn.net/yaoqi_isee/article/details/79254574전체 과정 절차: 데이터 준비, 데이터 형식은 VOC 데이터로 전환, 코드 수정 훈련 과정: 데이터 준비: 여기에imagenet의 데이터를 예로 들어 총기라는 물건을 훈련한다(imagenet 중: n02749479(총) n04090263(저격총) n04086273(권총) n03527444(권총, 일반적으로 총갑이 싸여 있다)), Imagenet 1000가지 데이터 데이터를 직접 다운로드하여 VOC의 데이터 유형 중명 이미지와 xml, xml로 정리한다.xml 부분 내용 수정(필터 부분 xml 데이터,faster rcnn은 길이와 너비에 대한 특별한 요구가 있음) 각별히 주의:imagenet 데이터를 필터하지 않으면 일련의 이상 오류가 발생할 수 있습니다. 참고: (https://blog.csdn.net/jiajunlee/article/details/50470897) Faster R-CNN 프로그램 자체의 원인으로 인해 데이터 세트의 속성에 대한 요구 사항이 있음을 설명하고 다음에 분석 및 방법을 설명할 것입니다.기본적으로 훈련은 VOC2007 데이터 집합의 속성을 완전히 지원하기 때문에 ImageNet의 일부 데이터를 삭제하여 VOC2007의 속성을 만족시키고 ImageNet의 이미지 속성으로 인한 문제를 해결한다.Object의 너비 제공 데이터 VOC2007의 0.117-15.500 사이 ImageNet의 0.03-48.50 사이 그림의 너비 <=127 또는 높음<=96은 모두 삭제되고 목표: 너비 <=7 및 높음 <=9의 그림은 모두 삭제되며 그림의 너비 가 0.12 이하이거나 >10보다 작은 그림은 모두 삭제됩니다
코드 수정 및 디렉터리 설명: 데이터:demo는 테스트 데이터imagenetweights는 훈련에 필요한 예비 훈련 모델(일반적으로imagenet에서의 예비 훈련 vgg와res101 네트워크)VOcdevikit 2007을 위한 훈련 데이터
experiments 트레이닝 시 테스트 수정이 필요합니다faster_rcnn.sh train_faster_rcnn.sh train_faster_rcnn.sh pascal_voc) TRAIN_IMDB=”voc_2007_train” TEST_IMDB=”voc_2007_val” STEPSIZE=”[50000]” ITERS=100000 ANCHORS=”[8,16,32]” RATIOS=”[0.5,1,2]”
TRAIN 수정됨IMDB=”voc_2007_train” TEST_IMDB=”voc_2007_val”
VOC2007 ImageSet/main       train test.txt      voc_2007_train voc_2007_val,   voc_2007_trainval voc_2007_test(   trainval  test.txt  )

lib 기본 코드 dataset:pascalvoc 수정 클래스 데이터 형식: self.classes = (‘background‘, ‘qiang’, ‘jujiqiang’, ‘shouqiang’, ‘sqtao’) factory.py (voc를 모방하면 데이터를 수정할 필요가 없음)

좋은 웹페이지 즐겨찾기