Faster R-CNN 코드의 anchors 분석
먼저 Faster R-CNN 교체 rpn과 Fast R-CNN 부분의 훈련 앞에 anchors가 발생하는 함수가 있는데 우리는 이를 베이스 anchor라고 부른다. 함수는 다음과 같다.
function anchors = proposal_generate_anchors(cache_name, varargin)
% anchors = proposal_generate_anchors(cache_name, varargin)
% --------------------------------------------------------
% Faster R-CNN
% Copyright (c) 2015, Shaoqing Ren
% Licensed under The MIT License [see LICENSE for details]
% --------------------------------------------------------
%% inputs
ip = inputParser;
ip.addRequired('cache_name', @isstr);
% the size of the base anchor
ip.addParamValue('base_size', 16, @isscalar);
% ratio list of anchors
ip.addParamValue('ratios', [0.5, 1, 2], @ismatrix);
% scale list of anchors
ip.addParamValue('scales', 2.^[3:5], @ismatrix);
ip.addParamValue('ignore_cache', false, @islogical);
ip.parse(cache_name, varargin{:});
opts = ip.Results;
%%
if ~opts.ignore_cache
anchor_cache_dir = fullfile(pwd, 'output', 'rpn_cachedir', cache_name);
mkdir_if_missing(anchor_cache_dir);
anchor_cache_file = fullfile(anchor_cache_dir, 'anchors');
end
try
ld = load(anchor_cache_file);
anchors = ld.anchors;
catch
base_anchor = [1, 1, opts.base_size, opts.base_size];
% [base_anchor] ratios
ratio_anchors = ratio_jitter(base_anchor, opts.ratios);
% [base_anchor] scales
anchors = cellfun(@(x) scale_jitter(x, opts.scales), num2cell(ratio_anchors, 2), 'UniformOutput', false);
anchors = cat(1, anchors{:});
if ~opts.ignore_cache
save(anchor_cache_file, 'anchors');
end
end
end
% ratio_jitter,scale_jitter
나는 실험 과정에서 단점을 설정하고 자신이 생성한 anchor 수치를 예로 삼았다. 다음과 같다.
anchor:9*4
[ -83 -39 100 56 ]
[ -175 -87 192 104 ]
[ -359 -183 376 200 ]
[ -55 -55 72 72 ]
[ -119 -119 136 136 ]
[ -247 -247 264 264 ]
[ -35 -79 52 96 ]
[ -79 -167 96 184 ]
[ -167 -343 184 360 ]
이를 통해 알 수 있듯이 생성된 9개의 anchor는 앞의 세 줄은 기본적으로 무작위 떨림을 제외하고는 서로 다른 scale이지만 ratio는 같다. 모두 [-2,-1,2,1]이고 중간 세 줄은 [-1,-1,1,1]이며 마지막 세 줄은 [-1,-2,1,2]이다.문장에 따르면 여기는 바로 문장에서 말한 9가지 anchor, 즉base anchor이다.
rpn 훈련 과정에서 모든 샘플 이미지의 크기와 네트워크를 대상으로 모든anchor를 얻을 수 있다.
function [anchors, im_scales] = proposal_locate_anchors(conf, im_size, target_scale, feature_map_size)
% [anchors, im_scales] = proposal_locate_anchors(conf, im_size, target_scale, feature_map_size)
% --------------------------------------------------------
% Faster R-CNN
% Copyright (c) 2015, Shaoqing Ren
% Licensed under The MIT License [see LICENSE for details]
% --------------------------------------------------------
% generate anchors for each scale
% only for fcn
if ~exist('feature_map_size', 'var')
feature_map_size = [];
end
func = @proposal_locate_anchors_single_scale;
if exist('target_scale', 'var')
[anchors, im_scales] = func(im_size, conf, target_scale, feature_map_size);
else
[anchors, im_scales] = arrayfun(@(x) func(im_size, conf, x, feature_map_size), ...
conf.scales, 'UniformOutput', false);
end
end
function [anchors, im_scale] = proposal_locate_anchors_single_scale(im_size, conf, target_scale, feature_map_size)
if isempty(feature_map_size)
im_scale = prep_im_for_blob_size(im_size, target_scale, conf.max_size);
img_size = round(im_size * im_scale);
% , output , output_size
output_size = cell2mat([conf.output_height_map.values({img_size(1)}), conf.output_width_map.values({img_size(2)})]);
else
% , output_size
im_scale = prep_im_for_blob_size(im_size, target_scale, conf.max_size);
output_size = feature_map_size;
end
% output , shift_x,shift_y。
% shift_x 1*output
shift_x = [0:(output_size(2)-1)] * conf.feat_stride;
% shift_y 1*output
shift_y = [0:(output_size(1)-1)] * conf.feat_stride;
[shift_x, shift_y] = meshgrid(shift_x, shift_y);
% concat anchors as [channel, height, width], where channel is the fastest dimension.
% output , conf.anchors( base anchors) anchors
anchors = reshape(bsxfun(@plus, permute(conf.anchors, [1, 3, 2]), ...
permute([shift_x(:), shift_y(:), shift_x(:), shift_y(:)], [3, 1, 2])), [], 4);
% equals to
% anchors = arrayfun(@(x, y) single(bsxfun(@plus, conf.anchors, [x, y, x, y])), shift_x, shift_y, 'UniformOutput', false);
% anchors = reshape(anchors, [], 1);
% anchors = cat(1, anchors{:});
end
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Faster R-CNN 코드의 anchors 분석anchors는 proposal을 생성하는 rpn의 중점 내용 중 하나로서 Faster R-CNN에서 중점적으로 소개되었다. 다음은 anchors가 생성하는 부분 코드를 배워보자.나는 주로 그 중의 일부 중점 코드를...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.