본문 바로가기

컴퓨터비전

R-CNN

과정

1. input 이미지를 넣는다.

2. selective search를 통해 약 2000개 정도의 bounding box에 대한 region proposal을 받는다.

3. 이후 fully connected layer에 고정된 사이즈로 input이 들어가야 하기 때문에 cnn input때부터 아예 warp를 통해서 제각각 사이즈인 후보 상자들을 억지로 227*227 사이즈로 변형시킨다.

4. CNN을 통과하여 feature vector이 나온다.

5-1. feature vector을 가지고 각 클래스 별로 svm classifier을 학습시킨다. 객체인가, 객체라면 어떤 물체일 확률이 높은지에 대한 score을 갖게 된다.

5-2. feature vector을 가지고 bounding box regression model을 수정하여 박스가 더 정확한 위치를 찾도록 한다.

 

 

단점

1. region proposal된 영역 2000개를 개별적으로 cnn을 거치니 시간이 너무 오래 걸린다.

2. 고정된 사이즈로 resize 하는 과정 중에 이미지의 과도한 변형이 일어난다.

 

'컴퓨터비전' 카테고리의 다른 글

Faster R-CNN 실습해보기  (0) 2020.10.03
Fast R-CNN과 Faster R-CNN  (0) 2020.10.03