본문 바로가기

딥러닝기초

CNN fully connected layer 들어가기까지

feature extractor

conv layer, ReLU, pooling

regional pattern들을 이미지로부터 뽑는다.

고정된 정사각형 크기로의 input으로 맞춰야 한다. 고정된 사이즈로 맞추면서 비율이 왜곡되고 일부분이 잘리고 본래 생김새와 달라지게 된다.

컬러 이미지의 경우 shape이 (a, a, 3)인데 RGB 때문에 depth가 3이 되는 것이다. 흑백이미지인 경우에는 depth가 1이다.

 

이미지는 항상 깊이값보다 width와 height 값이 더 크다. 이를 cnn 아키텍쳐를 통해서 depth 값이 더 커지는 것을 목표로 한다.

conv layer을 통해서 depth가 증가하게 되고(곧 filter의 갯수가 depth에 영향을 준다는 것이 자연스러운 일이다),

max pooling을 통해 width와 height가 줄어들게 된다.

아, 매 conv layer마다 ReLU 함수를 적용시켜 positive 값만 남도록 한다.

 

결국 옆 픽셀과의 관계에 대한 정보를 손상시키는 대신 filter을 통해 추출된 feature로 채워져 있어 바퀴 있어? 아니, 손이 있어 응 과 같은 정보를 담고 있다. 

 

이를 벡터로 Fully Connected layer의 input이 되게 하고 어떤 object를 갖는지 결정하게 할 수 있다.