본문 바로가기

분류 전체보기154

[딥러닝] Fast R-CNN 논문 리뷰 Fast R-CNN 이전 포스트 : https://lcyking.tistory.com/90 앞서 포스팅 한 것처럼 기존 R-CNN은 2000개의 이미지를 모두 CNN에 입력하고, 이미지 사이즈를 모두 같은 크기로 맞춰주는 문제점이 있었는데 이제 하나의 이미지로 위의 구조를 보면 CNN구조 뒤에, SPP Layer가 아닌 RoI Pooling Layer 가 붙었습니다. SPP Layer은 여러 가지 영역을 나누어 피라미드로 구성하고 어떤 크기의 이미지가 들어오더라도 같은 크기의 벡터를 출력되게 하는 점에서 RoI Pooling과 유사합니다. 위 그림에서 Projection된 RoI를 FCs(Fully Connected Layer)에 넣기 위해서는 같은 크기의 Feature map이 필요합니다. 하지만 Se.. 2022. 3. 23.
[딥러닝] SPPNet(Spatial Pyramid Pooling Network) 논문 리뷰 RCNN의 주요 문제점 RCNN은 2000개의 Region 영역 이미지가 CNN으로 입력되고, 이미지 크기도 동일한 사이즈로 맞춰 줘야 하기 때문에 Object Detection 수행 시간이 오래 걸립니다. 기존 CNN의 고정된 입력 크기를 맞춰주기 위하여 crop, wrap을 적용합니다. crop과 wrap은 얼핏봐도 문제점이 많아 보입니다. crop을 적용하면 crop 된 구역만 CNN을 통과시키기 때문에 전체 이미지의 손실이 발생합니다. warp 같은 경우에도 이미지를 확대하면 이미지가 옆으로 퍼진 채로 CNN을 통과하기 때문에 정보 변형이 일어납니다. 여기서 의문이 듭니다. 왜 사이즈를 고정해야 되는지? CNN은 서로 다른 사이즈의 Image를 수용하지 않는데, 가장 큰 이유는. 사실 Convol.. 2022. 3. 23.
[딥러닝] R-CNN 논문 리뷰 R-CNN 물체인식(Object Detection) 알고리즘은 타깃으로 하고자 하는 객체의 위치에 Bounding Box를 그려줘야 하고, Classification을 동시에 해주어야 하기 때문에 일반 CNN보다는 훨씬 복잡한 구조입니다. R-CNN은 첫 2-stage detector로, Object Detection 분야에서 최초로 CNN을 적용시켰습니다. 위의 그림은 R-CNN의 구조입니다. 위 구조를 설명하자면 이미지를 넣는다. 이미지가 있을만한 영역 2000개 추출해내고, 이미지를 모두 동일한 사이즈로 resize 해준다. CNN모델에 이미지를 하나씩 집어넣는다. 각각 이미지마다 분류를 한다. 2-stage detector는 Region Proposal(물체의 Bounding Box를 찾는 일),.. 2022. 3. 23.
[딥러닝] Object Detection이란? Localizaion : 이미지 내의 Object의 위치를 Bounding Box로 찾습니다. Detection : 이미지 내의 두 개 이상의 Object의 위치를 Bounding Box로 찾고, Bounding Box내의 오브젝트를 분류합니다. 두 개 두 개 다 Box의 좌표값과 그 Box의 Classification 두 개의 문제가 합쳐져 있어 일반 이미지 분류보다 더 복잡한 문제가 있습니다. Detection은 두 개 이상의 Object를 이미지의 임의 위치에서 찾아야 하므로 상대적으로 더 어려운 문제에 봉착하게 됩니다. 문제 Bounding Box 좌표의 Regression과 그것이 무엇인가를 판별하는 Classification을 동시에 진행해야 합니다. 다양한 크기의 유형의 박스들을 Detect.. 2022. 3. 22.