본문 바로가기

딥러닝54

[논문리뷰] Generative Adversarial Nets(GANs)의 이해 소개 Generative Adversarial Networks We propose a new framework for estimating generative models via an adversarial process, in which we simultaneously train two models: a generative model G that captures the data distribution, and a discriminative model D that estimates the probability that arxiv.org Adversarial의 사전적 의미는 적대적이라는 뜻을 갖습니다. 말 그대로 두 모델이 대립하면서 동시에 학습시킵니다. Fake Image를 만들어내는 Generator, 기.. 2022. 11. 8.
[딥러닝] Faster R-CNN 논문 리뷰 Faster R-CNN 이전 포스트: https://lcyking.tistory.com/91 [딥러닝] Fast R-CNN 논문 리뷰 Fast R-CNN 이전 포스트 : https://lcyking.tistory.com/90 앞서 포스팅 한 것처럼 기존 R-CNN은 2000개의 이미지를 모두 CNN에 입력하고, 이미지 사이즈를 모두 같은 크기로 맞춰주는 문제점이 있었는데 이제 하 lcyking.tistory.com 개요 이전 포스트에서 Fast R-CNN은 Region Proposal 영역의 Selective Search는 GPU가 아닌 CPU로 돌아가 2.3초라는 시간이 걸렸습니다. 이것은 실시간에 적용하기에는 무리가 있습니다. 그래서 Faster R-CNN의 핵심 아이디어는 Region Proposa.. 2022. 3. 24.
[딥러닝] Fast R-CNN 논문 리뷰 Fast R-CNN 이전 포스트 : https://lcyking.tistory.com/90 앞서 포스팅 한 것처럼 기존 R-CNN은 2000개의 이미지를 모두 CNN에 입력하고, 이미지 사이즈를 모두 같은 크기로 맞춰주는 문제점이 있었는데 이제 하나의 이미지로 위의 구조를 보면 CNN구조 뒤에, SPP Layer가 아닌 RoI Pooling Layer 가 붙었습니다. SPP Layer은 여러 가지 영역을 나누어 피라미드로 구성하고 어떤 크기의 이미지가 들어오더라도 같은 크기의 벡터를 출력되게 하는 점에서 RoI Pooling과 유사합니다. 위 그림에서 Projection된 RoI를 FCs(Fully Connected Layer)에 넣기 위해서는 같은 크기의 Feature map이 필요합니다. 하지만 Se.. 2022. 3. 23.
[딥러닝] SPPNet(Spatial Pyramid Pooling Network) 논문 리뷰 RCNN의 주요 문제점 RCNN은 2000개의 Region 영역 이미지가 CNN으로 입력되고, 이미지 크기도 동일한 사이즈로 맞춰 줘야 하기 때문에 Object Detection 수행 시간이 오래 걸립니다. 기존 CNN의 고정된 입력 크기를 맞춰주기 위하여 crop, wrap을 적용합니다. crop과 wrap은 얼핏봐도 문제점이 많아 보입니다. crop을 적용하면 crop 된 구역만 CNN을 통과시키기 때문에 전체 이미지의 손실이 발생합니다. warp 같은 경우에도 이미지를 확대하면 이미지가 옆으로 퍼진 채로 CNN을 통과하기 때문에 정보 변형이 일어납니다. 여기서 의문이 듭니다. 왜 사이즈를 고정해야 되는지? CNN은 서로 다른 사이즈의 Image를 수용하지 않는데, 가장 큰 이유는. 사실 Convol.. 2022. 3. 23.