본문 바로가기

전체 글154

[논문리뷰] Mask R-CNN 들어가며 이 글은 Faster R-CNN의 사전 지식이 있다는 가정하에 작성하였습니다. Mask R-CNN은 Instance Segmentation 작업에 초점을 맞춘 모델입니다. 근데 여기서 왜 Instance Segmentation을 하는지 의문이 들 수 있습니다. 그냥 "Semantic Segmentation을 사용해서 pixel별 클래스를 예측하면 되지 않을까?" 위 차이를 보면 Semantic Segmentation은 Classification과 Segmentation을 동시에 수행하는 반면(Coupling), Instance Segmentation은 Object Detection 방식처럼 Bounding Box(BBox)와 Classification을 수행한 다음, 해당 영역 안에서만 Segm.. 2024. 3. 20.
[논문리뷰] Cascade R-CNN 들어가며 이 글은 Faster-RCNN에 대한 사전 지식이 있다는 가정하에 작성되었습니다. 본 논문에서 Object Detection에 대한 학습을 진행할 때 Detector의 Predict와 Ground-Truth(GT) 사이의 IOU(Intersection Over Union)를 결정하는 임계값(Threshold) \( \mu \)에 따라 성능이 크게 좌우한다고 합니다. 그런데 고품질의 Object Detection을 학습하는 데 있어서 최적의 Threshold 결정하는 것은 몇 가지 어려움이 존재합니다. 만약 "너무 낮은 임계값을 사용하면 많은 Noise낀 BBox가 Positive로 선정되어 학습에 어려움"이 있고, 반대로 "너무 높은 임계값을 사용하면 아주 작은 BBox에 대한 Positive만.. 2024. 3. 18.
[논문리뷰] Denoising Diffusion Probabilistic Models (DDPM) 들어가며 VAE 참고 논문 링크: [논문리뷰] VAE(Variational Auto-Encoder) 들어가며 오늘 리뷰해 볼 논문은 생성형 모델의 하나인 Variational Auto-Encoder(VAE)입니다. 이 논문은 현재 Diffusion 모델의 토대인 모델인 만큼 아주 중요한 모델입니다. 먼저 이 논문의 제목을 보면 Au lcyking.tistory.com 이 글은 VAE의 사전 지식이 있다 가정하에 설명을 진행하려 합니다. VAE를 모른다면 이해에 많은 어려움이 있을 수 있으므로, 꼭 한 번 보고 오시는 것을 추천합니다. 하물며, 유명하고 오래된 논문이라 영상이나 포스터가 많이 올라와있으니 참고하시길 바랍니다. Diffusion 이란? Diffusion은 VAE, GAN과 같은 이미지 생성 .. 2024. 3. 6.
[논문리뷰] VAE(Variational Auto-Encoder) 들어가며 오늘 리뷰해 볼 논문은 생성형 모델의 하나인 Variational Auto-Encoder(VAE)입니다. 이 논문은 현재 Diffusion 모델의 토대인 모델인 만큼 아주 중요한 모델입니다. 먼저 이 논문의 제목을 보면 Auto-Encoder라는 말이 있습니다. 이 Auto-Encoder가 뭘까요? 위와 같이 Auto-Encoder는 입력 차원과 출력 차원이 같다는 점이 있습니다. 근데 이걸 왜 하느냐 하면 근본적인 이유는 차원 축소에 있습니다. 본래 차원 축소는 비지도학습으로 이루어졌습니다. 하지만, Auto-Encoder의 경우는 Input x가 입력되고 Encoder뒤에 Decoder를 붙여서 입력과 출력이 같은 구조를 만들고, z가 비지도학습이 아닌 지도학습으로 차원 축소를 이루어내며 크.. 2024. 2. 28.