ML&DL/GAN

#1 GAN (Generative Adversarial Networks) - 전체적인 틀

NeuroN 2023. 8. 1. 18:26

GAN 모델은 연구실 과제로 시작되어 논문까지 함께한 모델이다.

수많은 blog, kaggle, github, paper with code 등을 찾아보며 반년을 고심한 끝에 GAN 모델에 대해 어느정도 체계가 잡혔다.

지금까지 연구해온 GAN 모델에 대한 데이터셋을 만드는 과정에서부터 내가 원하는 결과를 뽑아내는 것까지 자세하게 다뤄보고자 한다.

모델의 단계는 다음과 같다.

 

1. GAN

  • GAN, WGAN, WGAN-GP, LSGAN 순의 모델들이 있다.
  • 이미지 생성 모델의 근간이 되는 모델로서, 이미지 생성까지의 과정만을 다룬다.

 

2. CGAN

  • CGAN, DCGAN, Pix2Pix, CycleGAN 순의 모델들이 있다.
  • 조건을 추가한 이미지 생성 모델로서, 이미지 생성에 그치지 않고 원하는 스타일의 이미지를 만드는 과정을 다룬다.

 

3. Image Inpainting with GAN

  • 이미지 복원 모델로서, 이미지에 생긴 결함 및 노이즈를 복원하는 과정을 다룬다.

순서를 보고 짐작하겠지만, 연구주제는 이미지 복원이다. GAN에서 이미지를 생성하는 아이디어에서 원하는 이미지를 생성할 수 있다면, 원래의 이미지로 복원이 가능하지 않겠냐는 생각이다.

하지만 관련 논문들을 찾아보면서 느꼈던 점은 소스가 너무 적다는 것이다.

심지어 자체 제작한 데이터에 대한 모델 가이드라인은 거의 없다시피하다.

해당 카테고리에서는 GAN에 대한 이미지복원의 큰 틀을 따라가지만, GAN 그 자체를 활용하기 위한 가이드라인을 제시하고자 한다.