반응형
생성 모델(Generative Models)
1. GAN : 묵시적으로 확률 분포 모델링 -> 모델 구성에 제한이 없어 결과물 quality up. 하지만 생성자+판별자와 모드 붕괴 등의 한계점이 존재
2. VAE : 오토 인코더의 파생형으로, 명시적으로 확률분포 모델링. 하지만 가능도가 아닌 ELBO를 통한 학습이라는 한계
3. Flow based : 단순 확률 분포에서 추출한 값에 여러 단계의 변환을 거쳐 복잡한 분포를 만드는 방법. 명시적인 가능도로 모델링한다는 장점과 결과물 quailty가 좋지만 변환 함수의 역함수가 존재해야한다는 제한이 있음.
diffusion model
- 기존 생성 모델들(GAN, VAE 등)은 latent space를 잘 형성하고, 각 값들을 정규 분포로 잘 만드는 방법을 학습했다. Flow based 모델은 이를 여러 단계의 가역함수로 나눈 것.
- 확산 모델은 물리학의 랑주뱅 동역학에서 아이디어를 가져와 이미지의 픽셀들이 시간이 지나면서 흩어지며 노이즈로 변하는 것을 수식으로 나타낸 것.
위 변환은 forward와 reverse 방향으로 나뉜다. reverse 변환을 통해 노이즈->데이터 생성을 한다. diffusion model은 일정 시간 후의 사진을 생성하도록 학습된 마르코프 연쇄라고할 수 있음. 또한 학습 시 negetive log-likelihood의 ELBO 사용.
반응형