DIFFUSEQ: Sequence To Sequence Text Generation with Diffusion Models
논문 저자: Shansan Gong, Mukai Li, Jiangtao Feng, Zhiyong Wu, Lingpeng Kong Introduction 기존의 생성모델인 GAN, VAE, Flow-based models는 다양한 분야에서 우수한 성능을 보이고 있긴 하지만 여전히 한계가 존재한다. GAN은 adversarial learning으로 인한 훈련의 불안정성이 존재하고, mode collapse(generator가 다양한 data를 생성해내지 못하고, 반복해서 비슷한 data만 계속 생성하는 문제)와 같은 문제도 존재한다. VAE는 surrogate loss에 의존한다. Flow-based models는 reversible transform을 위해서 특수한 architecture를 사용해야만 한다..