Gaussian Diffusion Model(가우시안 확산 모델)은 데이터에 가우시안 노이즈를 점진적으로 추가했다가 다시 제거하면서 데이터를 생성하는 생성 모델입니다.
이 방식은 노이즈 제거 역과정을 학습해 무작위 노이즈를 구조화된 의미 있는 데이터로 변환합니다. 최근 확산 모델의 기본 구조로 사용되며, 고품질 이미지 및 텍스트 생성에 활용됩니다.
작동 원리:
• 이미지 생성(Image Generation)
노이즈에서 시작하여 사실적인 이미지를 생성 (예: DALL·E, Stable Diffusion)
• 텍스트 기반 이미지 생성(Text-to-Image Models)
텍스트 설명에 맞는 이미지를 생성
• 분자 생성(Molecular Generation)
신약 개발을 위한 새로운 분자 구조 생성
• 비디오 생성(Video Generation)
이미지 생성 원리를 확장해 일관성 있는 동영상 생성
중요성
Gaussian Diffusion Models는 기존 GAN 대비 아티팩트가 적고 고품질 출력물을 생성할 수 있어 주목받고 있습니다.
창작 산업부터 과학 연구까지 다양한 분야에서 활용되며, 생성형 AI 기술의 새로운 표준으로 자리잡고 있습니다.