수달이네 기술 블로그

Generative Model에 대해 본문

학교공부

Generative Model에 대해

슬픈 수달이 2025. 3. 24. 14:36

0. Generative Model의 개요

인공지능, 머신러닝에서 사용되는 모델으로, 데이터 X와 특성 Y의 결합분포 p(X,Y)를 추정하는 모델이다.

  • 만약, 데이터 X가 이미지, 데이터 Y가 이미지의 레이블을 의미한다면, 
    p(X,Y)는 X,Y가 동시에 나타날 확률을 나타내는 함수이다.
  • 여기서 추정한다는 것은 실제 데이터를 보고 그 확률 분포를 학습해서 비슷하게 흉내내는 것이다.

그러나 고차원 데이터를 모델링 할때는 복잡도가 높아 분포를 학습하기 힘들 것이다.

 

1. 가우시안 혼합 모델

예를 들어 하나의 고양이 사진이라는 고차원 데이터가 있을 때 이 고양이 사진이 담고있는 정보는

털 색, 귀 모양, 눈 위치등의 어마어마한 양의 정보가 들어있다.

  • 복잡도가 높음. (가진 정보가 서로 얽혀있어 단순히 한두가지 규칙으로 설명하기 힘듦.
  • 따라서 저차원의 정보로 나타내야 함.

저차원의 정보로 나타내는 것은 따로따로 생각하는 것이다. 털 색 하나, 귀 모양 하나 이런식(예시임)

이런 식으로 고차원의 정보는 여러 구조, 패턴을 가지고 있다. (잠재 변수latent variable)

이걸 분리해서 나타내는 걸 그래프로 나타낸다면.

출처: https://nixustechnologies.com/gaussian-mixture-model/ ㅇㅇ

이런식으로 두개의 봉우리를 가진 그래프를 하나의 봉우리를 가진 그래프 2개로 나타낼 수 있듯이 표현할 수 있다.

2. 사용처

  • Inpainting(복원)

위 이미지 처럼 손상된 이미지를 복구.

  • deblur(흐림 제거)

해당 이미지 처럼 흐린 이미지를 깨끗하게 복원

이외에 다양한 사용처가 있음.

 

3. 평가지표(어떤 이미지가 잘 생성된 이미지일까?)

우리가 흔히 생각하는 정확도(accuracy), 정밀도(precision), 재현율(recall)같이 정의하기는 어렵다.

그 이유는 예를들어 스팸 메일의 분류를 할때

  • 정확도: 전체 예측 중 맞춘 비율
  • 정밀도: "스팸"이라고 예측한 것에서 실제 스팸의 비율
  • 재현율: 실제 스팸 메일 중 "스팸"을 골라낸 비율

이런식으로 참/거짓으로 이분법 적으로 분류가 가능함을 알 수 있다. 그러나

Generative Model은 생성하는게 목표인 만큼 명확한 답이 없다.

  • AI가 만든 이 이미지가 내가 생각한 이미지와 얼마나 딱 맞는지 숫자로 명확하게 표현할 수 없으며,
  • 표현하더라도 주관적일 가능성이 높다.

그렇기 때문에 다른 평가방식, FID, Log-Likelihood등의 방식을 사용한다. 이후 배울 것이다.

 

4. Generative Model의 변화

  • 가우시안 혼합 모델: 여러개의 정규 분포를 나타냄.
  • 제한된 볼츠만 머신
  • 심층 신뢰망
  • 자기회귀
  • 이후 딥러닝 베이스 모델이 나옴(VAE, GAN, Diffusion Model)

 

'학교공부' 카테고리의 다른 글

AI는 왜 숫자를 통해 결과를 결정하는 걸까?  (2) 2025.03.12
AI 입문과 ANN의 이해  (1) 2025.03.11