| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
- 데이터 시각화
- RNN
- 딥러닝
- CLIP
- 랭그래프
- SQL
- RDBMS
- CNN
- python 기초
- 생성형 인공지능
- 소프트웨어 개발
- 객체지향
- dementional reduction
- 알고리즘
- 트랜스포머
- 머신러닝
- python기초
- 캐글
- TTS
- 정보처리기사
- 힙정렬
- 자연어처리
- 데이터엔지니어
- 기초
- Transformer
- LangGraph
- 에이전트
- Python
- UMAP
- ASR
- Today
- Total
수달이네 기술 블로그
Generative Model에 대해 본문
0. Generative Model의 개요
인공지능, 머신러닝에서 사용되는 모델으로, 데이터 X와 특성 Y의 결합분포 p(X,Y)를 추정하는 모델이다.
- 만약, 데이터 X가 이미지, 데이터 Y가 이미지의 레이블을 의미한다면,
p(X,Y)는 X,Y가 동시에 나타날 확률을 나타내는 함수이다. - 여기서 추정한다는 것은 실제 데이터를 보고 그 확률 분포를 학습해서 비슷하게 흉내내는 것이다.
그러나 고차원 데이터를 모델링 할때는 복잡도가 높아 분포를 학습하기 힘들 것이다.
1. 가우시안 혼합 모델
예를 들어 하나의 고양이 사진이라는 고차원 데이터가 있을 때 이 고양이 사진이 담고있는 정보는
털 색, 귀 모양, 눈 위치등의 어마어마한 양의 정보가 들어있다.
- 복잡도가 높음. (가진 정보가 서로 얽혀있어 단순히 한두가지 규칙으로 설명하기 힘듦.
- 따라서 저차원의 정보로 나타내야 함.
저차원의 정보로 나타내는 것은 따로따로 생각하는 것이다. 털 색 하나, 귀 모양 하나 이런식(예시임)
이런 식으로 고차원의 정보는 여러 구조, 패턴을 가지고 있다. (잠재 변수latent variable)
이걸 분리해서 나타내는 걸 그래프로 나타낸다면.

이런식으로 두개의 봉우리를 가진 그래프를 하나의 봉우리를 가진 그래프 2개로 나타낼 수 있듯이 표현할 수 있다.
2. 사용처
- Inpainting(복원)

위 이미지 처럼 손상된 이미지를 복구.
- deblur(흐림 제거)

해당 이미지 처럼 흐린 이미지를 깨끗하게 복원
이외에 다양한 사용처가 있음.
3. 평가지표(어떤 이미지가 잘 생성된 이미지일까?)
우리가 흔히 생각하는 정확도(accuracy), 정밀도(precision), 재현율(recall)같이 정의하기는 어렵다.
그 이유는 예를들어 스팸 메일의 분류를 할때
- 정확도: 전체 예측 중 맞춘 비율
- 정밀도: "스팸"이라고 예측한 것에서 실제 스팸의 비율
- 재현율: 실제 스팸 메일 중 "스팸"을 골라낸 비율
이런식으로 참/거짓으로 이분법 적으로 분류가 가능함을 알 수 있다. 그러나
Generative Model은 생성하는게 목표인 만큼 명확한 답이 없다.
- AI가 만든 이 이미지가 내가 생각한 이미지와 얼마나 딱 맞는지 숫자로 명확하게 표현할 수 없으며,
- 표현하더라도 주관적일 가능성이 높다.
그렇기 때문에 다른 평가방식, FID, Log-Likelihood등의 방식을 사용한다. 이후 배울 것이다.
4. Generative Model의 변화
- 가우시안 혼합 모델: 여러개의 정규 분포를 나타냄.
- 제한된 볼츠만 머신
- 심층 신뢰망
- 자기회귀
- 이후 딥러닝 베이스 모델이 나옴(VAE, GAN, Diffusion Model)
'학교공부' 카테고리의 다른 글
| AI는 왜 숫자를 통해 결과를 결정하는 걸까? (2) | 2025.03.12 |
|---|---|
| AI 입문과 ANN의 이해 (1) | 2025.03.11 |