| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
Tags
- TTS
- Python
- 정보처리기사
- 소프트웨어 개발
- 힙정렬
- 생성형 인공지능
- 알고리즘
- LangGraph
- 트랜스포머
- 자연어처리
- 기초
- 캐글
- python 기초
- 에이전트
- 객체지향
- 딥러닝
- python기초
- CNN
- 머신러닝
- RDBMS
- 데이터 시각화
- 랭그래프
- UMAP
- ASR
- dementional reduction
- Transformer
- SQL
- CLIP
- RNN
- 데이터엔지니어
Archives
- Today
- Total
수달이네 기술 블로그
7. Whisper Finetuning 1 (Feature Extractor & Tokenizer)
https://velog.io/@mino0121/NLP-OpenAI-Whisper-Fine-tuning-for-Korean-ASR-with-HuggingFace-Transformers위 블로그 글을 참고함오디오 소스 리샘플링16kHz의 sampling rate로 resamplingWhisper모델은 기본적으로 16kHz의 샘플링레이트로 된 오디오를 받는다.잘못된 샘플링 레이트로 들어올 때, 재생속도, 음높이 등이 왜곡되어 제대로 인식하지 못한다.따라서 같은 샘플로 만들기 위해 밀도를 변환한다.보간(interpolation): 샘플링 레이트를 줄일 때, 단순히 버리면 음질이 깨진다. 오히려 늘릴 때는 그 사이 값을 어떻게 넣어야 할지 정해야한다. 따라서 다양한 방법을 이용하는데.선형보간(Linear) - ..
프로젝트
2026. 4. 18. 20:02