'tokenizer' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

깃허브

« 2026/06 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Tags more

Archives

Today

Total

관리 메뉴

수달이네 기술 블로그

7. Whisper Finetuning 1 (Feature Extractor & Tokenizer)

https://velog.io/@mino0121/NLP-OpenAI-Whisper-Fine-tuning-for-Korean-ASR-with-HuggingFace-Transformers위 블로그 글을 참고함오디오 소스 리샘플링16kHz의 sampling rate로 resamplingWhisper모델은 기본적으로 16kHz의 샘플링레이트로 된 오디오를 받는다.잘못된 샘플링 레이트로 들어올 때, 재생속도, 음높이 등이 왜곡되어 제대로 인식하지 못한다.따라서 같은 샘플로 만들기 위해 밀도를 변환한다.보간(interpolation): 샘플링 레이트를 줄일 때, 단순히 버리면 음질이 깨진다. 오히려 늘릴 때는 그 사이 값을 어떻게 넣어야 할지 정해야한다. 따라서 다양한 방법을 이용하는데.선형보간(Linear) - ..

프로젝트 2026. 4. 18. 20:02

이전 Prev 1 Next 다음

수달이네 기술 블로그

티스토리툴바