| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
Tags
- RDBMS
- 소프트웨어 개발
- 에이전트
- 객체지향
- 데이터엔지니어
- 생성형 인공지능
- 머신러닝
- 자연어처리
- 트랜스포머
- dementional reduction
- 딥러닝
- RNN
- 캐글
- 데이터 시각화
- SQL
- 정보처리기사
- 알고리즘
- TTS
- 힙정렬
- CNN
- ASR
- Transformer
- python기초
- LangGraph
- 기초
- python 기초
- UMAP
- 랭그래프
- CLIP
- Python
Archives
- Today
- Total
수달이네 기술 블로그
논문) Toward Low-Latency End-to-End Voice Agents for TelecommunicationsUsing Streaming ASR, Quantized LLMs, and Real-Time TTS (1) - 음성 에이전트 파이프라인의 레이턴시 감소 방법
(PDF) Toward Low-Latency End-to-End Voice Agents for Telecommunications Using Streaming ASR, Quantized LLMs, and Real-Time TTS (2025) | Vignesh Ethiraj→ 25년 8월 5일 논문통신산업에서의 저지연(low-latency) 종단 간 (end-to-end)음성 에이전트 파이프라인을 제안함.서론음성신호를 텍스트로 바꾸는 (ASR), 텍스트를 이해하는 (NLU), 답변을 생성하는 (LLM), 다시 음성으로 바꾸는 (TTS)의 모든 과정이 개별적으로는 점차 빨라졌음. 그러나 모든 단계를 이어서 사용할 경우 아직 시간이 길어져 실제 대화 같은 자연스러운 소통이 어려움.실시간 음성 인터페이스는 위 기..
AI공부/논문 리뷰
2026. 3. 21. 14:21