Voice-Pro
Voice-Pro는 음성인식, 번역, 음성합성을 지원하는 Gradio WebUI 입니다.
주요 기능
- 제로샷 보이스 클로닝. 15초 분량의 음성 샘플만 있으면 됩니다. 50인 이상의 셀럽 보이스 제공
- YouTube 오디오 다운로드
- 보컬 분리
- 다국어 텍스트-음성 변환 (Edge-TTS, F5-TTS)
- 다국어 번역
- 다양한 Whisper 엔진 지원 (Whisper, Faster-Whisper, Whisper-Timestamped)
See also
- Gradio
- 음성 인식 (Speech recognition) (Speech-to-Text; STT)
- 음성 합성 (Speech synthesis) (Text-to-Speech; TTS)