Skip to content

Kitten TTS

CPU만으로 동작하는 25MB 오픈소스 TTS 모델

About

  • Kitten TTS는 경량화와 고음질을 동시에 추구하는 오픈소스 TTS(텍스트-투-스피치) 모델
  • 1,500만 개 파라미터만 사용하여 모델 크기가 25MB 미만
    • 타 대형 TTS와 달리 모바일, 임베디드 등 모든 환경에서 실행이 가능하다는 것이 큰 특징
  • GPU 없이도 모든 기기에서 고품질의 음성 합성 처리 가능함
  • 다양한 프리미엄 목소리 옵션 제공으로 실제 음성과 흡사한 고음질 음성 합성지원
  • 빠른 속도로 음성 추론이 가능하여 실시간 합성에 최적화
  • 개발자 프리뷰 모델이 공개된 상태이며, 향후 교육 완료 전체 모델 가중치, 모바일 SDK, 웹 버전 등 순차적 공개 예정

See also

Favorite site