Bark
트랜스포머 기반의 Text-To-Audio 모델
Features
- 매우 사실적인 다국어 음성 생성 가능
- 음악, 배경 소음 및 간단한 음향 효과 포함
- 웃음, 한숨, 울음 같은 비언어적 커뮤니케이션도 연출 가능
- 영어/한국어 및 독일어/프랑스어/일본어/중국어 등을 지원
- 페이스북의 EnCodec 코덱을 사용
- Bark는 CC-BY 4.0 NC 라이센스 이며, Suno 모델 자체는 상업용도로 이용 가능
트랜스포머 기반의 Text-To-Audio 모델