Skip to content

Whisper

OpenAI가 오픈소스로 공개한 다국어 음성 인식 시스템(ASR)

Features

  • 영어 음성 인식에 대해서는 인간 수준의 정확도에 도달
  • 68만 시간 분량의 다국어 데이터로 훈련
  • 크고 다양한 데이터 셋을 통해 악센트, 배경 소음 및 기술 언어등에 대해서도 견고성(robustness)을 개선

Categories

See also

Documentation

Robust Speech Recognition via Large-Scale Weak Supervision
https://cdn.openai.com/papers/whisper.pdf

Favorite site