Speex
스픽스(Speex)는 음성을 위해 개발된 무특허 오디오 압축 포맷이며 VoIP 소프트웨어 및 팟캐스트에 사용되는 프리웨어 음성 코덱이다. CELP 음성 코딩 알고리즘에 기초하고 있다. 스픽스는 모든 특허 제한으로 부터 자유로움을 추구하며, 개정된 (3절) BSD 라이선스 하에 허가를 받았다. Ogg 컨테이너 포맷과 함께 사용되거나 UDP/RTP를 통해 전송되기도 한다.
스픽스 개발자들은 이 프로젝트를 Vorbis 범용 오디오 압축 프로젝트와 상호 보완적인 것으로 본다. 스픽스는 파일 크기를 줄이기위해 영구적으로 품질을 떨어뜨리는 손실 압축 포맷이다.
스픽스 프로젝트는 2002년 2월 13일에 시작되었다. 스픽스의 첫 개발 버전은 LGPL 라이선스 하에 공개되었으나, 1.0 베타 버전과 마찬가지로 스픽스는 Xiph 재단의 개정 BSD 라이선스 하에 공개되었다. 스픽스 1.0은 2003년 3월 24일에 공지되었다. 스픽스의 최종 버전 인코더와 디코더는 1.1.12이다. Xiph.Org 재단은 스픽스를 이전 버전으로 보고 있으며, 오푸스가 그것을 계승하고 있다고 본다.
설명
스픽스는 VoIP와 파일 기반 압축에 사용할 목적으로 개발되었다. 개발 목표는 높은 품질의 음성과 낮은 비트레이트에 최적화된 코덱을 개발하는 것이었다. 이 목표를 달성하기 위해 스픽스는 다중 비트레이트를 사용하며, 초광대역(32 kHz 샘플링 레이트), 광대역(16 kHz 샘플링 레이트), 협대역(전화 품질, 8 kHz 샘플링 레이트)을 지원한다. 스픽스는 휴대폰용이 아닌 VoIP용으로 만들어졌기 때문에 스픽스는 손실된 패킷에 강해야한다. 이러한 이유로 인해 CELP가 스픽스를 위해 사용할 인코딩 기술로 채택되었다. 가장 큰 이유 중 하나는 CELP가 낮은 비트레이트와 높은 비트레이트에서 작업을 잘 수행하고 크기를 잘 조정할 수 있다는 것이 오랫동안 증명됐다는 것이다. 주요 특징은 다음과 같다.
- 프리웨어/오픈 소스, 무특허, 무로열티
- 동일한 비트스트림에서 협대역과 광대역의 통합
- 광범위한 사용가능 비트레이트(2 kbit/s에서 44kbit/s)
- 동적 비트레이트 전환과 가변 비트레이트(VBR)
- 음성 활동 감지(Voice Activity Detection, VBR과 통합)(1.2 버전에서는 지원하지 않음)
- 가변 복잡성
- 32 kHz에서 초광대역 모드(48 kHz까지)
- 인텐시티 스테레오 인코딩 옵션