Pulse code modulation

펄스 부호 변조(Pulse-code modulation, 줄여서 PCM)는 아날로그 신호의 디지털 표현으로, 신호 등급을 균일한 주기로 표본화한 다음 디지털 (이진) 코드로 양자화 처리된다. PCM은 디지털 전화 시스템에 쓰이며, 컴퓨터와 CD 레드북에서 디지털 오디오의 표준이기도 하다. 또, 이를테면 ITU-R BT.601을 사용할 때 디지털 비디오의 표준이기도 하다. 그러나 직접적인 PCM은 DVD, 디지털 비디오 레코더와 같은 소비자 수준의 SD 비디오에서 쓰이지 않는다. (왜냐하면 요구되는 비트 속도가 너무 높기 때문이다.) 일반적으로 PCM 인코딩은 직렬 형태의 디지털 전송에 자주 쓰인다.

Sample Rate & Bit Depth

Sampling and quantization of a signal (red) for 4-bit PCM

Sample Rate와 Bit Depth

Sample Rate는 시간을 쪼개는 기준 입니다. 위 그림에서 빨간 곡선은 아날로그 신호로 1회의 진동을 표현하고 있습니다. 그리고 이 신호가 PCM방식의 컨버팅을 거치면 그림에서 처럼 계단식으로 표현됩니다. 만약 Sample Rate가 더 커지면 저 계단형 그래프의 가로 폭이 더 좁아지게 되는데, 이는 곧 디지털로 저장된 정보가 빨간색 아날로그 곡선에 더 가까워진다는 것을 의미합니다. Sample Rate는 hz단위로 표시되며 CD는 1초를 44,100개로 쪼개서 컨버팅 한 데이터를 담기 때문에 44.1kHz의 Sample Rate를 가졌다고 표시합니다.

Bit Depth는 음압을 쪼개는 기준입니다. Sample Rate가 커지면 위 그림에 표시된 계단형 그래프의 가로 폭이 좁아지는 것 처럼, Bit Depth가 높아지면 계단형 그래프의 세로 폭이 좁아지게 됩니다. 위의 그림은 최대 음압을 0부터 15까지 16칸으로 쪼개놓았는데, 이는 2의 4제곱 즉, 4bit의 Bit Depth를 표시한 것이라고 할 수 있습니다. CD는 16bit의 Bit Depth를 가지는데 이는 음압을 2의 16제곱개의 칸으로 나누었다는 것을 의미합니다.

이처럼 Sample Rate와 Bit Depth는 그 수치가 커지면 커질수록 저장되는 디지털 정보의 값(계단형 그래프)이 아날로그 곡선에 가까워진다는 것을 알 수 있습니다.(물론 데이터의 용량도 증가합니다.) 만약 CD 규격인 44.1kHz/16bit보다 높은 Sample Rate, Bit Depth로 녹음/믹싱된 음원이라면 마스터링 과정에서 Anti-Aliasing Filter를 거쳐 Sample Rate를 낮추고, Dither를 사용해 Bit Depth를 낮춰주는 작업이 필요합니다.

인간의 가청 주파수는 20kHz까지이지만 CD의 Sample Rate가 44.1kHz가 된 데에는 Nyquist-Shannon 정리와 CD가 탄생하던 시기의 기술적 문제에 기반합니다. 위 그림에서 알 수 있다시피 소리의 진동은 0에서 시작해 (+)방향으로 진행한 뒤 다시 0으로 돌아왔다가 (-)방향으로 진행한 다음 다시 0으로 돌아오게 되는데 이를 1Cycle로 정의합니다. 그런데 만약 1초를 20,000개로 나누게 되면 1Cycle에 한개의 데이터 밖에 할당되지 않기 때문에 20kHz의 진동을 컨버팅 할 때 진동이 (+)와 (-)방향으로 얼마나 크게 진행했는지는 표시할 수 없습니다. 따라서 최소한 이의 두 배인 40,000개, 즉 40kHz 이상으로 나누어야 20kHz 진동 1Cycle에 두 개의 데이터를 할당해 (+)와 (-)방향으로 진행한 소리의 크기를 각각 저장할 수 있게 됩니다. 그런데 CD가 처음 개발되던 1970년대 말에는 디지털로 변환한 음성 데이터가 나름 고용량이었기 때문에 이를 저장해 놓을만 한 마땅한 매체가 없었다고 합니다. 그래서 개발 엔지니어들은 데이터의 저장공간으로 비디오 테잎을 사용했다고 하는데 이 과정에서 비디오 테잎의 초당 프레임 수와 프레임당 라인수 등을 고려해 데이터를 저장하다 보니 44.1kHz로 Sample Rate가 결정되었다고 합니다.

Favorite site

Wikipedia (en) PCM에 대한 설명