나무모에 미러 (일반/어두운 화면)
최근 수정 시각 : 2024-10-02 20:07:21

펄스 부호 변조

PCM에서 넘어옴

파일:나무위키+유도.png  
PCM은(는) 여기로 연결됩니다.
PABAT! 2013에 참가한 위풍당당 행진곡의 리메이크에 대한 내용은 PCM(BMS) 문서
번 문단을
부분을
, 2021년 6월 30일까지 지상파에서 시행하던 PCM(Premium Commercial Message)에 대한 내용은 PCM(중간광고) 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
참고하십시오.
🎵 오디오 코덱
{{{#!wiki style="margin: 0 -10px -5px; min-height: 26px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -6px -1.5px -13px"
<colbgcolor=#555>손실
압축
<colbgcolor=#555><colcolor=#fff>일반MP1 · MP2 · MP3 · mp3PRO · AAC · Musepack · WMA · Vorbis · Opus · USAC
음성 특화AMR-NB · AMR-WB · AMR-WB+ · WMA Voice · Speex · Opus · Codec 2 · EVS · Lyra
다중채널 특화AC-3 · SDDS · DTS · AC-4
블루투스SBC · aptX · AAC · LDAC · SSC(Samsung Seamless Codec · Samsung Scalable Codec) · LC3
무손실 압축FLAC · ALAC · APE · TAK · WMA Lossless · TTA · WavPack
무손실 무압축PCM (WAV · AIFF)
관련 문서: MIDI · DSD
관련 틀: 그래픽 · 오디오 · 비디오
}}}}}}}}} ||

1. 개요2. 설명3. PCM 단계
3.1. 샘플링(표본화)3.2. 양자화 (Quantization)3.3. 부호화(인코딩)
4. 사용 용례5. 관련 문서

1. 개요

Pulse Code Modulation

펄스 부호 변조아날로그 신호를 0과 1의 디지털 신호로 변환하는 방법이다. 버나드 올리버, 클로드 섀넌, 존 피어스가 PCM 을 발명하였다. 1972년 ITU-T(국제 전기 통신 연합 전기 통신 표준화 부문) G.710~G.719로 규격이 표준화 되었다.

2. 설명

소리 등의 연속되는 값을 기록하기 위해 쓰이며, 전자악기 중 일부의 음원을 표현하는 방식이기도 하다. 롬팩을 사용하여 미리 음원을 PCM 형식으로 저장하는 것, 음파를 삼각함수로 분석한 데이터를 담아놓고 필요할 때마다 렌더링해서 소리를 내는 것의 두 가지로 크게 나뉜다.

이름이 그 원리를 잘 표현해주고 있다. 이름만 갖고 간단히 설명하자면 파형을 미세한 시간 단위로 쪼개 펄스열로 바꾼 후 그것을 '부호(code)화'하여 디지털 신호로 '변조(modulation)'해 내는 기술이다. 이 PCM으로 컴퓨터는 용량만 충분하다면 이론상 어떤 아날로그 데이터든 1과 0으로 표현이 가능하다. 조금 더 자세하게 원리를 설명하면 파형을 미세한 시간 단위로 쪼개는 것을 샘플링이라 부르며 이 과정을 거치면 PAM(Pulse Amplitude Modulation) 펄스로 변환된다. PAM 펄스의 진폭은 연속적인데 이를 이산적인 값으로 변환하는 양자화를 거치면 이산적인 진폭을 갖는 펄스가 나오고 이를 2진 부호로 변환하면 디지털 신호가 된다. 이론적인 설명이라 실제 ADC의 동작과는 살짝 차이가 있긴 하다. 자세한 내용은 디지털 문서 참조.

3. PCM 단계

3.1. 샘플링(표본화)

음성과 같은 아날로그 신호를 디지털화하기 위해 일정한 간격으로 표본화(Sampling) 한다. 이것을 펄스 진폭 변조(Pulse Amplitude Modulation, PAM)라고 한다. 흔히 음악파일에서 샘플링 레이트라고 하는 것이 바로 이 샘플링의 간격을 의미하며, 1초당 샘플링 갯수를 Hz(Hertz)단위로 표기한다. CD의 샘플링 레이트인 44100hz는 1초 동안의 아날로그 신호를 44100개의 샘플로 조각내어 표현함을 의미한다.

3.2. 양자화 (Quantization)[1]

펄스 진폭 변조 신호의 크기를 디지털 양으로 변환한다. 앞서 샘플링된 매우 작은 길이(CD 44.1khz에서는 약 1/44.1 밀리초만큼)의 아날로그 신호를, 크기를 나타내는 디지털 숫자로 바꾼다. 언듯 보기에는 그 짧은 시간동안에도 변화무쌍할 수 있는 아날로그 그래프의 움직임을 그저 숫자 하나로 바꾸니까 많은 정보가 날아가는 것이 아닌가 생각할 수 있으나, 나이퀴스트 이론(Nyquist Theorem)에 따르면 디지털 신호로 바꾸고자 하는 주파수의 2배로 샘플링하여 양자화하면 나중에 다시 얻고자 하는 신호로 되돌려놓을 수 있다. [2] 가청주파수가 대략 20hz ~ 20000hz 정도이기 때문에 이론상 약 40khz 이상의 샘플을 양자화하면 가청 주파수 대역까지의 음을 복원할 수 있다.

샘플별 양자화값의 범위(range)는 bit로 표시한다. CD의 경우 16bit(0~65,535)로 표현되며 이를 쉽게 풀어쓰면 0은 무음, 65,535은 최대음(헤드룸 최대값)으로 간주된다. 최근 주목받고있는 24bit 음악은 같은 아날로그 샘플을 0~4,194,304 로 더욱 잘게 쪼갠다는 뜻이다. 스피커에서 연주되기 위해 아날로그로 변환되면 16bit의 65,535는 24bit의 4,194,304와 동일한 볼륨을 가지게 되기에 bit수가 커진다고 볼륨이 올라가는 것이 아니라 같은 아날로그 음악을 더 세밀하게 양자화한다고 할 수 있다.

볼륨 최대값인 헤드룸은 아날로그 취입된 음악을 마스터링(Mastering)할 때 지정되며 ADC 진행중에 이보다 더 높은 아날로그 신호가 들어오면 클리핑된다. 사람은 볼륨이 높을수록 음질이 좋다고 여기는 경향이 있기 때문에 최근 녹음들은 클리핑을 감수하고서라도 비교적 큰 숫자들로 양자화시키는 경향이 있어서 실질적으로 작은 음은 크게 들리고, 큰 볼륨 영역에서의 클리핑은 많아지며 결국 노래가 더욱 시끄러워지고 있는데 이를 Loudness War라고 부른다.

3.3. 부호화(인코딩)

양자화된 값들을 전송을 위한 바이너리 비트 시퀀스로 변환한다.

CD(.WAV)의 RIFF Waveform 포맷을 사용하면 44.1khz 1초 동안의 데이터는 아래와 같이 기록된다.
(왼쪽/오른쪽 순서대로 기록된다고 가정)
Left Sample 1 Right Sample 1 Left Sample 2 Right Sample 2 .... Left Sample 44100 Right Sample 44100

CD의 양자화 크기는 16bit, 2바이트이므로 각 샘플별로 2바이트를 사용하게 된다.
따라서 CD 수준의 음질(16bit 44.1khz)에서 1초의 음악을 기록하는 데 필요한 용량은

2(스테레오) * 2(양자화크기) * 44100(샘플링레이트) = 176,400 바이트 (1411.2kbps)

가 된다. 가요들이 보통 플레이타임 4분(240초) 정도를 가지는데, 이를 기록하려고 하면 176,400 * 240 계산으로 대략 42메가바이트 정도의 용량이 필요함을 알 수 있다. 오디오 압축이 필요한 이유

4. 사용 용례

디지털 녹음 방식의 대표적인 형태로 지금까지 쓰이고 있다.[3] PCM 기기는 음향 신호의 표본화[4]를 통해 2진법 디지털 데이터로 기록하게 된다. 출력할 때는 변환기를 통해 반대의 과정을 거친다. 컴퓨터에서 사용되는 WAV 파일도 기본적으로 PCM 데이터를 저장한다. LPCM 같은 경우 DVD/블루레이 기본 코덱 중 하나기도 해서 자주 쓰이는 편. [5]

이 녹음 방식이 등장함에 따라 아날로그 방식의 음향 기기들은 주류 시장에서 깔끔하게 사장되었고 사실상 소수의 뮤지션들이나 오디오 마니아들의 수요에 연명하고 있다. 디지털 기반 음향 기기들이 녹음, 전송, 재생 등의 처리 과정에서 수반되는 잡음비(Signal-to-Noise Ratio, SNR)가 가격에 비해 비교할 수 없을 수준으로 낮은 덕분이다. 더구나 컴퓨터 성능이 매우 향상된 2010년대 이후로는 랩톱 한 대만 가지고도 PCM 기반의 녹음부터 마스터링까지 음반/방송 프로그램 제작의 전 과정을 무리 없이 수행할 수 있다. 한 마디로 가성비가 매우 좋다. 디지털 음향 기술이 보급되면서 일반 대중들도 스튜디오급 음질의 음향을 집에서도 쉽게 즐길 수 있게 되었다.

센서 신호의 처리에도 쓰인다. 아두이노에도 10비트 PCM ADC가 들어가 있다.

아날로그, 디지털 방식 모두 장비의 헤드룸을 넘어갈 만큼의 신호가 입력되면 왜곡되는 것은 같다. 다만, 아날로그에서는 장비의 헤드룸을 벗어나면 클리핑이 발생해 왜곡이 발생하더라도 일정 범위까지는 파형이 부드럽게 곡선 형태로 찌그러진다. 반면, 디지털에서는 헤드룸의 범위를 넘어가는 부분은 양자화 시킬 수가 없어 파형이 네모파 형태로 잘리는 클리핑 현상이 발생한다. 바로 이 부분에서 청감상으로 드러나는 중대한 차이가 생기는 것이다. 디지털에서 클리핑이 발생하면 원래 입력 신호에는 존재하지 않았던 고조파가 홀수배음 형태로 차례로 생성되면서 청감상 거슬리는 소리를 만들어낸다.[6] 아날로그도 이 부분에서 왜곡이 발생하는 것은 동일하지만, 클리핑이 일어나더라도 청감상 부드럽게 들리는 짝수 배음 형태의 신호가 원래 신호에 더 추가되면서 귀에 덜 거슬리게 들리는 것이다. 그러나 이것도 일정 범위 안에서의 얘기고, 헤드룸을 심각하게 넘기는 큰 소리가 입력될 경우엔 아날로그, 디지털 가릴 것 없이 홀수배음 고조파(Harmonic)가 매우 커지면서 원래 소리를 크게 변형시키게 된다.

5. 관련 문서


[1] 양자화라고 하니까 되게 어려운 말처럼 보이지만 그냥 숫자로 크기를 표현한다는 뜻이다.[2] 나이퀴스트 이론의 더 자세한 설명은 디지털 항목 참조[3] 특히 요즘 비디오 게임, 애니메이션, 방송, 드라마, 영화, 음악 등 미디어 컨텐츠 시장에서는 PCM 음원이 사실상 '대세'로서 군림하고 있다.[4] 샘플링, 양자화, 부호화 등으로도 쓰임.[5] 다만 용량이나 다채널 지원에 약점이 있기 때문에, 주로 스테레오 녹음된 TV 애니메이션이나 드라마, 돌비 스테레오 이전 고전 영화/애니메이션 DVD/블루레이에서 주로 채용하는 편이다.[6] 이를 고조파 왜곡(Harmonic Distortion)이라고 한다.

분류