🎵 오디오 코덱 | |||
{{{#!wiki style="margin: 0 -10px -5px; min-height: 26px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -6px -1.5px -13px" | <colbgcolor=#555>손실 압축 | <colbgcolor=#555><colcolor=#fff>일반 | MP1 · MP2 · MP3 · mp3PRO · AAC · Musepack · WMA · Vorbis · Opus · USAC |
음성 특화 | AMR-NB · AMR-WB · AMR-WB+ · WMA Voice · Speex · Opus · Codec 2 · EVS · Lyra | ||
다중채널 특화 | AC-3 · SDDS · DTS · AC-4 | ||
블루투스 | SBC · aptX · AAC · LDAC · SSC(Samsung Seamless Codec · Samsung Scalable Codec) · LC3 | ||
무손실 압축 | FLAC · ALAC · APE · TAK · WMA Lossless · TTA · WavPack | ||
무손실 무압축 | PCM (WAV · AIFF) | ||
관련 문서: MIDI · DSD | |||
관련 틀: 그래픽 · 오디오 · 비디오 |
1. 개요
Adaptive Multi-Rate Wideband. 무선 통신용으로 널리 사용되는 음성 코덱. 노키아와 보이스에이지(VoiceAge)가 개발했고 보이스에이지가 라이선스를 가지고있다.2002년경 만들어졌고, 2010년 전후(한국은 2012년 이후)로 널리 사용되기 시작되었다.
한국의 VoLTE에서는 24kbps, 3G HD Voice에서는 12kbps 대역폭을 사용한다.
2. 상세 내용 및 사양
음성이라는 한정된 조건을 이용하여 전화통화[1] 같은 특정 상황 아래서 극강의 효율을 낼 수 있는 코덱이다.[2]AMR-NB 코덱의 업그레이드 버전으로, 300-3400 Hz만 전달하는 AMR-NB에 비해 더 넓은(50-7000 Hz) 대역폭의 음성을 전달한다. 이로 인해 소위 먹먹한 소리에서 벗어나 보다 향상된 음성 품질을 제공한다.[3] AMR-NB 대비, 8kbps 이상이라면, 같은 대역폭에서도 음성품질이 좋으며, 더 높은 비트레이트를 지원한다.
모노 12kbps 미만에서는 Speex[4], Opus보다 효율이 좋다.#도표(mono 기준) 음악 코덱인 HE-AAC보다 더 깔끔한 음성을 전달한다. USAC 같은 최신코덱보다는 성능이 뒤쳐지지만, 이러한 최신코덱은 호환성이 낮다.
확장자는 보통 .awb를 사용하며, 3gp[5], 3g2 컨테이너에서 사용 가능하다.
- 샘플링 레이트 : 16 kHz
- 대역폭 : 50 ~ 7000 Hz
- 비트 레이트 : 6.6 / 8.85 / 12.65 / 14.25 / 15.85 / 18.25 / 19.85 / 23.05 / 23.85 kbps
- 채널 : 모노(1채널)
3. 여담
- 전화통화용 코덱으로 널리 쓰이고 있는데, 기타 음성 위주의 컨텐츠 용으로도 활용하면 MP3나 AAC 대비 용량을 크게 절약할 수 있다. 원본 품질에 따라 1/10까지 줄일 수도 있다.
- 가령, 영어 mp3, 인터넷 강의, 강의 녹음, 인터뷰 녹음 등, 감상할 일 없고 그저 내용만 알아들으면 되는 컨텐츠들을 AMR-WB[6]로 인코딩하여 메모리를 차지하는 용량을 줄일 수 있다.[7]
- 다만, 음성파일이 용량이 얼마 나가는 물건이 아니기 때문에 용량을 크게 줄여도 눈에 크게 띄지 않는다는 게 문제다. 1MB 짜리를 반으로 줄여봐야 0.5MB, 1/10로 줄여도 0.9MB밖에 절약을 못한다.
- 호환성 이슈도 있다. MP3 플레이어를 쓰는 사람이 있다면 MP3 외 파일들에 대한 호환성 문제를 겪을 것이다. 이는 굳이 MP3 파일들을 다른 파일로 인코딩하지 않게 하는 장벽이 된다. 아이폰의 경우도 제한된 코덱만 지원하는 경향이 있다. (FLAC 지원한 지가 얼마 안 된다.) 그 외의 경우, 다수의 유명한 코덱은 재생이 가능하지만, 몇몇 앱이 해당 파일을 음악 파일로 인식 못 해서 재생을 못하는 문제가 발생하기도 한다. (Speex 같이 흔치 않은 파일이 그러하다. Opus는 그나마 낫다. 최신 코덱이라 아직 지원하지 못하는 경우가 있을 뿐 시간이 흐르면 해결이 될 것으로 예상된다.)
- 2010년대 후반 이후로는 음향기기 음질이 상향 평준화되어 AMR-WB도 거슬릴 수 있으므로 Opus 16~32kbps가 차라리 낫다.
- 대략 8kbps 근처의 극한 대역폭에서는 음원 종류에 따라 코덱(AMR, HE-AAC, Opus 등)의 평가가 크게 갈리기도 한다. 음성과 음악의 인코딩 결과가 코덱에 따라 퀄리티가 갈리는 것은 잘 알려져 있는 사실이며, 더 나아가 "1인 음성", "보이스 오버(내레이션)", "여러 음성(합창)", "악기 1개", "악기 여러 개(오케스트라)" "박수 소리"[8] 등의 상황에 따라 결과가 천차만별이기 때문에 소리 원본에 따라 적절한 코덱과 대역폭을 선택해야 한다. 도표상 같은 퀄리티라고 표시되어 있어도 AMR-WB가 음성만큼은 더 또렷하게 들려줄 여지도 있음을 염두에 두는 것이 좋다.
- 위키피디아에서는 별도로 Speech coding 문서가 마련되어 있다. 이름 모를 오래된 전화통화 코덱들이 많으며, 인터넷전화(voIP), 화상회의(Skype), 웹앱(WebRTC) 등이 뜨던 시절에 여러 음성코덱이 발전했다.
그 많던 코덱은 누가 다 먹었을까(...)이름 모를 코덱 중에는 음성인식 및 음성안내를 위한 무손실[9] 코덱도 있지만 본 문서의 범주를 넘어가므로 자세한 설명은 생략한다. - 최신 저대역폭 용도로 아래와 같은 코덱들이 있다.[10]
- AMR-WB+(2004) - 직계 후속 코덱이다.
- Codec 2(2010) - 0.45~3.2kbps의 비트레이트를 지원하여 AMR-NB보다 용량을 훨씬 줄일 수 있지만 음질은 더욱 나쁘다. 1kbps 미만에서는 내용을 알아듣기도 힘들어진다. HF, VHF의 대역에서 사용할 전제로 소리를 협대역(Narrow Band = 8kHz)으로 샘플링한다.
- USAC(2012) - 디지털 라디오용 코덱
- EVS(2014) - VoLTE "HD보이스+"용 코덱
- Lyra(2021) - 구글에서 제작중인 3.2~9.2kbps 저 비트레이트에서 고음질 음성을 전송하기 위한 음성/화상통화용 코덱이다. 머신러닝을 활용하며, 쓸데없는 데이터량을 줄이기 위해 노이즈 캔슬링도 된다. 음성 샘플
[1] 음성이라는 한정된 주파수 영역 바깥을 고려할 필요가 없다던가, 1인 목소리(=음원 1개)라 소리가 겹치지 않는다는 등 전화통화만의 특정 조건이 있다.[2] 반대로 음악소리라도 들어가면 소리 품질은 엉망이 된다. 심지어 육성이라 할지라도 노래라도 부른다면 인코딩 품질과 효율이 엉망이 된다 카더라 한다(...)[3] 절대적인 음성 품질이 좋다는 얘기는 아니다. 원음만큼 품질이 좋기에는 저 낮은 대역폭에서 애초에 불가능한 일이며, 조금 더 높은 대역폭을 제공하고자 하면 opus같은 다른 코덱이 더 유용한 상황을 맞이하게 된다.[4] Speex가 AMR보다 좋다고 하는 그래프는 AMR-NB와 비교하는 그래프이다.#[5] mp4 컨테이너가 널리 사용되기 직전 3G 피처폰 및 옴니아시절, 고용량 미디어는 mov, 스트리밍 미디어는 3gp(skm, k3g) 컨테이너를 사용했었다.[6] AMR-NB(4.75~12.2kbps)나 Codec 2(0.45~3.2kbps)를 이용하면 용량을 극한으로 줄일 수 있지만, 소리가 많이 먹먹해져 점점 졸리게 되는 기술 외적인 문제가 발생하며 1kbps 미만에서는 애초에 내용을 알아듣기도 힘들다.[7] HDD가격과 NAND 가격의 격차가 있고, 스마트폰은 비싸고 저용량인 microSD나 USB 메모리로만 용량 확장을 할 수 있다는 점 때문에 용량이 은근 신경쓰일 수도 있다. 1TB microSD가 출시되어 있기 때문에, 인코딩에 들이는 시간과 노력을 아껴 고용량 메모리를 사고 용량을 신경 쓰지 않는 사람들이 훨씬 더 많은 편이지만, 가끔 갤럭시 S6나 갤럭시 S21처럼 외장 microSD를 지원하지 않아 용량 증설이 불가능한 제품들이 주기적으로 종종 튀어나오기 때문에 갑자기 용량 절약이 필요해질 수도 있다.[8] 거슬리지 않으려면 넉넉한 대역폭을 제공해주어야 한다. 보통 타악기 소리가 그러한 경향을 띈다.[9] 기계가 잘 알아들을 수 있게 소리를 왜곡 손실 압축하지 않는다.[10] 일반인 입장에서는 안드로이드 지원 코덱#이나 기타 OS 지원 코덱#에 뜬 이후에 관심을 가져도 늦지 않으며, 특허가 만료되기 전까지는 아래 코덱들이 AMR-WB나 Opus를 제치고 관심을 받을 여지가 매우 적다. 따라서 AMR-WB의 미래는 여전히 밝다(?) 오래도록 지원될 여지가 높다.