음성 합성 엔진

{{{#!wiki style="margin: -5px -10px; padding: 10px 0; background-image: linear-gradient(to right, #33CCCC , #00a495)" 음성 합성 엔진 {{{#!wiki style="margin-top:5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="letter-spacing: -.2px; margin:0 -1px -11px; word-break:keep-all"	<tablewidth=100%> 소프트웨어	VOCALOID (틀) · CeVIO (틀) · UTAU · Synthesizer V (틀) · VOICEROID · 보카리나 (틀) · DeepVocal · NEUTRINO · A.I.VOICE · VOICEVOX · ACE Studio · VOICEPEAK · Voice Engine · Vocoflex
악곡	오리지널 곡 (하츠네 미쿠 · 카가미네 린·렌 · GUMI · IA · 시유 · 유니 · 합창) · 프로듀서 · 미디어 믹스 (정식발매)
전당입성	VOCALOID (2007~2010 · 2011~2015 · 2016~2020 · 2021~2025) · CeVIO · Synthesizer V · VOICEVOX · NEUTRINO
전설입성	VOCALOID · CeVIO · UTAU · Synthesizer V · NEUTRINO
신화입성	VOCALOID
랭킹 및 차트	주간 VOCAL Character (1위 목록) · 주간 UTAU 랭킹 1위 · Billboard JAPAN 니코니코 VOCALOID SONGS · VOCALOID 프로듀서 · 오리지널 곡 재생수 순위
반주기 수록곡	한국 노래방 · 일본 가라오케
기타	MikuMikuDance · 오역 · 조교 · 논란 및 사건 사고 · 관련 웹사이트 · 동인설정 · 나무위키 음성 합성 엔진 프로젝트	}}}_{음성 합성 엔진 분류 둘러보기}}}}}}}}}}

1. 개요2. 명칭에 대해3. 엔진 목록4. 프로듀서5. 오리지널 곡6. 동인설정7. 미디어 믹스8. 논란 및 사건 사고9. 관련 기업10. 관련 문서

1. 개요

음성 합성 엔진(音聲合成 Engine)은 인간의 육성 혹은 그와 비슷한 주파수의 합성으로 인공 음성(人口音聲)을 만들 수 있는 소프트웨어를 말한다. 대표적인 예시로는 보컬로이드가 있다.

이런 엔진들로 가동하는 음성 데이터베이스 캐릭터[1]를 음성 합성 엔진으로 뭉뚱그려서 지칭하는 경우가 SNS등지에서 종종 보이는데, 에디터나 프로그램 자체가 음성 합성 엔진인 것이지, 음성 데이터베이스 캐릭터는 음성 합성 엔진이 아니다.

2. 명칭에 대해

'음성 합성 엔진'의 사전적 의미에 따르면 모든 종류의 Text to Speech가 이 분류에 속하지만, '음성 합성 엔진 팬덤'(구 보컬로이드 팬덤)에서는 일반적으로는 음성 샘플을 사용한 가창 음성 합성(Singing Voice Synthesize) 중에서도 대체로 이미지 캐릭터가 붙은 것[2]만을 가리킨다. 이렇게 된 것은 당초에 VOCALOID와 가장 인기 있던 라이브러리인 하츠네 미쿠 중심으로 팬덤이 형성되었기 때문이다. 이 당시에는 야마하의 등록 상표였던 VOCALOID가 SVS 전체를 대표하는 대명사로 불렸으나, 하츠네 미쿠의 개발사 크립톤 퓨처 미디어가 VOCALOID로부터 독립하여 자주 제작 엔진 하츠네 미쿠 NT를 발매하였고, 동시기에 Synthesizer V나 CeVIO 등의 경쟁 상품들이 등장하여 더 이상 VOCALOID가 SVS를 대표하기 어려워졌다. 이로 인해 주간 VOCALOID 랭킹이 주간 VOCAL Character 랭킹으로 이름이 바뀌는 등 VOCALOID에 한정되지 않은 SVS 제품군의 명칭에 대한 논의가 있었고, 한국에서는 '음성 합성 엔진'이라는 다소 포괄적인 명칭으로 정착하였다. 실제로 CeVIO 등 일부 제품군의 경우 SVS이면서 TTS를 겸하고 있는 경우가 있다.

다만 상표의 보통명사화로 간주해서 계속 보컬로이드라는 명칭을 고수하는 사람도 적지 않다.

일본에서는 가성 합성 소프트(歌声合成ソフト) 또는 보카로 소프트(ボカロソフト) 라고 주로 불리며, 음성 합성 소프트(音声合成ソフト)는 마찬가지로 SVS와 TTS를 포괄하는 명칭이다. 영어권에서는 Singing Voice Synthesizer 또는 Vocal Synthesizer[3]라고 하는데, 이쪽은 '보카로 팬덤'과 관계없이 (물론 특성상 보카로 팬덤의 파이가 크긴 하지만) 모든 SVS를 통칭한다.

3. 엔진 목록

4. 프로듀서

자세한 내용은 음성 합성 엔진/프로듀서 문서 참고하십시오.

5. 오리지널 곡

자세한 내용은 음성 합성 엔진 오리지널 곡 문서 참고하십시오.

6. 동인설정

자세한 내용은 음성 합성 엔진/동인설정 문서 참고하십시오.

7. 미디어 믹스

자세한 내용은 음성 합성 엔진/미디어 믹스 문서 참고하십시오.

8. 논란 및 사건 사고

자세한 내용은 음성 합성 엔진/논란 및 사건 사고 문서 참고하십시오.

9. 관련 기업

자세한 내용은 분류:음성 합성 엔진/회사 문서 참고하십시오.

10. 관련 문서

[1] 캐릭터가 없는 라이브러리도 있다. 주로 상업이용이 가능하며 캐릭터가 있는것보다 저렴하여 TTS의 경우 세트로 판매된다[2] 이미지 캐릭터가 붙지 않은 가창 음성 합성의 역사는 VOCALOID보다도 더 오래되었으며, 현재에도 합성 성악은 꾸준히 연구 및 활용되고 있다. 솔로가 아닌 코러스에 한한다면 재현시 요구하는 정밀도가 낮기 때문에 수요도 어느 정도 존재한다. 다만 방송물의 배경음악, 게임 배경음악 등 산업디자인의 요소로서만 주로 활용되며 SVS 그 자체를 가수로서 내세워 상업적 성공을 거둔 예는 하츠네 미쿠 이외에는 극히 적다. 음성 합성 엔진 팬덤에서 취급하는 SVS 음원 중에서 이미지 캐릭터가 붙지 않은 것도 있으며(VY 시리즈) 반대로 TTS에 이미지 캐릭터가 붙어도 취급하지 않는 경우가 있으므로(타입캐스트) 절대적인 요건은 아니다.[3] 한국어와 일본어에서 쓰이는 가창이라는 의미의 '보컬'과 달리 영어의 vocal은 그냥 단순히 '음성의' 라는 뜻이기 때문에 오히려 이 쪽이 모호한 단어이고, 노래소리임을 명확히 할 필요가 있으면 Singing Voice Synthesize라고 해야 한다.