역사비교언어학

역사비교언어학 Historical Comparative Linguistics
{{{#!wiki style="margin:0 -10px -5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-6px -1px -11px; word-break: keep-all"	<colbgcolor=#DEB887,#261f16><colcolor=#fff> 음운 변화	그림의 법칙 · 베르너의 법칙 · 제2차 자음 추이 · 모음 변화(대모음 추이)
분류	어족(언어) · 어파 · 어군 · 미분류 언어 · 고립어
제어	우랄 알타이 제어 · 알타이 제어 · 코이산 제어 · 대만 제어 · 고시베리아 제어 · 고유럽 제어 · 인도유럽 이전 언어 · 아메리카 원주민 제어 · 유대 제어
기층 언어	게르만어파 기층설 · 바스크어 기층설 · 고히스파니아 제어 · 게일어 기층설 · 그리스어 기층설 · 반도 일본어설 · 핀우그르어파 기층설
개념	언어의 역사성 · 조어 · 기층이론 · 동원어 · 가짜동족어	}}}}}}}}}

1. 개요2. 통시 언어학3. 역사 비교 언어학은 과학인가?4. 역사비교언어학의 역사

4.1. 언어연대학(glottochronology)

5. 연구방법론

5.1. 비교방법(comparative method)5.2. 재구(reconstruction)

5.2.1. 비교 재구(comparative reconstruction)5.2.2. 내적 재구(internal reconstruction)

6. 필요한 지식7. 필요한 자세8. 참고 문헌9. 나무위키에 문서가 존재하는 역사 비교 언어학자10. 관련 문헌11. 관련 문서

1. 개요

歷史比較言語學 / Historical comparative linguistics

*h₂ówis h₁ék’wōskʷe [Lühr,2008]
양과 말들
{{{#!folding [ 전문 보기 ]

*h₂ówis h₁ék’wōskʷe
*h₂ówis, (H)jésmin h₂wlh₂néh₂ ne éh₁est, dedork’e (h₁)ék’wons, tóm, wóg’ʰom gʷérh₂um wég’ʰontm, tóm, bʰórom még’oh₂m, tóm, dʰg’ʰémonm h₂oHk’ú bʰérontm. h₂ówis (h₁)ék’wobʰos ewewkʷe(t): k’ḗrd h₂gʰnutoj moj widntéj dʰg’ʰmónm (h₁)ék’wons h₂ég’ontm. (h₁)ék’wōs ewewkʷ: k’ludʰí, h₂ówi! k’ḗrd h₂gʰnutoj widntbʰós: dʰg’ʰémō(n), pótis, h₂wlnéh₂m h₂ówjom kʷnewti sébʰoj gʷʰérmom wéstrom; h₂éwibʰoskʷe h₂wlh₂néh₂ né h₁esti. Tód k’ek’luwṓs h₂ówis h₂ég’rom ebʰuge(t).

번역
털이 없는 양이 말들을 보았다. 한 마리는 큰 수레를 끌고 있었고, 한 마리는 큰 짐을 싣고 있었으며, 한 마리는 사람을 재빠르게 나르고 있었다. 양이 말들에게 말했다. 인간이 말들을 몰고 있는 모습을 보고 있으니 내 마음이 아프구나. 말들은 말했다. 듣거라 양아. 주인이 양들의 털로 자신을 위한 따뜻한 옷을 만든다는 것을 알고 있자니 마음이 아프구나. 그리고 양은 털이 없구나. 이 말을 들은 양은 들로 도망쳤다.

}}}

슐라이허의 우화(Schleicher's fable))라고도 불리는 '양과 말들'은 최초로 인도유럽조어로 재구성된 이야기다. 물론 인도유럽조어의 화자들의 사용한 언어와 문법적으로나 어휘적으로 일치할지는 미지수다. 하지만 모든 인도유럽어족의 언어들이 여기 사용된 인도유럽조어란 가상의 언어로부터 분화해 나왔음은 (혹은 인도유럽조어란 언어를 공통조상으로 하는 것은) 명확하다.

혹자에겐 망상적인 단어들의 집합일지 모르는 슐라이허의 우화의 가치는 이미 분화해 버린 언어들 속에서 개별 언어들의 변화 과정을 포착하고 역추적하여 성공적으로 하나의 언어로 재구성했을 뿐만 아니라, 이로써 완벽한 문장을 만들어 냈음에 있다.

역사비교언어학은 개별 언어의 통시적인 변화 과정을 포착, 기술하고(역사 언어학), 이를 바탕으로 언어들을 비교해(비교 언어학) 계통을 알아내고, 기록되지 않은 이들의 공통 조상(조어, Proto-language)을 추적하는 언어학의 한 분야이다. 즉, 역사비교언어학은 역사언어학과 비교언어학이 합쳐진 학문이다.

언어를 횡적으로 연구하는 공시 언어학과는 다르게, 언어의 변화뿐만 아니라 언어(엄밀히는 어휘를)를 비교하기 때문에 역사 비교 언어학에서 가장 중요한 연구 대상은 단언컨대 사료와 막대한 양의 언어 자료라고 할 수 있다. 이를 바탕으로 역사 비교 언어학이 가지는 연구 목표들은 다음과 같다.

(1) 이 어휘의 유래는 어떻게 되는가?
(2) 개별어가 어떠한 변화와 발전을 겪었는가? 또, 그 이유는 무엇인가?
(3) 이 언어들은 같은 기원을 갖는가?
(4) 이들은 어떤 형태로 분기되어 나왔는가?
(5) 문증되지 않는 이들의 공통 조상은 어떤 형태를 하고 있었는가?

이들을 규명함으로써, 단순히 공통조어(Proto-language)라는 실존했던 가상의 언어뿐만 아니라 학자들은 고고학적, 문화학적, 인류학적 가치를 재구해낼 수 있다. 가령, 모 조어에 '배'라는 단어가 고유어로서 존재했음이 명백하다면 해당 조어를 사용하던 사람들은 배를 알고 있었을 뿐만 아니라 배를 사용했거나 바다나 강과 연관되어 있는 장소에서 기원했음을 알 수 있는 것이며, 설령 차용어라할지언정 그 출처를 추적해 두 언어 집단 간에 언어적 교류와 물리적인 접촉이 이루어졌음을 추측할 수 있다. 즉, 조어가 사용되던 당시의 인류학적 맥락을 파악하는 것이 역사 비교 언어학의 궁극적인 목표라고 할 수 있겠다.

문증되지 않는 언어를 역추적하는 것은 그 자체로 실증적이기 어렵다는 한계가 있다. 물론 역사 비교 언어학의 방법론의 정밀성을 검증한 예시는 몇 차례 존재했지만, 공통조어를 재구한다는 것은 개별어의 어휘 비교와 사료, 교차 언어적으로 빈번한 변화, 언어 일반적인 특징 등에서 개연성을 얻은 추론에 불과하다. 그러한 만큼 활발하게 학설의 수정이 일어나는 학문이다.

"정말 그렇게 말했을지는 모를 일 아닌가요?"라는 말은 모든 역사 비교 언어학자들의 정곡을 찌르는 말이다. 모든 재구는 "음운 변화는 일관적이고 절대적이다."라는 소장학파의 이념을 바탕으로 이루어진다. 하지만 "모든 어휘는 그 어휘만의 역사를 가진다."라는 프라하 학파의 말과 같이 언어 변화가 언제나 일관적이지는 않다. 한 언어 내에서도 특정 변화를 겪지 않는 어휘가 있거나, 변화를 겪은 어형과 겪지 않은 어형이 공존하는 경우, 혹은 유추나 화자의 착각으로 인해 알 수 없게 변해버린 어휘가 존재한다.[2] 자조적으로라도 역사 비교 언어학도들이 진정으로 필요로 하는 것은 갓 나온 사료나 금석문 따위가 아니라 타임머신이라고 하는 것이 아니다. 그 와중에도 인문학 그 자체 같은 역사 비교 언어학이 과학적 방법론을 통해 제일 그럴싸한 결과에 도달하는 학문이라는 것이다. 이는 고생물학과 유사하다. 절망스러운 차이점이라면 공통조어는 화석조차 남기지 않는다는 것이다. 단지 특정 가설을 지지해 주는 증거가 많거나 확실할수록 그 가설은 가설을 벗어나 정설이 되는 것이다.

현대에 와서 역사 비교 언어학은 여러 인문학이 그러하듯이 그렇게 각광받는 학문은 아니다. 냉소적으로 말하면 관심을 거의 받지 못하는 실정이다. 일단은 학문 자체가 사료를 필요로 하기도 하고, 연구할 만한 구석은 이미 100년도 전에 연구되었거니와 역사 비교 언어학과 궤를 같이 하는 인도유럽어족 연구가 제국주의적, 민족주의적인 이념에서 시작된 만큼 해체주의 열풍과 함께 해체되어버린 (광의적인) 민족의 벌판에 역사 비교 언어학은 존재감을 가질 수 없다. 고고학과 연계하여 고대나 중세 언어를 해독하는 데에 역사비교언어학이 사용되기도 하지만, 그것도 언제까지나 새로운 언어의 기록이 발견되고, 그 언어를 해독할 근연 언어 혹은 해독문 같은 근거가 존재할 경우의 이야기다. 근거 자료가 하나도 없다면 당연히 역사비교언어학이 적용될 틈 또한 없다.

영어가 가장 강력한 패권 언어가 된 21세기에서 학문적 가치가 있는 소수 민족의 언어는 대부분 겨우 기록자 한두 명만 존재하거나, 그조차 남기지 못하고 사멸했다. 그런 연고로 이런 상황에서 역사비교언어학은 형질 인류학 등 다른 학문과 연계하는 것에 의존한다. 물론 민족이 곧 언어 집단인 것은 아니지만, 그것 말고는 할 것이 없다. 이미 형질 언어학이 나오기도 전에 원시인구어 화자들의 원향이나 문화를 성공적으로 추정하는 데에 사용된 역사비교언어학이니, 그조차 불가능한 언어나 어족에 형질 인류학 같은 학문을 접목시키는 것이다.

2. 통시 언어학

공시태와 통시태의 엄격한 구분은 페르디낭 드 소쉬르 이래로 이루어져 왔다. 공시태, 공시 언어학은 시기의 횡축, 즉 현실태에 사용되는 언어에 대한 연구로 현재 논하는 일반적인 언어학은 공시 언어학을 말한다. 통시태, 통시 언어학은 시기의 종축, 즉 역사적 흐름의 축적물로서의 언어를 연구한다. 따라서 통시 언어학은 어원이나 계통, 음운 변화 등에 집중하는 반면 공시 언어학은 언중의 언어 지식에 집중한다.

쉽게 말하면 언어를 역사적으로 보는지와 비역사적으로 보는지에 따라 통시와 공시가 구분되는 것이다.

역사적인 것을 연구한다고 모두 통시 언어학인 것은 아니다. 과거 언어 자료에서 음운 규칙을 포착하는 등의 언어 현실을 연구한다면 그건 공시 언어학이다. 가령 15세기 국어의 문법을 연구한다면 그건 공시 언어학에 속한다고 볼 수 있다.[김방한,1992] 또한 공시 언어학도 음운론, 통사론, 형태론 등의 하위 분야가 있듯, 통시 언어학에도 역사 비교 언어학이라는 하위 분야가 있는 것이다. 물론 역사 비교 언어학, 혹은 역사 언어학의 연구 주제가 통시 언어학과 크게 차이가 있는 것은 아님에도 말이다.

3. 역사 비교 언어학은 과학인가?

사료에 묻혀 살고, 인간의 언어를 연구한다는 점에서 혹은 연구를 통해 인접한 인문학 간의 연계가 가능하다는 점에서 역사 비교 언어학은 인문학 그 자체로 보일 지도 모른다. 물론 어느 정도는 맞는 말이다. 조어를 통해 당시의 시대상이나 환경 등의 고고학적, 문화학적 가치를 창출해 낼 수 있음은 사실이고 인간의 문화를 연구한다는 인문학의 정의에도 부합하다.

하지만 역사 비교 언어학을 고리타분한 학자들이 하는 케케묵은 피상적 어원론의 중언부언이라고 생각한다면 이는 순전히 오해에 불과하다. 역사 비교 언어학은 과학적 방법론을 사용하는 엄연한 과학이다. 물론 이 진술은 과학에 조예가 없거나, 관심이 없는 사람에게는 큰 오해를 살 수 있는 말이다. 혹자라면, 역사 비교 언어학이 과학이라면 끝에 가선 결국 수학으로 환원되어 버릴테니 역사 비교 언어학은 수리 역사 비교 언어학이라 불려야 하고, 나아가 반(反)헤겔적인 사고에 입각한 재구(Reconstruction)가 이루어져야 한다 애먼 주장을 펼칠 수도 있다. 하지만 이는 과학이란 동음이의어에서 발생한 착각에 불과하다.

표준국어대사전에 입각한 과학의 사전적 정의는 다음과 같다.

과학(科學) [명사] 보편적인 진리나 법칙의 발견을 목적으로 한 체계적인 지식. 넓은 뜻으로는 학(學)을 이르고, 좁은 뜻으로는 자연 과학을 이른다.

위에서 알 수 있듯, '과학'이란 단어에는 뜻이 두 가지 이상 있다. 언중들이 사용하는 '과학'은 좁은 의미로 '자연과학'이다. 자연을 연구하는 물리학과 화학과 천문학 등등 여러 학문들은 과학이다. 자연을 연구하기 때문이다.

말로야 "인간은 자연에 귀속된 존재이고 (촘스키언을 흉내내자면) 언어 또한 언어기관으로 환원될 수 있으니, 언어의 변화를 연구하는 언어학은 언어기관의 사용을 연구하는, 즉 현재의 인간 이전에 선험적으로 존재하던 자연을 연구하는 학문이다."라고 하며 과학이라고 주장할 수도 있다. 허나 이런 말장난은 아쉽게도 언제까지나 말장난에 불과한 법이다. 그런 논리대로라면 결국 모든 인문학은 과학으로 소급될 텐데, 인문학과 자연과학을 분리할 이유가 있겠는가?

역사비교언어학을 명실상부 과학이라 부를 수 있는 까닭은 과학적 방법론에 입각한 연구를 하기 때문이다. 과학은 비단 자연과학이 아니라, 과학적 방법론에 입각한 학문을 부르는 이름이기도 하다. 역사비교언어학은 가설-연역적 모델(hypothetico-deductive model)에 충실한 연구를 한다. 과학은 과학적 방법론을 사용하여 '관측 가능한 현상에 대한 검증 가능한 예측(Testable predictions of an observable phenomena)'을 하는 학문이고, 가설-연역적 모델은 흔히 말하는 관찰-가설-입증-이론을 무한히 반복하는 방법론이다.

이를 이제 역사 비교 언어학적으로 설명하자면, 두 개의 임의의 언어의 대응을 찾는 상황을 가정해보자. 물론 수많은 방법론이 존재하겠지만 대응을 찾는 예상 가능한 방법론은 다음과 같다. 절대 다음 방법론이 유일한 방법론이라는 뜻은 아니다.

(1) 의미가 같은 (혹은 모종의 근거를 통해 선정된) 어휘 간 대조 (관찰)
(2) 어형 비교를 통한 임시의 규칙 도출 (가설)
(3) 임시로 도출된 대응 통한 어형 예측 (입증)
(4) 성공적인 대응 발견 (이론)
(5) 실패 시, 성공적인 발견이 이루어질 때까지 (1)에서부터 (3)까지를 반복

(2)과 (3)번 과정에서 높은 통찰력과 직관, 경험을 요구하는 것은 사실이다. 하지만 그것은 대응을 더 빠르고 정확하게 찾기 위한 도구에 불과하다. 이는 여느 과학에서든 동일하다. 여기서 발견된 대응은 'A → B / _C'와 같은 식으로 기술된다. 수식과도 유사하다. 물론 항상 이러한 것은 아니지만, 대부분 이러하다.

역사 비교 언어학은 구조주의가 세계를 지배하던 20세기와 크게 달라지지 않았기 때문에, 이유를 규명하는 현대 언어학에 비해 과정을 기술하는 데에 조금 더 중점을 둔다. 이는 과학적 방법론의 난점이기도 하지만 이미 수천 년 전에 사라져버린 언어의 화자가 말하는 음성이 담긴 음성 파일이 고고학자에게 발견될 일도 없거니와, 물리학 대학원생의 우연한 발견이 타임머신의 발명으로까지 이어질 일은 유감스럽게도 없다. 대응을 통한 규칙 발견이나 재구는 엄연히 추측과 추론의 영역이기 때문에 교차 언어적, 언어 일반적 설명으로 개연성을 얻을 뿐이지 완벽한 원인 설명은 어려운 경우가 많다. 또한 한 언어 혹은 소수의 언어에만 특수하게 존재하는 변화도 있기 마련이기 때문에 경향성에만 의존할 수도 없는 일이다.[4]

물론 과거 존재했던 음운 규칙(공시적)이나 음운 변화(통시적)에 대한 음성적 원인 규명을 시도하는 경우도, 또 이에 성공하는 경우도 꽤나 존재하지만 이는 현존하는 언어를 통해 규명하는 것이지 이미 사라진 언어를 재료로 연구하는 것이 아니다. 마치 공룡 수의학이 발생할 수 없는 것처럼 실증적인 역사 음성학은 그 자체로 언어도단이다. 역사 비교 언어학에서의 주 목표는 '규칙의 기술'이지 규명이 아니다.

가령 기록적으로 연속적인 모 언어와 그 언어의 고어에서 r → p라는 굉장히 생소한 변화를 관측했다고 해보자. 또, 해당 변화가 그 언어에서 발생하기까지 500년 시간차가 있었지만 그 사이 기록은 전무하다고 가정해보자.[5]. 변화의 원인을 규명하려면 500년간 존재해온 변화의 중간 과정이나, 해당 언어의 음성 자료가 필요하다. 하지만 일반적인 역사 언어학자가 이런 것들을 구할 수 있을까? 사료를 발굴하기란 고고학자들의 몫이고, 음성기록장치가 발명되기 이전에 소멸해버린 언어의 음성적 자료를 얻기란 타임머신이 나오기 전까지는 얼토당토않은 일이다. 비탄하며 아무리 연구실 인근 땅을 파도 고고학적 지식이 전무할 역사 언어학자에게 사료나 기록이 적힌 유물이 발견될 확률은 없는 것이나 다름없다.

결국 고고학자나 지질학자, 고생물학자가 아니라면 땅을 파도 돈(연구비)은 나오지 않는다는 옛말에는 틀린 것이 하나도 없다는 생각을 되새기며, 일단 규칙을 적고 보자는 결론에 도달할 수밖에 없다. 이 때문에 규명보단 기술에 초점을 두던 20세기 구조주의 언어학에서 크게 달라지지 않았다고 말한다. 이런 점이 역사비교언어학을 비과학적인 학문으로 만들진 않는다. 명쾌한 정답이란 난해하기 마련이다. 하지만 역사비교언어학은 언제나 과학적 방법론에 입각해 임의의 형태를 예측 가능한 대응과 변화를 찾는 데에 중점을 둔다. 그러니 응당 과학이라 불려야 할 일이다.

혹자는 규칙이나 대응 없이 현대 어형의 유사성에만 주목하는 논의(주로 칼럼)를 보고, 역사 비교 언어학은 비과학적인, 실로 인문학적인 학문이라고 할 수도 있다. 물론 어원이나 의미 변화를 논할 때에 (경향성은 존재할지언정) 일반적인 규칙을 찾기란 불가능하다. 그런 건 역사비교언어학에서도 어원론이란 분야이다.

현대 어형만 비교하여 단순히 의미적 유사성이나 임의의 공통점으로 어원을 공유한다고 하는 등의 논의는 유사언어학으로 부르자는 사회적 합의가 이미 존재한다. 그런 어슬프되 이해하기 쉬운 논의를 하는 인물들은 대개 역사언어학 전공자가 아니다. 다양한 방법론이 존재하는 역사 비교 언어학이지만, 피상적인 결과물만을 보고 피상적인 논의를 이어나가며, 과학적인 근거를 제시하지 않는 것은 학문은 유사 학문이라 불리기 마련이다. 역사비교언어학의 방법론에서 벗어나 과학적 방법론을 지키지 않는다면 역사비교언어학이 아니다.

4. 역사비교언어학의 역사

4.1. 언어연대학(glottochronology)

모리스 스와데시는 두 가지 가정을 통해 언어가 분기한 시기를 어림할 수 있다고 주장하였다.[Swadesh,1950]

(1) 모든 언어에는 비교적으로 안정된 기본어휘(basic vocabulary)가 존재한다.
(2) 기초어휘는 일정한 속도로 변화한다.

스와데시는 위와 같은 가정을 바탕으로, 언어의 분기 시기를 판단할 수 있는 방정식을 개발하였고, 이를 통해 대략적인 연대를 파악하는 방법론을 제창하였다. 이를 언어연대학이라 부른다. 기본어휘는 개별 언어에서도 차용에 저항하고 일정한 비율로 대체되기 때문에, 탄소의 반감기를 이용하는 탄소연대측정법처럼 이를 바탕으로 언어가 분기한 시간을 측정할 수 있다는 게 언어연대학의 기본 논지다. 역사비교언어학의 연대측정법이라 할 수 있겠다.

스와데시 목록(swadesh list)이라고도 불리는, 스와데시가 제시한 기본어휘는 100개로 다음과 같다.[7][Swadesh,1955]

[ 스와데시 리스트 일람]

|| all || full || new || to die ||

ash	to give	night	to drink
bark	good	nose	to eat
belly	green	not	to kill
big	hair	one	to know
bird	hand	path, road	to lie down
black	head	person	to say
blood	to hear	rain	to see
bone	heart	red	to sit
breasts	horn	root	to sleep
claw	hot	round	to stand
cloud	I	sand	to swim
cold	knee	seed	to walk
dog	leaf	skin	tongue
dry	liver	small	tooth
ear	long	smoke	tree
earth, soil	louse	star	two
egg	man	stone	water
eye	many	sun	we
fat, grease	meat, flesh	tail	what
feather	moon	that	white
fire	mountain	this	who
fish	mouth	to bite	woman
to fly	name	to burn	yellow
foot	neck	to come	you

스와데시 리스트는 대명사나 신체, 천체 어휘 등 언어에 보편적으로 존재하는 개념어나 기본적인 행동인 상태를 뜻하는 동사나 형용사 등을 포함한다. 이는 이상적인 목록일 뿐이지 문화나 언어에 따라 어떠한 단어가 없거나 외래어로 대체되었을 수 있으므로 비교 언어의 특징에 맞게 조정한다.

언어연대학은 다음과 같은 수식을 바탕으로,

[math(t = \dfrac{\ln(c)}{-L})][9]

[math(L = 2\ln(r))][10]

[math(r)]은 미국의 언어학자 Robert Lees에 의해 100 단어 단위 스와데시 리스트 기준 90%의 신뢰도로 0.86라는 값을 얻었다.

따라서 다음과 같은 공식이 도출 가능하다.

[math(t = -\dfrac{\ln(c)}{2\ln(r)})]

고전 라틴어와 현대 로망스어를 통해 스와데시는 [math(L)]에 대해 0.14라는 값을 얻었다. 이는 1000년마다 14단어가 대체된다는 뜻이다.

5. 연구방법론

5.1. 비교방법(comparative method)

역사 비교 언어학인 만큼 역사 비교 언어학에서 비교를 하지 않을 수는 없을 것이다. 소위 비교방법(Comparative method)이라고 하는 기법을 통해, 계통적 관계(Genetic relationship)에 있는 2개 이상의 언어의 비교를 수행하여 공통조상의 특징을 거꾸로 추론해 낼 수 있다. 이에 대비되는 방법으로는 내적 재구(Internal reconstruction)가 있다. 이는 후술할 재구 방법론에서 자세히 언급할 것이다.

비교방법의 원칙은 둘 이상의 문증되는 언어(Attested language) 사이의 체계적인 음운론적, 의미론적 대응들을 발견하는 것이다. 절대로 유형적, 문법적인 대응이 아니다. 만일 이들 사이에서 음운론적, 의미론적 대응들이 우연한 유사성이나 차용, 유랑어(Sprachbund) 등의 언어 접촉의 결과물로 설명할 수 없을 정도로 많고 체계적이라면, 단일의 공통조상에서 유래했다고 상정해야 한다. 물론 언어 간의 의미나 음운상 변화에는 절대적인 대응이 존재하지 않으므로, 선술한 바와 같이 체계적일 필요성이 있다.

그 다음에는 규칙적인 음운 변화를 가정하여 문증가능한 어형 간 대응 관계를 설명할 수 있다면 발견된 언어적 사실을 기반으로 체계적인 조어의 재구가 가능해지는 것이다. 체계적인 음운 대응 관계를 통해 의미 대응을 해명하거나, 혹은 그 반대가 가능해진다. 이로써 재구된 언어는 앞에 흔히 별표라고 일컫는 애스터리스크 [11]를 붙인다. (c.f. *h₂ówis)

이는 비교 재구(Comparative reconstruction)에서도 동일하게 사용되는 방법론이므로, 비교 방법을 통한 재구는 내적 재구와 마찬가지로 후술할 재구 방법론에서 상세히 서술하기로 하고 이 문단에서는 계통을 확정짓는 방법에 대해 설명할 것이다.

다음을 보라. 다음은 인도유럽어족에 속하는 언어들의 어휘를 아주 조금만 나열한 표다.

의미	산스크리트어	라틴어	고전 그리스어	영어
아버지	पितृ (pitṛ)	pater	πατήρ ‎(patḗr)	father
어머니	मातृ (mā́tṛ)	māter	μήτηρ (mḗtēr)	mother
발	पद् ‎(pád)	pēs	πούς ‎(poús)	foot
별	स्तृ ‎(stṛ́)	stēlla	ᾰ̓στήρ ‎(astḗr)	star
나	अहम् ‎(ahám)	egō	ἐγώ ‎(egṓ)	I
너	त्वम् (tvám)	tū	σῠ́ (sú)	thou [12]

산스크리트어와 라틴어, 고전 그리스어, 영어는 모두 실존했거나 실존하는 언어다. 저 표만 보면 역사 비교 언어학에 조예가 없는 사람들도 닮았다는 것을 느낄 정도로 어형이 유사하다. 실제로 인도유럽조어는 처음 제시되었을 때부터 그 존재를 크게 의심받지는 않았다. 물론 일반적인 비교 방법에서 겨우 6개의 어휘만을 택해서는 안 될 일이다. 또한 언어의 의미는 변화한다. 말인즉슨, 같은 어휘에서 유래하였다고 한들 그 의미마저 동일할 것이란 보장은 없는 것이다. 가령 바퀴를 뜻하는 영단어 wheel은 원시인구어의 *kʷékʷlos에서 유래했다고 추정된다. 하지만 같은 조상단어에서 유래한 듯한 라트비아어의 kakls는 (사람이나 짐승의) 목을 뜻한다.

따라서 역사비교언어학자들은 우선 어원이 같다는, 즉 동원이라고 추정할 가치가 있는 단어들을 선정하는 작업을 해야 한다. 동원이라고 판단한 근거에는 의미가 반영 되었을 수도 있고, 문법적, 음운론적 유사성이 있을 수 있다. 어느 것에 중점을 두는지는 학자 개개인의 재량이지만 친족관계가 불분명하지만 문증은 가능한 언어들의 어형이 알려졌다면, 다음과 같은 방법으로 어휘 간 의미 대응을 확정지을 수 있다.

(1) 어형은 다르지만 하나의 공통적 의미로 소급될 때 두 형태는 의미 상 대응관계가 성립한다.
(2) 음성적으로 유사한 두 어형의 의미가 다르지만, 그 유사한 두 어형들이 유래한 어형의 의미와 동일함이 확증된다면 이러한 어형은 대응 관계에 있다고 본다.
(3) 음성적으로 유사한 두 어형의 의미는 다르지만, 그 유사한 두 어형이 동일한 의미에서 파생되었음이 입증된다면 이러한 어형들은 서로 대응 관계에 있다고 본다.

이러한 방식으로 의미의 대응관계를 설명하는 것을 어원론이라 부른다.

위와 같은 방식들로 충분한 질량의 어휘를 선별하는 작업이 끝났다면 해야할 것은 이들을 정렬한 뒤, 비교를 통해 어형 간 대응을 찾는 것이다. 대응을 발견한다면 대응이 발견된 단어는 단일어에서 유래한 동원어(Cognate)라고 결론 지을 수 있다. 당연한 이야기지만 음운 대응과 연관된 단어나 발견한 음운 대응의 수가 많을수록 친족어일 가능성이 높다. 이런 대응을 발견하는 과정에서 선술한 귀납-연역적 모델식 반복 작업을 계속 해야 한다.

음운 법칙이 없는 외면상 유사성은 동원어임을 임증해주지 못한다. 거친, 딱딱한 등을 뜻하는 라틴어 durus와 둘을 뜻하는 라틴어 duo는 각각 오랜 시간을 뜻하는 아르메니아어 'երկար(erkar)와 둘을 뜻하는 아르메니아어 'երկու(erku)'와 동원이다. 여기서 발견할 수 있는 건 라틴어의 'du'와 아르메니아어의 'erk'는 서로 대응관계에 있다는 것이다. 이는 직관적으로 알 수 있는 외면적인 유사성보다는 대응의 규칙성이 계통을 증명하는 데에 유의미함을 시사한다.

다음은 일본어와 일본어족 류큐어파에 속하는 언어들의 어휘와 그것을 음소별로 정리한 대응표다.

사람을 뜻하는 일본어족 언어의 어휘들
일본어	오키나와어	야에야마어	미야코어	요나구니어
hito	pitu	pïtu	pstu	t'u

대응표
일본어	오키나와어	야에야마어	미야코어	요나구니어
h	p	p	p	ø
i	i	ï	s	ø
t	t	t	t	t'
o	u	u	u	u

어휘 하나를 비교했기에 꽤나 쉽게 대응관계를 찾을 수 있다. 특히 요나구니어의 t'가 눈에 띈다. 요나구니어는 특이하게도 한국어의 된소리와 유사한 성문음화 된 음들이 존재한다. 표에서 사실 엄밀히 하면 일본어의 'hit'에 해당하는 부분이 요나구니어의 t'에 대응되는 것인데, 간략화하여 CVt : t' (C는 자음, V는 모음을 의미한다)라는 대응을 상정할 수 있다. 그럼 저 어휘에서 발견된 대응들이 다른 어휘에서도 발견되는 지 확인해보자.

불을 뜻하는 일본어족 언어의 어휘들
일본어	오키나와어	야에야마어	미야코어	요나구니어
hi	fii	pï	ps	ts'i

오키나와어와 요나구니어를 제외하면 위 대응표와 얼추 맞는 듯 보인다. 그럼 다른 단어들도 확인해보자.

혀를 뜻하는 일본어족 언어의 어휘들
일본어	오키나와어	야에야마어	미야코어	요나구니어
sita	siba	sïta	sïda	t'a

선술한 요나구니어의 대응이 확실함을 확인할 수 있을 뿐만 아니라, 위와 마찬가지로 어휘 전반적으로 대응을 발견할 수 있다. 이를 통해 계통수를 확정지으려면 shared retention과 shared innovation이라는 개념을 이해해야 한다.

shared retention는 한 언어가 조어로부터 물려받은, 즉 보존한 특징이다. shared innovation은 한 언어에서 독자적으로 발생한 특징이다. shared innovation을 shared retention으로서 공유하고 있는 그룹은 하나의 하위 계통으로 묶일 수 있다. 이런 shared retention과 shared innovation을 활용해 오키나와어와 야에야마어, 미야코어, 요나구니어를 비교해 어떻게 분기해 나왔는지를 추측해 수 있다.

일단 저 네 가지 언어는 류큐어파라고 하는 일본어족의 하위어파에 속하고, 일본어는 일본어족 일본어파에 속한다. 위 예시를 통해 알 수 있는 류큐어파의 shared retention은 어두의 p-라고 할 수 있겠다. 상대 일본어에서 사람은 'pito_乙'이었으니, 류큐어파는 p → h라는 변화를 겪지 않았음을 알 수 있다. 일단 일본어와 류큐어가 같은 어족에 속한다는 정보로 우리는 두 어파가 분리되기 이전의 조어인 일류조어(Proto-Japanese-Ryukyuan)[13]와 류큐어파가 일본어족에서 분기해나온 초기 시점에 존재하던 류큐조어(Proto-Ryukyuan)이라는 조어가 상정 가능해진다. 그럼 본격적으로 언어들의 계통수를 확정 지을 수 있다.

우선 저 네 류큐어들에서 가장 나중에 분기되어 나온 언어는 요나구니어일 것이라고 추측해 볼 수 있다. t'는 다른 세 언어에서는 찾아볼 수 없기 때문이다. 또한 형태로 보아 저 세 류큐어 중 하나에서 분기해 나온 듯이 보이는데, 혀를 뜻하는 저 세 류큐어 어휘들과 요나구니어의 't'a'를 비교하면 요나구니어는 야에야마어에서 분기되어 나온 것처럼 보인다. 야에야마어와 미야코어는 동시대, 혹은 수형도 상에서 같은 기원을 공유할 것처럼 보인다. 두 언어는 오키나와어에는 없는 'ï'라는 모음이 있기 때문이다.

오키나와어는 저 세 언어들의 공통 조상과는 살짝 다른 공통조상을 둔 듯이 보인다. 불을 뜻하는 오키나와어 'fii'의 f와 혀를 뜻하는 오키나와어 'siba'의 b를 보존한 언어가 없기 때문이다. 특히 일본어에서 혀는 'sita'로 나타나므로 오키나와어의 'siba'를 보면, 류큐조어가 분기되어 나온 이후, 새로 한번 더 분기된 언어를 가정할 필요성이 있어 보인다. 그렇다면 또 다시 가상의 조어 둘을 상정해야 할 것 같다. siba의 원형을 보존한 조어를 류큐어 B, 그렇지 않은 조어를 류큐어 A라고 상정해보자.

그렇다면 우린 다음과 같은 결론으로 도달한다.

일류조어
류큐조어			일본어
류큐어 A		류큐어 B
야에야마어	미야코어	오키나와어
요나구니어어

꽤나 깔끔한 수형도가 나왔다. 실제로 학자들이 그리는 일본어족의 수형도는 다음과 같다.

일류조어
류큐조어					일본조어
남부 류큐조어			북부 류큐조어		고대 중부 일본어		고대 동부 일본어
야에야마어 연속체		미야코어	오키나와어	아마미어	고대 서부 일본어	중세 일본어	하치조어
요나구니어	야에야마어					일본어

[Makiyama,2015][Pellard,2011]

위에서 상정한 류큐어 A와 류큐어 B는 각각 남부 류큐조어과 북부 류큐조어에 해당한다. 연역적이지만 나름 성공적인 예측이었다. 5개 언어만 분류했을 때와 큰 차이가 없다. 달라진 것은 생소한 언어가 추가됐다는 점이다. 하위 그룹의 언어들은 상위 그룹의 특징을 일부 물려받았다. 이는 당연한 이야기이다. 그러지 않았다면 저런 깔끔한 분류는 불가능했을 것이다.

추후 다시 언급할 내용이지만, shared retention은 재구할 음소를 정할 때에도 사용된다. 역사비교언어학은 과학이고, 그렇기 때문에 가설의 경제성을 추구한다. 모 대응에서 가장 변화가 적은 음소가 조어의 음소로 선택될 가능성이 크다는 것이다. 다음을 보라.

오지브웨어	미크맥어	크리어	먼시어	블랙풋어	아라파호어
m	m	m	m	m	b

위 표는 알그어족(Algic languages)의 알곤킨어파(Algonquian languages)에 속하는 6개 언어들의 음소 대응이다.[Goddard,1974] 위 대응표를 통해 역사 언어학자들은 크게 두 가지 선택을 할 수 있다. 하나는 알곤킨조어(Proto-Algonquian)의 조어에 *m이 존재했다는 것, 또 하나는 *b가 존재했다는 것이다. 그리고는 *m → b 또는 *b → m의 규칙을 설정할 수 있다. 저 상황에서 제일 경제적인 음소는 *m이 틀림없다. 왜냐하면 5개의 언어에서 *b → m이라는 공통적인 변화가 발생했다고 가정하는 것보다는, 조어 단계에서 *m을 공유했고, 아라파호어에서 특수하게 *m → b라는 규칙이 존재했다고 설명하는 것이 더 경제적이기 때문이다. 물론 *m이나 *b가 아닌, *ᵐb 같은 제3의 음소를 상정해도 되지만 그러기 위해서는 적절한 근거가 필요하다. 위 대응표에서는 그럴싸한 근거를 찾을 수 없으니 저 두 가지 재구만이 제일 타당하다.

어형을 비교할 때엔 최대한 오래된 어형을 비교하는 것이 유리하다. 언어의 변화가 덜 일어났을 뿐만 아니라, 언어 간 간섭이 상대적으로 덜 이루어졌기 때문에 우연성이나 불규칙적인 음운변화, 혹은 대응 자체를 발견하는 데에 유리하다.

또한 비교는 어휘와 굴절 패러다임, 문법 형태소 등의 형태론적 단위에서 해야 한다. 역사비교언어학에서 언어유형이나 문법적인 비교는 아무런 타당성이 없다. 언어의 특징으로 어족을 분류한 실수를 예로 들자면 크게 한장어족(Sino-Tibeto-Burman Languages)과 알타이제어(Altaic Languages)가 존재한다.

한장어족은 초기 인도-중국어족(Indo-Chinese Family)이란 이름으로 연구되었다. 인도-중국어족에는 한장어족의 중국어와 티베트어, 버마어뿐만 아니라, 베트남어나 태국어가 속하기도 했다. Ernst Kuhn이란 학자는 인도-중국어족을 다시 중국-시암어파(Chinese-Siamese language)와 티베트-버마(Tibeto-Burman language)로 분류했는데[Kuhn,1889], 중국-시암어파의 근거로는 성조가 있었다.

알타이제어의 경우, 그 근거로 다음과 같은 특징이 지목된다.

(1) SOV 어순을 가진다.
(2) 교착어이다.
(3) 모음조화가 있다.
(4) 두음법칙이 있어 유음이 어두에 오지 않는다
(5) 부동사가 있다.
(6) 모음교체, 자음교체가 없다.
(7) 문법적 성이 없다.
(8) 관사가 없다.

위와 같은 열거는 문증되는 언어의 어휘를 열거한 것이 아니다. 순전히 언어의 공통적인 특징을 어족의 근거로 삼은 것인데, 이런 판단이 가지는 문제는 언어의 문법이나 특징은 쉽게 변한다는 것이다.

한장어족으로 돌아와 보자. 베트남어와 태국어 등이 한장어족에서 방출된 까닭은 기원적이라고 여겼던 성조가 발생할 수 있음이 밝혀졌기 때문이다.[Haudricourt,1954] [Hombert,1979] 성조는 본질적으로 모음에 인접한 자음으로 인해 모음의 추이가 발생하고, 추이 원인의 탈락과 함께 음운화하여 생겨나는 것이다. 그래서 상고한어는 학파에 따라 재구할 때, 성조의 발생요인으로 추정하는 postcoda[20] *-s와 *-ʔ를 재구하기도 한다. 현재 새로운 학설에 다르면, 성조는 단순히 인접 자음에 의해서만 일어나는 모음 추이가 아니라 기후나 온도에 의해서도 발생할 수 있다는 논의도 존재한다.[Everett,2015] 이는 알타이제어의 중요한 근거로 여겨지는 두음법칙이나 모음조화에도 동일하게 적용될 수 있는 이야기다. 수메르어에서도 음절 문자 'NU'가 'LA', 'LU'와 혼용되기도 했을뿐더러 모음조화와 유사한 현상도 존재했다.[Jagersma,2010]

그렇다면 수메르어도 알타이어족에 포함되어야하는 것인가? 아쉽게도 수메르어는 소위 알타이제어에 포함되는 언어들과의 비교에서 유의미한 대응이 발견되지 않는다. 이외의 다른 특징들을 비판하자면 어순이나 문법적 성, 관사 같은 것은 언어 유형론에서 활발하게 다루는 주제를 그 근거로 삼은 것인데, 일단 주어-목적어-술어의 정렬은 산술적으로 6가지밖에 존재하지 않는다. SOV, SVO, VOS, VSO, OSV, OVS 이외의 어순은 존재할 수 없다. 만일 어순이 강력하게 임의적이고 자의적이라서 어족 판단의 근거가 될 정도로 강력하게 작용하는 요소였다면, 저 6개 어순은 각각 16.3% 비율로 나타났어야 했을 것이다. 하지만 실제로는 SOV와 SVO가 일방적으로 우세하다.[Lee,2001] 즉, 어순은 어족을 판단할 만큼 분포가 고르지 아니하거니와 시대에 따라 변하기도 한다. 영어만 해도 본래 고대영어 시기에는 SOV 어순이었다.

고대영어 Sīe þīn nama gehālgod.
중세영어 Be thy name behallowed.
현대영어 Hallowed be thy name.

위 West-Saxon 방언으로 작성된 주기도문의 일부와 영어의 시대적 변화를 보면, 어순이 확실하게 변했음을 알 수 있다.

관사나 문법적 성 또한 판단의 근거가 될 수 없다. 언어일반적으로 관사가 존재하는 언어보다 존재하지 않는 언어의 수가 더 많다. 관사가 없었던 언어 중엔 대표적으로 라틴어가 있는데, 라틴어에서 분화한 로망스어엔 모두 관사가 존재한다. 또한 현대까지 남은 인도유럽어 대다수에는 관사가 있음에도 불구하고, 이들의 조상이 되는 고전어들에는 관사가 없는 경우가 빈번하다. 관사는 인도유럽어 전반에 존재하니 인도유럽어족의 특징이라고도 불릴 만한 요소인데, 그렇다면 라틴어는 인도유럽어족이 아니라고 해야 할까?

물론 이런 결론에 도달해선 안 된다. 문법적 성도 마찬가지이다. 인도유럽어족에 존재하는 문법적 성은 기원적인 것이 아니라, 유추에 의해 늦은 시기 인도유럽조어, 후기 인도유럽조어(Late Proto Indo European)[24] 때 발생했다는 것이 정론이다. 문법적 성 또한 성조와 마찬가지로 모종의 이유로 탄생할 수 있음을 무시하면 안 된다.

알타이어족 가설을 비판하는 제일 강력한 주장은 언어유형적인 특징을 근거로 삼았음에도 불구하고, 언어유형적으로 건전하지 않은 결론에 도달했다는 것이다. 언어유형론에선 언어 접촉이나 shared retention로 인한 모집합의 오염을 최대한 배제하기 위해 노력한다. 하지만, 알타이어족의 근거는 오로지 반-인도유럽어족적인 특징을, 그것도 언어일반적으로 흔하거나 혹은 흔하지 않은 특징들을 고른 것에 불과하니 비교 방법론적인 진리치는커녕 개연성에조차 도달할 수 없다.

가령, 인도유럽어들을 모아 언어적인 특성을 분석하면 관계대명사가 언어일반적으로 흔한 특성이란 결과를 얻을 것이다. 그렇다면, 이의 여집합인 관계대명사가 없는 언어는 모두 같은 어족인가? 혹은 관계대명사가 존재하는 모든 언어는 인도유럽어족에 속하는가? 물론 둘 다 터무니없는 판단이다.

일단 관계대명사는 언어적으로 드문 현상이거니와, 유형론은 생물로 치면 외형에 불과하다. 나비와 참새의 날개는 서로 출처가 다름에도 불구하고 형태와 용도가 비슷하다. 이는 해당 종들이 처한 상황에 의해 그렇게 수렴적으로 진화했기 때문이지, 절대 나비와 참새가 서로 가까운 공통조상에서 유래했기 때문이 아니다.

언어에서도 이와 비슷하다. 언어 유형론은 상황에 따라 쉽게 변화할 수도 있고, 생물과는 다르게 인접한 언어 간 영향으로 비슷한 형태로 수렴하기도 한다. 영어의 어순이 변한 원인은 격을 나타내던 어미들이 모두 약화, 탈락해버리면서 주어와 목적어의 구분이 어려워진 탓이다. 만일 SOV 어순이라면, 명사의 격이 구분되지 않는 상황에서 SV와 OV를 구분할 수 없기 때문이다. 나비와 참새가 하늘을 날아다님이 종족 보존에 유리했기에 그렇게 진화했다. 언어유형론적 특징이나 문법은 상황에 따라 변화무쌍하고, 제아무리 기원적이라고 여기는 요소도 실제론 모종의 원인으로 발생할 수 있으니, 비교의 대상이나 계통 판단의 근거가 되어서는 안 된다.

비교 문법이란 개념이 굉장히 모호하고 어려운 것도 이 때문이다. 실체도 없으며, 음운 변화처럼 규칙을 기술하기 쉬운 것도 아니니 결국 후손 언어를 필사적으로 비교하는 수밖에는 없는 것이다. 이는 인도유럽조어를 제외하고는 슐라이허의 우화처럼, 조어로 이루어진 텍스트가 존재하기 어려운 까닭이기도 하다. 인도유럽어족은 비교를 위한 방대한 언어들과 드문 방언흡수로 비교하기 굉장히 안정적인 어족이다. 그럼에도 불구하고 학자들이 재구성한 원시인구어 텍스트는 학자들마다 상이하다. 제일 완성도가 높은 인도유럽조어마저도 문법적으로는 굉장히 논쟁이 많은데, 하물며 이보다 상황이 나쁜 다른 어족은 어떻겠는가. 타 어족은 문장을 재구성해낼 만한 언어자료조차 없는 경우가 빈번하다. 그렇기 때문에 수많은 조어는 단어 리스트 수준에 머무를 수밖에는 없다. 어휘만 비교하기란 그만한 난처한 상황 탓도 있을 것이다.

5.2. 재구(reconstruction)

재구를 위해서는 음운변화에게 아주 작지만 엄격한 권위를 부여할 필요가 있다. '모든 규칙은 일관적이고 절대적'이라는 전제이다. 물론 이에는 현대에 오기까지 수많은 의문이 제시되었고, 실로 현실적인 전제는 아니다.

가령 음운 변화는 확산적으로 일어나는 듯처럼 보인다. 다시말하면 비가역적이여야할 음운변화에서 배제된 어형의 존재에 대해 위 진술은 아무런 설명을 할 수 없다는 것인데, 이를 바탕으로 "이론은 이론에 불과하다."라며 힐난할 수는 없다.

이를테면 동일한 두 물리계를 생각해보자. 이 둘은 일정한 구성요소를 포함하며, 구성요소 간 상호작용이 명확히 정의되어야 하고, 또 동일한 물리 법칙이 적용되어야한다. 좀 더 실제적인 예시를 생각해보자. 같은 무게의 추를 두 개, 동일한 조건의 다른 진공 공간 안에서 떨어트리는 것이다. 그렇다면, 추는 동일한 물리법칙에 따라 1g의 가속도로 추락할 것이다. 결과적으로 정확히 같은 속도에 바닥에 닿을 텐데, 저 두 계의 물리조건이 다르다면 어떤 일이 발생할까? 결과를 예측하거나 계산하는 일은 불가능해질 것이다. 같은 계에서는 같은 결과가 도출되어야만 예측도 가능하다.

먹물들을 비난할 때 흔히 인용되는 "이론은 이론에 불과하다.", "이론과 실전은 다르다."라는 말은 물리학, 넓게는 과학은 필요한 결과를 위한 구성 요소를 제외한 것들은 계에 포함시키지 않는다는 것을 이해하지 못해야만 발생할 수 있는 진술이다. 실제 10미터 높이에서 10kg의 추를 떨어트리면, 정확히 1g의 가속도로 떨어질까? 유감스럽지만 그렇지 않다. 실제로 도출되는 결과는 1N에 근사한 값이다. 공기저항이나 바람, 습도, 이외 수많은 변수들로 인해 이론적으로 도출된 결과는 실제와 다르기 마련이다.

그럼에도 불구하고 물리학에서 사용되는 수식들의 얼개는 동일하다. 단지 어느 변수를 포함하는가 하는 차이만이 존재할 뿐이다. 그리고 우연히 포함되지 못한 변수로 인해 이론과 실제의 괴리가 발생하는 것이다. 그렇다고 "이론은 이론에 불과하다."라고 힐난할 수는 없는 일이다. 얼개는 변화하지 않았기 때문이다.

재구도 마찬가지이다. 실제 음운 변화의 발생 양상과는 큰 차이가 있다. 그럼에도 불구하고 "모든 음운 변화는 절대적이다."라는 최소한의 권위라도 존재해야, 개별어 전반에 존재했던 규칙을 역적용해서 문증되지 않는 형태로 거슬러 올라갈 수 있는 것이다. 위 진술과 반대로 모든 어휘에 독립적인 변화가 적용되었다면, 재구 자체는 가능했겠지만 역사 언어학자들은 모두 문증되는 어휘만을 재구할 수 있는 저주에 걸린 채로 비탄과 눈물에 젖은 사전에 깔려 연구해야만 했을 것이다.

이런 사고를 이해하고 재구를 하기로 마음을 먹었다면, 학자의 손엔 비교재구와 내적재구라는 두 가지 방법론만 쥐어진다. 비교 재구와 내적 재구를 표로 나타내면 아래와 같은 것이다.

	영어	라틴어	고전 그리스어	산스크리트어
주격	father	pater	πατήρ (patḗr)	पिता (pitā́)	↑ 내 적 재 구 ↓
속격	father	patris	πατέρος (patéros)	पितुः (pitúḥ)
여격	father	patrī	πατέρι (patéri)	पित्रे (pitré)
대격	father	patrem	πατέρα (patéra)	पितरम् (pitáram)
호격	father!	pater	πατέρ (páter)	पितः (pítaḥ)
	← 비 교 재 구 →

비교 재구란, 비교 방법과 마찬가지로 어원이 같은 단어 2개 이상을 비교하여 재구하는 것이다. 내적 재구란, '언어 변화는 그 흔적을 남긴다'는 사실을 바탕으로, 비교 방법을 적용할 수 없는 경우나, 조어에서 개별어의 과정을 재구할 때 사용된다. 이런 경우, 위 표와 같이 형태음운적 교체형으로 재구를 할 수 있지만, 이에 한정된 것은 아니고 합성어나 파생어 등등을 이용해 재구를 시도할 수도 있다.

또한 재구 방법론이 비교 재구와 내적 재구 두 가지뿐이라 해서, 같은 축의 어휘끼리만 비교를 할 수 있는 건 아니다. 계통을 공유한다는 가정하에 모 언어의 어간과 비교 언어의 합성어를 비교할 수도 있는 것이고, 언어 간 굴절 패러다임을 비교할 수도 있는 것이다. 재구를 위한 비교는 모두 필요와 상황에 따라 학자 재량껏 이루어진다.

5.2.1. 비교 재구(comparative reconstruction)

비교 재구(comparative reconstruction)는 선술했다시피 비교 방법에 의거한 재구 방법론이다. 동원어로 상정된 두 개 이상의 문증되는 언어의 어형을 비교하여 조어를 추적해 낸다. 비교재구는 마찬가지로 공통조어의 타당성과 음운 변화가 규칙적이라는 가정 하에 우연적 유사성을 배제해야만 한다. 물론이지만, 그 과정은 비교 방법과 동일하다. 열거하자면 다음과 같다.

(1) 문증되는 언어 가운데에서 우연적 유사성(우연이나 차용)이라 여겨지는 단어는 배제한 채, 동원어 관계라고 여겨지는 단어들을 선정한다.
(2) 이들을 정렬하여, 음운적 대응 관계를 찾는다.
(3) 발견한 대응을 규칙으로 정리한다.
(4) (3)까지의 과정이 성공적이라면, 이들의 각 짝들이 각각 어떠한 단일 단어에서 유래한 동원어(Cognate)라고 결론짓는다.
(5) 개별어의 음운 변화와 발견한 대응을 바탕으로 동원어 간의 음운 변화를 제일 자연스럽게 설명할 수 있는 형태를 재구한다.

가령, 구름을 뜻하는 인도유럽조어의 *nébʰos가 재구되는 과정을 살펴보자.

고대 아일랜드어	그리스어	산스크리트어	고교회슬라브어
nem	nephos	nabhas	nebo

첫째 음은 모든 어형에서 공통적으로 /n/으로 나타나므로 *n으로 재구된다. 두 번째 음은 공통조어의 *e가 산스크리트어에서는 /a/로 변화하였음이 다른 단어들을 통해 확인되므로 *e로 재구된다. 그리고 고대 아일랜드어와 산스크리트어, 고교회슬라브어은 파열음에서 유성성을, 그리스어와 산스크리트어은 파열음에서 유기성을 공유한다. 이를 통해 산스크리트어는 공통조어 단어 속 파열음의 음운을 보존하고 있다는 결론을 내릴 수 있고, 따라서 세 번째 음은 *bʰ로 재구될 수 있다. 네 번째 음의 경우 두번째음과 마찬가지로 *o가 /a/로 변하는 규칙이 산스크리트어에 존재했으며, 음운의 수는 늘기보단 줄어드는 경향성이 있음을 감안하여 *o로 재구될 수 있다. 마지막 음인 *s 또한 마찬가지로 다수의 언어에서 /s/를 보존할 뿐만 아니라, 음은 생겨나기보다는 탈락하는 것이 일반적이기 때문에 재구가 가능하다. 따라서 공통조어에서 구름을 뜻하는 단어로서 *nébʰos가 재구된다.

하지만 이렇게 재구된 재구형이 '정말로 타당한지'에 대한 검토가 필요하다. 가장 확실한 방법은 여러 문헌 가운데에서 재구형과 동일한 형태의 어형을 찾아내는 것이지만, 조어의 특성상 그렇게 찾아내기는 굉장히 어렵다. 그렇기 때문에 어느 형태가 가장 '자연스러운지'에 대한 섬세한 판단이 요구된다. 이에는 여러 기준이 있을 수 있다. 가령 음성적인 요건이 그 기준이 될 수 있다.

셋째 아이를 뜻하는 일본어 三郎는 'さぶろ(saburo)'또는 'さむろ(samuro)'로 읽히는 두 가지 독음이 존재한다. 이렇게 형태는 다르나 동일한 어형에서 변화한 단어를 쌍형어(doublet)이라 한다. 일본어의 유성음은 선비음화 자음(prenasalized consonant)에서 유래했으므로 고대 일본어에선 /*samburo/로 발음되었음을 알 수 있다. 여기에서 앞선 말한 바와 같이 음은 생겨나기보단 탈락하는 경향이 크므로 본래 고대 일본어에선 /*samburo/라고 발음되었고, 모종의 이유 때문에 /samuro/로 변화하였다고 설명하는 것이 타당해 보인다. 하지만 이는 부적절한 판단이다. 이는 고대 일본어에서 산발적으로 /*mVr/가 /*mbVr/로 바뀌는 변화가 발생했기 때문이다. 이렇게 두 조음 위치가 다른 자음이 연속될 시에 파열음이 삽입되는 것은 언어보편적으로 흔한 일이다. 이를테면 햄스터를 뜻하는 영어의 hamster는 [ˈhæmpstɚ]와 같이 실현되기도 한다. [Recasens,2011] 이러한 언어적 경향성들을 살피며 재구하면 조금 더 자연스러운 형태를 이끌어 낼 수 있다.

하지만 비교 재구로 재구된 어형에는 여전히 한계가 있다. 가령, 비교 재구는 다음과 같은 한계가 있다.

(1) 재구형은 특정 시기를 반영하지 못한다.
(2) 음가의 정확성에 한계가 있다.
(3) 어원론적으로 추정한 의미는 여전히 불확실성을 가진다.

재구형의 한계가 아닌, 의미적인 한계는 당연하지만 의미 변화는 규칙을 포착하기 어렵다는 점에 의거한 것이다. 물론 그것에만 한정된 것은 아니고, 재구형이 어느 시간대와 공간을 반영하는 것인지 알기 어렵다는 것처럼, 재구형의 의미 또한 정말로 그러했는지 알 수 없다. 언어란 으레 의식의 환기를 일으키는 법이고 그만큼 의미는 쉽게 변화한다. 고작 1990년대까지만 해도 우리말에서 '작업하다'란 표현에는 노동한다는 뜻만이 있었을 뿐이지 이성을 유혹하는 행위까지 의미하지는 않았음을 생각해보자. 재구형의 의미도 마찬가지다. 아무리 튼실한 어원론적 방법론과 타 언어에 존재한 의미 전이를 꿰고 있다고 하여도 공통조어에 존재하던 모든 의미의 전이를 기술하는 것은 불가능하다. 단지 이런 의미를 지닐 때 분화했을 수도, 혹은 분화한 개별 언어들에서 동일한 의미 전이가 발생해 비슷한 의미로 수렴했을 수도 있다.

비교 재구는 상대적이고 일시적인 어형을 보여주는 것에 지나지 않는다. 언어 변화는 지역과 시간에 따라 점진적일 때도, 급진적일 때도 있지만 비교 재구를 바탕으로 얻은 결과는 단지 이들이 분화되기 이전의 형태에 불과하다. 다시 말하면, 재구형이 개별어들보다 오래되었음은 보장되지만, 공통조어가 겪은 언어 변화의 역사 속에서 정확히 어느 위치에 있는지는 확실히 보장할 수 없다. 또한 비교 재구는 개개의 재구형이 시간적으로 동일 선상에 있었는지를 확정 지을 수 없다. 단지 이런 어형이 '언젠가' 존재했을 것이라는 막연한 기대를 품는 수 밖에 없다.

또한 재구음이라는 것도 순수한 체계에 불과하다. 말인즉, 재구된 음소란 음소가 상호 간 가지는 상대적인 관계에 불과하다. 이렇기에 음성적 실현을 기대할 수 있을 리는 만무하고, 음가를 알아내는 것은 굉장히 어렵다. 이를테면 중세 국어의 아래아는 단순히 하면 첫 음절에서는 /ㅏ/로, 이외의 음절에서는 /ㅡ/로 변화하는 경향성을 지닐 뿐이다. 정확한 음가를 아는 건 불가능에 가깝다. 다른 예시를 들면 상대 일본어의 일부 모음은 갑,_甲,과 을,_乙,[Hattori,1975]이라는 구분이 존재했다. 이렇게 구분되는 모음들의 각각의 추정 음가는 존재하나 결국에는 서로가 대립하는 관계였음만을 나타낼 뿐이다. 구조주의적 농담처럼 들릴지 모르겠지만 재구된 음소도 단지 이 둘이 구분되었음만을 나타낼 뿐이지, 정말로 그렇게 발음되었는지는 불확실하다. 이는 재구 자체의 한계와도 일맥상통하는 점이다.

하지만 비교 재구의 한계는 내적 재구를 통해 완벽하지는 않지만 일부 보완이 가능하다.

위 서술한 것 이외의 비교 재구의 한계라면 비교할 방언이나 친족어가 부재하여 고립되어 버린 고립어에게는 재구 방법의 적용이 불가능하단 점 등이 있을 것이다. 하지만 이 점은 차용어나 유랑어를 파악허거나 이들의 어원을 추적 및 비교하여 내적 재구를 위한 바탕으로 삼을 수 있다. 이런 방법론을 통해 성공적인 성과를 얻은 예시로서는 바스크어 연구자 Koldo Mitxelena가 재구한 바스크 조어(Proto-Basque Language)[27][Mitxelena,1961]가 있다. 바스크 조어는 인접해있었던 라틴어, 포르투갈어, 켈트어 등에서 유래한 차용어와 바스크어를 비교함으로써 바스크어로의 변화를 포착하고 조어를 재구하였다. 이는 나중에 발견된 바스크 조어와 현대 바스크어의 사이를 이어주는 아퀴타니아어의 비문이 발견되며 굉장히 성공적인 재구였음이 입증되었다. 비교 재구는 내적 재구를 보완적인 방법으로 사용함으로써 완벽하지는 않지만 더욱 정교화할 수 있다.

5.2.2. 내적 재구(internal reconstruction)

6. 필요한 지식

7. 필요한 자세

8. 참고 문헌

9. 나무위키에 문서가 존재하는 역사 비교 언어학자

10. 관련 문헌

11. 관련 문서

[Lühr,2008] Lühr R. (2008-01-09). "Von Berthold Delbrück bis Ferdinand Sommer: Die Herausbildung der Indogermanistik in Jena" (PDF). Vortrag im Rahmen einer Ringvorlesung zur Geschichte der Altertumswissenschaften. Jena: Friedrich-Schiller-Universität: www.indogermanistik.uni-jena.de. p. 4. Archived from the original (PDF) on 2011-07-19. Retrieved 2013-05-26.[2] 이런 비일관적인 변화의 예시를 들자면 날개를 뜻하는 중세 한국어 'ᄂᆞᆯ개'는 ㄹ뒤에선 ㄱ이 /ɣ/로 약화하는 규칙에 따라 'ᄂᆞᆯ애'를 거쳐 근대 경기 방언에서 '나래'로 변화하여야만 했지만, 변화 이전 어형을 보존한 '날개'와의 경쟁 끝에 결국 패배해 규칙적인 '나래'가 '상상의 나래'와 같은 문학적 표현 밖에서는 사용되지 않게 되어버렸다. '나래'와 같은 변화를 겪은 어휘로는 모래를 뜻하는 한국어 '모래(←*몰개)', 노래를 뜻하는 한국어 '노래(←*놀-개)' 등이 있다. 이들은 수도권을 벗어난 동남 방언 등지에서는 ㄱ을 보유한 어형으로 나타나고는 한다.[김방한,1992] 김방한. 언어학의 이해. 서울: 民音社, 1992.[4] 경향성은 언제나 경향성에 불과하다. 가능성은 주지만 진리치에 도달할 근거로 삼을 수는 없을 일이다.[5] 역사언어학에서 기술되는 변화는 대부분 결과론적이다. A → B라는 변화는 중간과정이 있었을 수도, 없었을 수도 있지만 적어도 아무것도 모르는 상황에서는 출발점과 종착점만 기술하는 것이다. 만일 A → A1 → B라는 연속적인 변화를 기술하더라도 A → B와는 정보량의 차이만이 있을 뿐, 결과적으로 A가 B로 변했다는 본질적인 의미의 차이는 존재하지 않는다.[Swadesh,1950] Swadesh, M. (1950). Salish Internal Relationships. International Journal of American Linguistics, 16(4), 157-167. Retrieved July 18, 2021, from http://www.jstor.org/stable/1262898[7] 스와데시(1950)가 제안한 스와데시 목록은 단어 200개였지만, 스와데시(1955)에서는 100개로 줄어들었다.[Swadesh,1955] Swadesh, Morris. (1955). Towards greater accuracy in lexicostatistic dating. International Journal of American Linguistics, 21, 121–137[9] [math(t)] = 언어의 한 단계와 끝 단계까지 주어진 시간, [math(c)] = 해당 기간의 끝에 보존된 리스트 항목의 비율, [math(L)] = 해당 리스트의 대체율[10] [math(L)]은 대체 속도로 치환이 가능하며 , [math(\ln)]은 자연로그, [math(r)]은 언어연대 상수이다.[11] 공시 언어학에서 애스터리스크는 비문법적이거나 사용된 적이 없는 단어나 문장임을 드러낼 때 사용된다. 재구된 어형도 본질적으로는 사용된 적이 없으므로 통시 언어학과 공시 언어학의 애스터리스크는 비슷한 맥락을 공유한다.[12] 현대 영어에서는 잘 쓰이지 않는 2인칭 대명사로, 원래는 you와 thou의 의미와 쓰임이 다소 달랐다. 그러다 근대 영어 이후 점차 thou가 사장되기 시작하여 오늘날에는 거의 you만 쓰인다. 오늘날에 thou가 쓰이는 곳은 킹 제임스 성경이나 의도적으로 옛스러운 말투를 재현할 때 정도다.[13] Proto-japonic이라고도 한다.[Makiyama,2015] Makiyama, A. (2015). Coincidence or Contact: A Study of Sound Changes in Eastern Old Japanese Dialects and Ryukyuan Languages.[Pellard,2011] Pellard, T. (2011). The historical position of the Ryukyuan Languages.[Goddard,1974] Goddard, Ives (1974). "An Outline of the Historical Phonology of Arapaho and Atsina". International Journal of American Linguistics. 40 (2): 102–16. doi:10.1086/465292. S2CID 144253507.[Kuhn,1889] Kuhn, Ernst (1889), "Beiträge zur Sprachenkunde Hinterindiens" (PDF), Sitzungsberichte der Königlichen Bayerischen Akademie der Wissenschaften, Philosophisch-Philologische und Historische Klasse, Sitzung vom 2 März 1889, Munich: Verlag der Königlich Akademie, pp. 189–236.[Haudricourt,1954] Haudricourt, André-Georges. 1954. De l'origine des tons en vietnamien. Journal Asiatique 242: 69–82. English translation by Marc Brunelle: The origin of tones in Vietnamese.[Hombert,1979] Hombert, Jean-Marie; Ohala, John J.; Ewan, William G. (1979). "Phonetic explanations for the development of tones". Language. 55 (1): 37–58. doi:10.2307/412518. JSTOR 412518.[20] post-coda, 즉 종성 뒤에 위치한다는 뜻이다.[Everett,2015] Everett, Caleb ; Blasi, Damián E. ; Roberts, Seán G. (2015). "Climate impacts language". Proceedings of the National Academy of Sciences. 112 (5): 1322-1327; DOI: 10.1073/pnas.1417413112[Jagersma,2010] Jagersma , Abraham H. (2010). "A Descriptive Grammar of Sumerian"[Lee,2001] Jung Song, Lee (2001). "Linguistic Typology, Morphology and syntax"[24] Luraghi,2011 Luraghi, Silvia. (2011). The origin of the Proto-Indo-European gender system: Typological considerations. Folia Linguistica. 45. 10.1515/flin.2011.016.[Recasens,2011] Recasens, D. (2011). Articulatory constraints on stop insertion and elision in consonant clusters. , 49(5), 1137-1162. https://doi.org/10.1515/ling.2011.031[Hattori,1975] Hattori, Shiro. (1975) "上代日本語の母音体系と母音調和"; 言語 5-12[27] Proto-Euskara라고도 함[Mitxelena,1961] Mitxelena, K. (1961). Fonética histórica vasca. San Sebastián: Impr. de la Diputación de Guipúzcoa.