나무모에 미러 (일반/어두운 화면)
최근 수정 시각 : 2023-05-24 12:05:51

최적성 이론

1. 개요2. 상세
2.1. 최적성이론의 문법관2.2. 규칙 기반 모형(rule-based model)과 구분되는 최적성 이론의 특징2.3. 제약의 종류
2.3.1. 유표성 제약2.3.2. 충실성 제약2.3.3. 제약의 서열
2.4. 최적성 이론을 통한 음운 현상 분석 예시
3. 비판
3.1. 과잉생성(overgeneration)3.2. 과소생성(undergeneration)3.3. 학습가능성(learnability) 문제

Optimality Theory(OT)

1. 개요

생성음운론의 시작인 놈 촘스키-모리스 할레의 『영어의 음성체계』(The Sound Pattern of English, 이하 SPE)에서 제시된 규칙 기반 모형(Rule-based model)은 이론의 발전 과정 상에서 몇 가지 이론적 비판에 직면한다. 대표적인 것으로 공모(conspiracy)에 대한 설명이 난잡하다는 것이다. 인간의 언어는 특정한 형태를 회피하기 위한 기능적 목적을 위해 기저형에 다양한 음운작용을 적용하는데, 순수 규칙 기반 모형으로 이것을 설명하려면 각각의 음운작용을 독립적인 규칙순(rule ordering)으로 설명해야 한다는 단점이 있었다. 이에 따라 70년대, 80년대의 여러 학자들은 통사론의 that-trace filter와 같은, 규칙 적용 후에 적용되는 제약군(constraints)을 제안하였는데, Prince and Smolensky의 "Optimality Theory: constraint interaction in generative grammar"와 McCarthy and Prince의 "Generalized Alignment"와 "Prosodic Morphology Ⅰ: constraint interaction and satisfaction" 등은 이러한 음운적 제약의 사용을 극단으로 밀고가서 오직 제약 상호작용(constraint interaction)만으로 음운현상을 설명하는 연구 프로그램을 제안하였다.

이러한 흐름은 최적성 이론(Optimality theory)으로 발전하였고, 현재 음운론 연구에 있어서 지배적인 이론으로 자리 잡았다.

2. 상세

2.1. 최적성이론의 문법관

최적성 이론에서 사용하는 기본적인 도구들에는 유표성 제약(Markedness Constraint), 충실성 제약(Faithfulness Constraint), Gen 함수 등이 있다.

2.2. 규칙 기반 모형(rule-based model)과 구분되는 최적성 이론의 특징

최적성 이론은 오로지 제약만을 사용하며, 그 어떠한 규칙도 상정하고 있지 않다. 기존의 규칙 기반 체계(rule-based system)는 기저형이 여러 개의 음운 규칙을 순서대로 적용받아 표면형을 산출해내는 일종의 컨베이어 벨트 시스템과 같았다면, 최적성 이론의 경우, 입력값(input) 혹은 기저형에 상응하여 Gen 함수가 상상할 수 있는 모든 산출값을 생성하고, 제약들을 가장 잘 만족하는 산출값(output)을 표면형으로 실현하는 모델이다.

규칙 기반 이론과 최적성 이론의 이러한 차이점은 음운론 학자들의 임무도 바꾸어 놓았다. 규칙 기반 문법이 음운론 연구의 주된 방법이었을 때는, 음운론을 연구하는 사람들의 주된 업무는 올바른 규칙과 규칙순을 밝혀내는 것이었다. 그런데 최적성 이론이 음운론 연구의 주된 방법으로 자리 잡고 난 이후에는, 올바른 제약과 그 제약의 순위(ranking)를 밝혀내는 것이 주된 업무가 되었다. 따라서 규칙을 인정하지 않고 오로지 제약만을 통해서 설명함으로써 제약과 규칙이 포착하고자 하는 바가 겹치는 중복 문제나 공모 문제를 해소할 수 있었다.

또한, 기존의 규칙 기반 모델은 많은 경우 “The phonology of Language X”와 같이 개별 언어의 음운론을 형태소 구조 제약(MSC)과 바꾸어 쓰기 규칙(rewrite rule)으로 분석하고 설명하는 논문이 주를 이루었다. 규칙 기반 모델에서는 일반적으로 각 언어마다 개별적인 규칙들이 있기에 다른 언어의 사례를 많이 보지 않아도 충분한 기술이 가능하였다. 그런 까닭에 규칙 기반 음운론의 이론 및 체계 자체에 대한 의견 제시는 적었다. 즉, 언어 분석과 음운론 전체 체계에 대한 연구는 분리되어 있었다는 것이다. 그러나 최적성 이론의 경우, 한 언어만 봐서는 제약들을 찾아내기 어려우므로 다른 언어들을 살펴보고 그러한 제약이 있음에 대한 합리적인 이유를 제시해야 한다. McCarthy의 "Doing Optimality Theory"(p.31)에 따르면, 한 언어의 분석자는 주어진 제약들을 배열하는 것뿐만 아니라 때때로 옛 제약들을 수정하거나 새로운 제약을 제시해야 한다. 다시 말해, 개별 언어 분석을 위해서는 보편적 이론에 대한 인식과 평가가 필요하다는 점에서 최적성 이론에서는 분석과 이론화가 하나이다. 더 나아가, 여러 언어들의 분석으로부터 보편적 제약을 추론해낸다는 점에서, 보편 문법의 이념을 보다 제대로 실현하는 이론이라고 할 수 있다.

2.3. 제약의 종류

2.3.1. 유표성 제약

유표성 제약(markedness constraint)은 회피해야 할 나쁜 형태를 표현하는 제약으로서, 그러한 형태를 제외한 나머지 모든 출력값 형태는 좋다고 주장하는 제약이다. 반면에 충실성 제약(faithfulness constraint)은 산출값을 입력값에 최대한 충실하게 하라는 제약이다. 유표성 제약은 일반적으로 언어 유형론적인 유표적 값(marked value)과 무표적 값(unmarked value) 분석에 기반 하여 분석된다. 무표적 형태 혹은 값은 언어들에 보편적으로 나타나는 경향이 있는 것인 반면에, 유표적 형태 혹은 값은 많은 언어들에서 회피되는 것이다. 예컨대, 전설 평순 모음 [i]와 [e]는 대부분의 언어에서 나타나지만, 전설 원순 모음 [y]와 [ø]는 일부 언어에서만 나타나는데, 이때 전설 모음에 있어 [round] 자질에 대해 보다 유표적인 것은 [+round]라고 할 수 있다. 최적성 이론은 이러한 유표성에 대하여, 1) 유표적 요소는 잘못된 것이 아니라, 그 언어의 특성을 보여주는 언어 간의 대조되는 부분이며, 2) 유표적인 것과 무표적인 것은 임의적인 것이 아니라, 조음 또는 지각적 체계에 뿌리를 둔 것이라는 가정에 기반 한다. 따라서 유표성 제약을 음운론의 이론 체계에 제시하기 위해서는, 조음 또는 지각적 근거를 제시해야 한다.

2.3.2. 충실성 제약

유표성 제약은 조음과 지각의 한계 때문에, 즉 발음의 경제성 등에 의해 선호되는 발음이 있다는 것을 반영한 것인 데 비해, 충실성 제약은 의미의 대립을 위해 언어는 최소한의 형식적 대립이 필요하다는 것을 반영한 제약이다.

2.3.3. 제약의 서열

유표성 제약과 충실성 제약 간에는 모순이 반드시 발생한다. 먼저 유표성 제약은 입력값의 어떠한 형태가 나쁘므로 회피하라는 제한을 가할 수 있고, 동시에 충실성 제약은 입력값의 어떠한 형태를 그대로 유지하라는 제한을 가할 수 있다. 즉, 최적성 이론은 같은 입력값에 대해 반대 방향의 두 힘이 작용하는, 내재적으로 모순적인 힘들에 대한 체계라는 것이다. 따라서 이러한 서로 모순되는 제약들 중 하나는 위배되어야 하므로, 최적성 이론은 위배될 수 있는 제약들 간의 이론이다. 최적성 이론의 문법은 반드시 이러한 보편적 제약들 사이의 갈등을 조절해야 하는데, 이러한 갈등 조절 메커니즘이 바로 보편적 제약들 사이의 순위(ranking)이다. 최적성 이론에서는 더 순위가 높은 이론의 만족을 위해서 더 낮은 순위의 제약이 위배될 수 있으며, 더 높은 순위의 제약 위배는 낮은 순위의 제약의 충족에 의해서 보상되지 않는다. 바로 이러한 보편 제약들 간의 순위 차이가 각 언어들에 나타나는 음운 현상 차이의 원인이라고 최적성 이론은 주장한다.

2.4. 최적성 이론을 통한 음운 현상 분석 예시

영어의 복수형 접미사 /-əz/에 대해, 어근의 마지막 자음이 치찰음일 때 [-əz]로 실현되고, 그렇지 않고 치찰음이 아닌 유성자음이나 모음으로 끝날 때는 /z/로 실현된다. 최적성 이론은 이러한 음운 현상을 몇 가지 제약과 그 순위로 설명해낸다.[1]
- *SS
A sequence of sibilant is prohibited

- MAX
Do not delete any underlying segment

- DEP
Do not insert any underlying segment

이 때, [baksəz] > [baksz]이고 [baksəz] > [bakz]이므로(A > B는 A가 B보다 최적인 형태라는 것을 의미), *SS >> DEP이고 MAX >> DEP이다. *SS와 MAX 제약 간의 순위는 주어진 현상 자료로는 매길 수 없다. 따라서 이 세 제약 간의 순위는 *SS, MAX >> DEP이다. 이러한 제약과 그 순위가 올바른 형태를 추론해낼 수 있음을 보여주는 표(tableau)는 아래와 같다.
input = /baks+z/ *SS MAX DEP
baksz *!
baksəz ☜ *
bakz *!

최적성 이론은 이러한 제약들과 그 순위를 통해서 여러 가지 음운 현상, 음소 간의 대립, 변이음 교체, 음소 배열론 등 다양한 현상을 설명하고자 하며, 실제로 큰 성공을 거두었다. 특히 규칙 기반 음운론에서 단순한 예외라고 기술될 수밖에 없었던 수많은 사례들을, 그것이 예외가 아니라 일관적 제약 순위로 설명해낼 수 있음을 보였다. 즉, 그 언어의 일반적인 제약을 위배하거나 응당 받아야할 규칙의 적용을 받지 않은 사례에 대해, 기존의 규칙 기반 음운론은 이를 예외로 기술하며 설명하기 곤란해 했지만, 최적성 이론은 이에 대한 적절한 제약 순위를 제시함으로써, 그러한 현상이 예외가 아니라 더 높은 순위를 준수하기 위해 더 낮은 순위의 제약을 위배한 것이라는 설명을 제시할 수 있다는 것이다.

3. 비판

2021년 현재 시점에서는 최적성 이론과 같은 제약기반모델과 SPE 식의 규칙기반모델 사이의 이론논쟁은, 적어도 음운론에서는, 제약기반모델의 판정승으로 종결되었으나, 최적성이론이 처음 나왔을 때부터 2000년대 중후반까지는 치열한 이론논쟁이 있었다. 최적성이론에 대한 비판의 선봉에 선 학자는 규칙기반모델 진영의 Halle와 Idsardi이다. 현재 Halle가 세상을 떠난 탓으로 인해 Idsardi 혼자서 맹렬하게 비판을 하고 있다. 한편 규칙기반 생성 모델 진영에서는 최적성이론은 존재하지 않는양 치부하는 경향이 있다.

마지막으로 최적성이론과 규칙기반이론의 통섭을 주장하며 두 이론틀이 상호간 번역가능(translatable)하다는 연구들도 있었다. 즉, 하나의 규칙은 충실성 제약과 유표성 제약의 순서로 번역할 수 있다는 것. 이것은 두 이론이 사실상 실제로 존재하는 자연언어에 대해서는 동일한 예측을 하는 지경이 되었고, 최적성 이론에서 말하는 '발견되지 않았지만 제약 배열로 존재할 가능성이 있는 언어들'의 존재는 여전히 오리무중이기 때문이다.

3.1. 과잉생성(overgeneration)

과잉생성의 경우, 하나의 문제에 대해 너무 많은 해결책이 이론적으로 가능하다는 것이다. 이에 대한 예시는 다음과 같다. 일반적으로 어말 유성음은 유표적인 것으로서 많은 언어에서 회피된다.
- *Final Voiced Obstruent
Voiced obstrunt is prohibited in word-final position.

그런데 독일어나 네덜란드어와 같이 이러한 제약의 순위가 높은 어떤 언어에서 그 입력값에 /neb/와 같이 어말 유성 자음이 나타난다고 할 때, 이 제약을 회피하고자 할 것인데, 최적성 이론에서는 그 가능한 회피 방법이 다양하다. 예컨대 MAX 제약의 순위가 더 낮다면 어말의 유성 자음을 탈락시킬 수도 있을 것이며, DEP 제약의 순위가 더 낮다면 어말에 모음을 추가시킬 수도 있을 것이다. 그러나 그러한 음운 현상은 그 어떤 언어에서도 나타나지 않고, 오로지 유성 자음을 무성음화시키는 현상만 나타난다. 즉, 한 유표성 문제에 대해서 한 해결책만 있는 경우가 있는 것 같고, 왜 그 한 가지 해결책만 나타날 수 있는지 최적성 이론은 적절한 답을 하기 어렵다는 것이다.

3.2. 과소생성(undergeneration)

반대로 과소생성은, 최적성 이론이 실제 나타나는 음운 현상을 설명할 수 없다는 것이다. 과거 규칙 기반 음운론에서 규칙순(rule ordering)으로 설명했던 현상들이 바로 이러한 문제점을 보여주는데, 대표적인 예가 한국어의 폐쇄음 이후 된소리화(post-obstruent tensing, 이후 된소리화로 표기)와 자음군 탈락(consonant cluster reduction)이다. 한국어에서는 /입고/가 [입꼬]로 발음되는 것과 마찬가지로 음절을 경계로 폐쇄음 다음에 예사소리가 올 때 두 번째 자음이 된소리화 된다. 그러나 앞 자음이 유음일 때는 뒤의 자음이 된소리화 되지 않는다. 또한, /값/이 [갑]으로 발음되는 것처럼 어말에 자음군이 올 때 자음 하나를 탈락시킨다. /밟고/의 경우, 구어에서는 [발꼬]라고 발음되는 경우가 많은데, 이러한 현상에 대해 규칙 기반 음운론은 규칙순으로 설명할 수 있다. 기저형 /밟-고/에서 먼저 된소리화가 적용되어 [밟꼬]가 된 이후, 자음군 탈락 규칙이 적용되어 [발꼬]의 표면형으로 실현되었다는 설명이다.

그러나 최적성 이론의 방법론으로는 이를 분석해낼 수 없다. 먼저, /입고/가 [입꼬]로 실현된다는 것을 설명하기 위해서는, 폐쇄음 뒤에 오는 예사소리가 된소리가 아니면 안 된다는 유표성 제약(TENSING)과 그것에 반하여 한 분절음의 된소리 여부(tensing)를 유지하라는 충실성 제약(IDENT[tense])이 필요할 것이다. 이때 [입꼬] > [입고]이므로 TENSING >> IDENT[tensing]이다. 다음으로, /값/이 [갑]으로 실현된다는 것을 설명하기 위해서는, 자음군 연속을 금지하는 제약(*COMPLEX)과 그것에 반하여 입력값의 요소들을 출력값에서 보존하라는 제약(MAX)이 필요할 것이다. 이때 [갑] > [값]이므로 *COMPLEX >> MAX이다. 된소리화를 설명하는 제약 집합과 자음군 탈락을 설명하는 제약 집합 사이의 순위는 알 수 없다(물론 순위가 있다고 하더라도 최적값의 결과는 변하지 않는다).
- TENSING
폐쇄음 뒤에 오는 예사소리가 된소리가 아니면 안 된다.

- IDENT[tense]
한 분절음의 된소리 여부(tensing)를 유지되어야 한다.

- *COMPLEX
자음군 연속은 금지된다.

- MAX
입력값의 요소들은 출력값에서 보존되어야 한다.

이를 바탕으로 /밟고/의 최적 출력값을 추론해보면 다음과 같다.[2]
/밟고/ *COMPLEX MAX TENSING IDENT[tensing]
밟.고 *! *!
*발.고 ☜ *
발.꼬 * *!

[발꼬]가 아닌 *[발고]가 예측이 되는데, 이렇듯 최적성 이론의 틀 안에서는 마땅히 도출되어야 할 음운 현상들을 설명해낼 수 없다는 과소생성의 문제가 발생한다. 이러한 문제를 해결하기 위해, 최적성 이론을 제시한 학자 중 한명인 McCarthy는 규칙 기반 모델의 규칙순(rule-ordering)의 개념을 받아들이는 OT-CC를 제안하는 등, 최적성 이론의 문제 해결을 위한 새로운 이론을 제시하고는 있지만, 최적성 이론만큼의 호응을 얻고 있지는 못하고 있다.

3.3. 학습가능성(learnability) 문제

만약 최적성이론의 문법관이 옳다면, 언어를 습득하는 아동은 최적성이론 식의 제약과 제약순을 학습한다고 보아야 한다.

특히 최적성이론 패러다임에서 가지고 있는 언어습득이론은, 태어날 때 유표성제약이 반드시 outrank한 상황에서 언어학습과정은 제약의 재서열화를 통해 충실성제약을 상승시킨다는 것인데, 이것이 실제로 학습가능한지에 대한 Idsardi의 비판이 있다. 산술적으로 불가능하다는 것이다. 또한 베이지언 학습자를 상정했을 때에도, 제약의 종류와 제약의 서열을 학습하는 것이 불가능하다는 연구결과도 있다. 구체적으로는, 이미 어떤 제약이 있는지 사전에 알아야만 최적성이론 식 제약군과 제약서열을 학습할 수 있었다. 일반적으로 최적성이론 측에서는 UG를 상정하지 않는데, 이러한 실증적 결과에 따르면 최적성이론의 기본 철학과 모순되는 결과가 발생할 수도 있는 것이다.

한편, 최근의 규칙기반 생성음운론 이론들에서는 데이터를 패턴학습하는 방식이 어느정도 규칙으로 환원될 수 있다는 주장과 함께, 학습가능성 측면에서는 규칙기반이론이 판정승이라는 여론이 팽배해지고 있다.


[1] 물론, 왜 하필이면 /ə/가 삽입되는지 등에 대해서는, 보다 구체적인 제약들과 그 순위가 제시되어야 하지만, 지금은 최적성 이론에 대한 개괄이므로 간략화하여 제약 3개만 사용하였다.[2] 아래의 표에서는 된소리화를 설명하는 제약들(TENSING, IDENT)과 자음군 탈락을 설명하는 제약들(*COMPLEX, MAX)사이에는 순위를 정할 수 없다