상대성 이론 Theory of Relativity | |||
{{{#!wiki style="margin:0 -10px -5px" {{{#!wiki style="word-break: keep-all;" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-6px -1px -11px" | <rowcolor=#2A1A5B> | 특수 상대성 이론 | 일반 상대성 이론 |
<colcolor=#00a0de><colbgcolor=#2A1A5B> 배경 | 상대성 이론/역사 · 맥스웰 방정식 · 마이컬슨-몰리 실험 | ||
기초 가설 | 상대성 원리 · 광속 불변의 원리 | 등가 원리(중력 · 관성력) | |
이론 체계 | 시공간(세계선 · 고유 시간 · 고유 길이 · 민코프스키 다이어그램 · 아인슈타인 표기법) · 미분기하학(리만 다양체) | ||
로런츠 변환(로런츠 인자) · 로런츠 군 | 아인슈타인 방정식 · 힐베르트 액션 (슈바르츠실트 계량 · 라이스너-노르드스트룀 계량 · 커 계량/커-뉴먼 계량) | ||
현상 | 동시성의 상대성 · 시간 지연 · 길이 수축 · 질량-에너지 등가원리 · 상대론적 효과(도플러) | 중력 렌즈 효과 · 중력파 · 적색편이 | |
응용 및 심화 | 기본 상호작용 · 상대론적 역학 · 상대론적 전자기학 · 양자 전기역학 · 천체물리학(천문학 둘러보기) · 통일장 이론 · 루프 양자 중력 이론 · 타임 패러독스 · 중력 자성 | ||
쌍둥이 역설 · 막대와 헛간 역설 · 아광속 · 초광속 · 타키온 | 중력자 · 블랙홀(블랙홀 둘러보기 · 사건의 지평선 · 중력 특이점 · 양자블랙홀) · 우주론 · 우주 상수 | }}}}}}}}}}}} |
1. 개요
해당 이론 논문 보기(위키문헌, 한국어 번역)특수 상대성 이론(特殊相對性理論 / Spezielle Relativitätstheorie / Special theory of Relativity / Special Relativity)은 중력이 작은 환경에서의 시간과 공간의 성질을 다루는 물리학 이론이며, 1905년 알베르트 아인슈타인이 이론적 기반을 마련하였다. 고전 물리학의 두 기둥이지만 잘 융합되지 않던 고전역학과 전자기학을 통합하고 물리학을 한 층 더 높은 차원으로 인도하였으며, 이후 발전된 양자역학과 결합하여 중력을 제외한 모든 물리학 과정을 기술하는 기초 이론의 역할을 하고 있다.
2. 역사
보통 특수 상대성 이론이라고 하면 아인슈타인의 이론을 지칭하긴 하지만, 특수 상대성 자체는 갈릴레오 갈릴레이에 의해 먼저 제기된 개념으로 서로 등속도 운동을 하는 관측자 사이에서 물리 법칙은 똑같이 표현된다는 것이다. 그러나 아이작 뉴턴은 자신의 역학 체계 내에, 갈릴레이의 특수 상대성을 공리로 받아들이지 않았고, 법칙들로부터 추론되는 일종의 따름 정리로 두었다. 즉, 뉴턴의 제1 법칙과 제2 법칙 모두 갈릴레이 변환에 대해서 '우연히' 불변인 셈이다. 게다가 뉴턴은 절대적이고 정적인 공간을 상정했기 때문에 이러한 종류의 상대성은 원론적으로 껄끄러운 것이었다.그러므로 몇백 년 후에 등장한 맥스웰 방정식이 갈릴레이 변환에 불변하지 않는다는 사실이 물리학자들에게 그렇게 충격적이던 것은 아니었다. 그들은 가장 간단한 형태의 맥스웰 방정식이 말해 주는 것과 실험 결과가 일치하는 관측계가 바로 절대공간 혹은 에테르에 대해서 정지하고 있는 관측계이며, 에테르에 대해서 운동을 할 때 그만큼 맥스웰 방정식이 바뀌는 것이 그렇게 받아들이기 힘든 결과는 아니었다.
그러나 온갖 종류의 실험과 관측은, 모든 관측계에서 맥스웰 방정식이 바로 그 형태 그대로 성립한다는 결과를 내었다. 즉, 실험계가 에테르에 대해서 어떤 방식으로 운동하고 있든 상관없이 맥스웰 방정식은 유지되는 것이었다. 이 후 로런츠는 갈릴레이 변환을 수학적으로 수정하여 로런츠 변환 공식을 만들어내었고, 맥스웰 방정식은 로런츠 변환에 대해 불변하며, 또한 이내 로런츠 수축이나 시간 지연 효과를 파악하였다. 피츠제럴드와 같은 물리학자들은 이 로런츠 수축이나 시간 지연 효과가 그동안 실험에서 사용되었던 관측에 해당된다는 것을 알아차렸고, 이를 다음과 같이 설명하였다: 에테르에 대해서 상대적인 운동을 하면, 갈릴레이 변환에 따라 맥스웰 방정식의 형태가 변하지만, 또한 물리 법칙의 형태가 변하는 만큼, 어떤 물질계로서 자와 시계의 물리적인 거동도 함께 변함, 즉 실험에 사용되는 자의 실제 '길이'와 시계 장치의 '주기'가 로런츠 변환 공식에 따라 변질된다. 따라서 실험 장치의 변질로 인해, 거리와 시간의 측정이 로런츠 변환에 따라 변하므로 맥스웰 방정식의 변화는 보이지 않는다. 에테르가 측정되지 않은 이유는 이것이다.
그런데 이런 종류의 설명은 상당히 큰 증명의 부담을 가진다. 자와 시계를 이루는 여러 물질의 성분과, 시계의 경우 장치의 여러 공학적 디자인을 막론하고 왜 정확하게 맥스웰 방정식의 변환을 상쇄시키는가? 이것은 이론적으로 설명하기에는 사실상 불가능한 엄청나게 복잡한 계산을 요구하며, 상식으로 물질적인 변화가 물성에 영향을 받지 않는다는 것은 이상하다. 젊은 아인슈타인은 발상의 전환을 통해 이 문제를 굉장히 간단하게 해결하였다. 한 마디로, 맥스웰 방정식도 불변하고(특수상대성 회복), 실험 장치도 변질되지 않는다. 로런츠 변환은 자와 시계의 물질적인 상태의 변질을 말하는 것이 아니라, 시공간 자체의 구조를 나타낸다(동시성의 상대성).
3. 요약
특수 상대성 이론은 일반적으로 아인슈타인이 제안한 2가지 가정[1]을 통한 유도법이 널리 받아들여지는데, 그것은 다음과 같다.- 상대성 원리: 물리법칙이 가장 간단한 형태로 성립하는 좌표계에 대해 등속 직선 운동하는 모든 좌표계에서 동일한 물리 법칙이 적용된다.[2] (이는 관성 좌표계를 정의한다.)
- 광속 불변의 원리: 모든 관성 좌표계에서 진공 중에서 진행하는 빛의 속도는 관찰자나 광원의 속도에 관계없이 일정하다.
상대성 원리는 고전역학의 가장 유서깊은 결론 중 하나이며, 광속 불변의 원리는 전자기학에서 [math(F=ma)]만큼 중요한 맥스웰 방정식의 가장 단순한 표현을 갖는 결과 중 하나이다. 즉, 고전역학과 전자기학에서 핵심이 될만한 요소를 하나씩 빼다가 모은 것이다. 둘을 한마디로 합치면 "전자기학이 상대성 원리를 따른다면?"이라고 요약할 수 있겠다. 물론 상대성 원리는 고전역학의 산물이지만, 고전역학이 상대성 원리를 만족시킬 때와 전자기학이 상대성 원리를 만족시킬 때의 결론이 달라진다. 보다 분명히 말해서 각 역학에서의 물리법칙의 특성이 다르며, 물리법칙을 서술하는 기준인 시간과 공간이 엮이는 구조가 달라진다. 어쨌든, 당시의 가장 큰 문제의식은 두 역학을 있는 그대로 만족시키는 상대성 원리는 존재하지 않는다는 것이며, 상대성 원리를 그대로 가져간다면 어느 하나는 (혹은 둘 다) 이론이 일부 수정될 수밖에 없다는 것이다. 그리고, 당시의 실험결과는 전자기학이 상대성 원리를 위배하지 않는다는 결론에 손을 들어주고 있었다.
매우 어려운 문제이지만, 이 둘을 논리적으로 잘 엮을 수 있다면 당시 물리학의 쌍두마차였던 (지금의 일반 상대성 이론과 양자역학처럼) 두 이론을 통합하는 데 성공하게 된다. 특수 상대성 이론은 이 두 가지 가정으로부터 유일하게 얻어지며, 이론적으로나 실험적으로나 현대 물리학에서 가장 기반이 확고한 이론이 되었다.
특수 상대성 이론을 제대로 유도하기 위해선 사실 한 가지가 더 필요한데, 바로 시간을 다시 정의해야 한다. 이것이야말로 아인슈타인의 가장 중요한 통찰 중 하나이며 이러한 과정을 거치고 나면, 시간이 진정한 의미에서 공간과 동등한 "좌표축"의 자격을 가지게 된다.
아인슈타인 동기화 (Einstein Synchronization)[3]
시간은 "공간 전체"에 절대적으로 부여되는 게 아니라, 관찰자마다 "공간 상의 각 점에서" 시간을 따로 측정하고 시계를 동기화하는, 다시 말해 동시성(각각의 시간대에 관찰되는 점의 집합)을 정의하는 과정을 거쳐야 한다.
시간은 "공간 전체"에 절대적으로 부여되는 게 아니라, 관찰자마다 "공간 상의 각 점에서" 시간을 따로 측정하고 시계를 동기화하는, 다시 말해 동시성(각각의 시간대에 관찰되는 점의 집합)을 정의하는 과정을 거쳐야 한다.
이 개념은 관찰자마다 동시성이 다르게 정의될 여지를 마련하면서 물과 기름의 관계처럼 보이는 두 가정(상대성 원리, 광속 불변 원리)이 조화로워지게 만든다. 두 가지 가정과, 아인슈타인 동기화를 결합하면 다음과 같은 익숙한 결론들이 하나씩 나오게 된다.
- 서로에 대해 등속도 운동하는 관찰자끼리는, 사건의 동시성이 다르게 정의된다.
- 관측자에 대해 빠른 속도로 운동하는 물체는 시간이 느려진다(시간 지연).
- 관측자에 대해 빠른 속도로 운동하는 물체는 고전적 운동량보다 더 큰 값을 가진다.[4]
- 관측자에 대해 빠른 속도로 운동하는 물체는 길이가 짧아진다.
- 질량이 에너지로, 혹은 에너지가 질량으로 바뀔 수 있다.([math(E=mc^2)])
이러한 결론들은 결국 관성 좌표계 간의 일반화된 좌표 변환, 즉 로런츠 변환으로 귀결되며 이를 통해 좌표 변환에 불변하는 양을 찾아 기존의 물리량들을 재정의하고 역학을 재정립할 수 있다. 고등 물리는 시각적으로 동시성과 시간 지연, 길이 수축 정도를 유도하고 주요 결론들을 살피는 데 그치고 일반 물리학에서는 로런츠 변환을 도입하는 정도로 마무리짓지만, 사실 특수 상대성 이론의 형식화는 1907년 민코프스키의 기여 이후로 완전히 새로운 페이스에 들어선다. 다시 말해 시공간의 발견인데, 시공간은 네 개의 실수로 이루어진 좌표 [math((t, x, y, z))]로 정의되는 4차원 공간으로 두 점 사이의 거리 [math(\Delta s)]는 다음과 같이 정의된다.
[math((\Delta s)^2 = -c^2(\Delta t)^2 + (\Delta x)^2 + (\Delta y)^2 + (\Delta z)^2)]
시공간을 정의하면 4차원 기하학적 양(벡터 등)들을 정의할 수 있고, 기하학적 양은 좌표에 의존하지 않으므로 자연스럽게 상대성 원리가 적용된다. 그리고 기하학적 양들을 다루는 일반화된 방법론은 이미 수학에 잘 정리되어 있다. 이러한 관점이 중요한 이유는 여러가지가 있지만, 예를 들어 후속작인 일반 상대성 이론은 시공간 개념을 사용해야만 유도될 수 있다. 왜냐하면 중력을 시공간의 곡률로 설명하기 때문이다.
4. 입론
특수(+일반) 상대성 이론은 이름과 달리 법칙의 보편성을 보장해준다. 서울에서 실험을 하든 부산에서 실험을 하든 텅 빈 우주 한 가운데든 위치를 다르게 해서 실험을 행해도 물리 법칙은 다르게 적용되지 않을 것이라는 게 통념이다.[5] 마찬가지로 동쪽을 바라 보든 남쪽을 바라 보든 거꾸로 매달아 놓든 방향을 아무리 바꿔서 실험을 행해도 법칙이 바뀌진 않을 것이다. 또한 지금 실험하든 1년 후에 실험하든 5천 년 전에 실험하든 시간에 상관 없이 법칙은 그대로 적용될 것이다. 이러한 위치, 각도 그리고 시간 등에 법칙이 구애받지 않는다는 통념을 가지고 있다.그리고 이게 바로 상대성 이론이란 이름이 붙은 이유인 관측자에 따라 모든 것이 상대적이란 결론을 내는 것이다.(사실, 원래 상대성 이론은 "상대성 원리"로부터 온 말이다.) 밀폐된 계가 등속으로 이동 중일 때 당신은 외부 계가 이동 중인지, 아니면 본인의 계가 이동 중인지 알 수 없다. 바로 여기서 특수 상대론이 출발한다.
영희나 철수 둘 중 하나가 광속에 가까운 속도로 등속 운동 한다고 하면, 관측자는 철수를 관측하는 영희와, 영희를 관측하는 철수로 나누어진다. 이때, 영희는 철수가 광속 c(에 극히 가까운 속도)로 이동 중인 모습을 관측할 것이고, 철수 또한 영희가 광속 c(에 극히 가까운 속도)로 이동 중인 모습을 관측하게 된다. 당연히 서로 상대방이 광속에 가까운 속도로 운동 중이고 자신은 정지해 있다고 판단한다! 시간지연이 발생했을 때, 철수는 영희의 시계가, 영희는 철수의 시계가 느리게 간다고 판단한다. 즉, 모든 것은 상대적이라는 개념이다.
특수상대성이론의 요지는 딱 두 가지다. 상대성 원리와 광속 불변의 원리.
특수 상대론은 기본적으로 등속계를 다룬다. 절대 가속하는 계를 다루는 상대론이 아니므로, 특수 상대성 이론에 쌍둥이 패러독스를 가져오게 되면 모순이 발생한다.[6]
이게 전부다. 사실 사람들이 그렇게 떠들어대던 길이가 짧아진다느니, 시간이 느리게 간다느니 하는 건 순전히 부수적인 결과물에 지나지 않는다. 결국 이런 결과도 로런츠 변환의 부수적인 결과물이고, 로런츠 변환 역시 저 요지의 부산물에 지나지 않는다.
상대론은 저 두 원리가 모든 물리법칙에 적용될 것을 요구한다. 저 두 원리는 물리학의 기본 원칙들이라는 뜻이다.
상대성 원리야 그렇다 치더라도 광속 불변의 원리를 기본 원칙으로 받아들이라는 건 기존의 상식으로는 힘든 일이다. 그러나 이 두 원리를 거부하면 일단 맥스웰 방정식, 즉 전자기학을 받아들일 수가 없게 된다.[7] 이런 식으로 광속 불변의 원리에 물리법칙이 지배되는 경우를 가리켜 로런츠 불변이라고 부른다. 이제 모든 (의미 있는) 물리량, 물리법칙은 이 로런츠 불변을 만족해야 한다.
4.1. 상대성 원리
☞ 상대성 원리[8]: 짧게 말하자면 두 관성 좌표계에서 물리 법칙들은 똑같이 적용된다는 것이다. 이것을 완전히 이해하려면 관성 좌표계가 무엇인지 이해하는 것이 필요하다.[9] |
먼저 좌표계를 살펴 보자. 별거 없다. 그냥 원점 잡고 시간, 공간 좌표를 잡은 것으로 보면 된다. 어떻게 보면 변수 [math((t, x, y, z))], 그리고 그 기준(원점)을 잡은 셈이다. 물론 [math((x, y, z))] 대신 구면좌표계 [math((r, \theta, \phi))]로도 잡을 수 있는데, 직교 좌표계로 잡는 것은 관성 좌표계를 표현하는 데 있어서 가장 적합하다는 점에서 특별하다.
Landau, Lifshitz의 Mechanics에서는 관성 좌표계가 균질(homogeneous)하고 등방(isotropic)인 좌표계라고 정의한다. 평행이동과 회전을 시켜도 뭐가 바뀌는 게 없다는 것이다. 한 실험실을 생각하자. 이 실험실은 근처에 지구도 태양도 없는 텅 빈 우주 공간에 덩그러니 놓여 있어 주변에 영향을 주는 것조차 없다. 이런 실험실에서 어떤 물리 실험을 한다고 치자. 이제 이 실험실과 완전히 똑같은 실험실이 하나 더 있다고 하자. 이 실험실은 처음 실험실과 위치가 다르거나 혹은 좀 돌아가 있을 뿐이다. 어떻게 보면 처음 실험실을 이동시킨다든가 돌려 놓는다든가 한 것과 똑같은 것인 셈이다. 그러면 이 두 실험실에서 같은 실험을 했을 때 두 실험의 결과는 달라질까? 이것은 마치 서울에서 실험하나 뉴욕에서 실험하나 결과는 똑같을 것이라는 주장을 한층 더 강화시킨 것이다. 아니면 실험 장비를 북향으로 해 놓고 실험하나 남향으로 놓고 실험하나 결과는 그게 그거라는 얘기.[10] 여기서 균질성은 평행이동에 상관 없다는 것, 등방성은 회전에 상관 없다는 것을 가리킨다.
이제 한 실험실에서 다른 실험실이 실험한 것을 보는 상황을 생각해 보자. 예를 들어 두 실험실 모두 동일한 탁자를 쓰고 있고 원점을 둘 다 각자의 탁자 정중앙으로 잡았다고 했을 때 실험실 [math(\mathrm B)]가 실험실 [math(\mathrm A)]에서 잡은 좌표계에서 [math((\mathrm{10 m, 0 m, 0 m)})]에 해당하는 위치에 있다고 치자. 그러면 [math(\mathrm B)](의 좌표계)에서 [math((\mathrm{1 m, 2 m, 3 m}))]에 있다고 관측된 물체는 [math(\mathrm A)]의 좌표계에서 [math(\mathrm{(10m, 0m, 0m) + (1 m , 2 m, 3 m) = (11 m, 2 m, 3 m)})]에 있다고 관측될 것이다. 그런데 두 실험실 모두 같은 물리 법칙으로부터 같은 결과가 나왔으므로 [math(\mathrm B)]의 좌표계에서 설명하든 [math(\mathrm A)]의 좌표계에서 설명하든 결과는 똑같이 나와야 할 것이다. 즉, [math(\mathrm A)]에서 [math((\mathrm{11 m, 2 m, 3 m}))] 같은 것으로 설명하나 [math(\mathrm B)]에서 [math((\mathrm{1 m, 2 m, 3 m}))] 같은 것으로 설명하나 잘 들어맞는다는 뜻이다. 결과적으로 원점을 처음과 다르게 잡는다든가 좌표 축을 좀 돌려 놓는다든가 한다고 해서 물리 법칙이 다르게 적용되지는 않는다는 것이다. 이것이 균질성과 등방성이 말해주는 것이다. 이러한 성질은 물리 법칙들을 직교좌표계로 나타냈을 때에만 잘 드러난다, [math(\vec{F} = m \vec{a} = m \dfrac{d^2 \vec{x}}{dt^2})]를 직교좌표계와 구면 좌표계에서 각각 표현한 다음, 평행이동과 회전 변환을 시켰을 때 이 법칙이 어떻게 바뀌어 써지는가를 보면 잘 알 수 있는 사실이다. 이런 (좌표) 변환에 대해 물리 법칙이 바뀌지 않는 것을 가리켜 물리학자들은 대칭성(symmetry) 혹은 불변성(invariance)라고 부른다. 불변성은 (고급) 물리학을 관통하는 매우 중요한 키워드다.[11]
이러한 관성 좌표계의 성질들이 시간, 공간의 평행이동과 공간에서의 회전에 의한 불변성 뿐만 아니라 좌표계의 '속도'를 바꾸는 것에 대해서도 불변한다는 것을 암시한다. 관성 좌표계의 균질성과 등방성은 두 실험실이 서로 등속도로 움직이고 있어도 두 실험실에서 같은 실험을 했을 때 얻는 결과는 똑같다는 것을 말해 준다는 것이다. 따라서 두 관성 좌표계 간의 변환은 평행 이동과 회전만 있는 것이 아니라는 이야기이다. '실험실의 속도를 바꾸는 것'에 해당하는 변환 역시 관성 좌표계 간의 변환이 되는 셈이다. 그리고 상대성 원리는 다름 아닌 평행 이동, 회전, 그리고 '속도와 관련된 변환'에 대해 물리 법칙들이 불변성을 가져야 한다는 것을 요구하는 원리다.
하지만 여기서 문제는 '속도와 관련된 변환'이 무엇이냐는 것이다. 고전 역학에서는 관측을 통해 갈릴레이 변환이 그 변환에 해당된다고 여겼다. 이 변환은 공간의 평행 이동, 회전과 같은 변환들과 완전히 별개의 것으로 치부될 수밖에 없는 구조를 가지고 있었고, 이는 오랫동안 시간과 공간이 서로 별개의 것이라는 개념이 유지되도록 했다. 그런데 '속도와 관련된 변환'은 사실 유일하지 않다. 갈릴레이 변환도 있지만 로런츠 변환도 있지 않은가. 이러한 문제를 해결해 주는 것이 바로 다음 원리인 광속 불변의 원리다.
4.2. 광속 불변의 원리
☞ 광속 불변의 원리: 어떤 속력이 존재하여, 한 관성 좌표계에서 이 속력을 가지고 운동하는 것으로 관측된 물체는 다른 관성 좌표계에서도 그 속력으로 운동하는 것으로 관측된다는 말이다. 통상 이 속력을 빛의 속도라고 표현하고 수식에서는 [math(c)]로 표기된다. |
위에서 설명한 바에 의하면 두 똑같은 실험실이 위치가 서로 다르고 방향이 달라도 같은 실험에 대해 같은 결과를 얻는다고 했었다. 광속 불변의 원리는 한 실험실에서 [math(c)]로 진행하는 물체가 다른 실험실에서도 [math(c)]로 진행하는 것으로 관측될 거라고 말해 준다. 그리고 한 실험실에서 다른 실험실의 그런 물체를 봐도 그 물체는 [math(c)]로 진행하는 것으로 관측될 것이고 다른 데에서 보든 좀 돌아서 보든 어떤 물체의 속력이 다르게 측정되지 않으리라는 것은 상식적으로 당연해 보인다.
그런데 광속 불변의 원리는 서로 속도가 다른 두 관성 좌표계끼리 봐도 그 물체의 속력이 여전히 [math(c)]의 속력을 가질 것이라는 것을 말해 준다. 즉, 실험실 B가 실험실 A로부터 멀어지는, 혹은 A에 접근한다고 했을 때, 둘 다 똑같이 [math(c)]로 움직이는 물체를 각각 관측했다면 A에서 B의 물체를 관측했을 때에도 그 물체의 속력은 여전히 [math(c)]라는 것이다. 이것은 상식에 어긋나 보인다. 만약 실험실 B가 실험실 A에 대해 [math(\vec{V})]의 속도로 움직이고 있을 때, 실험실 B에서 [math(\vec{v})]로 움직이는 것으로 관측된 물체는 실험실 A에서 [math(\vec{v} + \vec{V})]의 속도를 가지는 것으로 측정될 것이다. 그리고 이것은 전적으로 갈릴레이 변환의 결과다. 광속 불변의 원리는 이러한 상식이 잘못되었다고 이야기하며 대신할 새로운 기준을 제시해 준다. 상대성 원리에서 '속도와 관련된 변환'이 있다고 했었고, 이 변환은 상대성 원리와 관성 좌표계의 정의만으로 정해지지 않는다고 말했었다. 광속 불변의 원리는 그 변환이 갈릴레이 변환이 아니라는 것을 말해 주는 동시에 그 변환을 완전하게 결정해 준다.
상대성 원리가 맞다면 맥스웰 방정식도 참이니까 그와 동치인 광속 불변 원리는 필요가 없지 않느냐라고 생각할 수 있지만, 특수 상대성 이론이 성립되고 나면 고전 역학은 전부 수정 대상이 되어, 속도, 가속도, 힘 등을 모조리 다시 정의한 뒤 공식을 세워야 한다. (실제로, 상대성 이론이 발표된 뒤 플랑크 등 여러 물리학자들은 기존 역학을 하나하나 수정하는 후속 작업을 진행하였다.) 광속 불변의 원리는 맥스웰 방정식이 상대성 원리의 주인공임을 선언하는 역할을 한다.
5. 로런츠 변환과 로런츠 불변성
로런츠 변환은 갈릴레이 변환의 대체물이며, 로런츠 불변이라고 하면 사실 이 로런츠 변환에 대하여 불변이라는 뜻이다. 우리가 아는 특수상대론에 대한 괴상한 이야기들은 전부 이 로런츠 변환에서 온 것. 하지만 물리학에서 로런츠 불변성이 갖는 의미는 생각보다 크다. 상대성 원리를 확장시킴과 동시에 엄청나게 강화시킨 셈.상대성 원리와 광속 불변의 원리를 가정한다는 것은 수학적으로 다음과 같이 표현될 수 있다. 한 관성 좌표계 O를 잡았을 때, 빛이 한 사건(Event, 4차원 시공간에서의 한 점) [math((ct_0, x_0, y_0, z_0))]에서부터 출발하여 매우 가까운 점 [math((c(t_0 + dt), x_0 + dx, y_0 + dy, z_0 + dz))]만큼 이동했다고 하자. 그러면 다음이 성립한다.
[math(c^2 dt^2 - dx^2 - dy^2 - dz^2 = 0)][12]
이때 다른 관성계 O'에서 이를 바라 보는 것을 생각해 보자. 그러면 아까 두 점을 각각 [math((ct'_0, x'_0, y'_0, z'_0))]과 [math((c(t'_0 + dt'), x'_0 + dx', y'_0 + dy', z'_0 + dz'))]로 표기할 수 있다. 그런데 광속 불변의 원리에 따라 다음이 성립한다.
[math(c^2 (dt')^2 - (dx')^2 - (dy')^2 - (dz')^2 = 0)]
상대성 이론이 말해주는 것은 관성계끼리의 좌표 변환이 위와 같은 조건을 만족해야 한다는 것이다. 즉, [math(c^2 dt^2 - dx^2 - dy^2 - dz^2)]가 0이면 관성계 간의 좌표 변환에 의해 바뀐 결과 역시 0이어야 한다. 그러한 좌표 변환 중에서 선형성 등의 조건을 만족하는 변환 [math((ct, x, y, z) \to (ct', x', y', z'))]를 [math(A)]라고 표기하자. 그러면 [math(A)]는 4×4 행렬로 표시되며, 열(column) 벡터 [math((ct, x, y, z))](의 왼쪽)에 곱해져서 열 벡터 [math((ct', x', y', z'))]로 만드는 변환으로 이해할 수 있다. 이때 이러한 선형성 등의 조건을 잘 따져 보면 [math(c^2 dt^2 - dx^2 - dy^2 - dz^2 = 0)]이 일정해야 한다는 조건을 다음과 같이 확장시킬 수 있다. 한 관성 좌표계에서 [math(ds^2 = c^2 dt^2 - dx^2 - dy^2 - dz^2)]가 정해지면, 다른 관성 좌표계로 변환된 결과, 즉 [math((ds')^2 = c^2 (dt')^2 - (dx')^2 - (dy')^2 - (dz')^2)]는 일정, 즉 [math(ds^2 = (ds')^2)]이 성립해야 한다는 것이다. 다시 말해, [math(ds^2 = c^2 dt^2 - dx^2 - dy^2 - dz^2)]는 관성 좌표계 간의 변환에 대해 불변하다. 이러한 성질을 만족하는 선형 변환을 로런츠 변환이라고 부른다.
[math(J)]를 크기가 4×4이고 대각 성분이 순서대로 1, -1, -1, -1인 대각행렬이라 하자.[13] 앞에서 보인 수학적 성질에 의해 임의의 로런츠 변환 [math(A)]는 항상 다음을 만족시킨다는 것을 알 수 있다.
[math(A^T J A = J)]
(여기서 [math(A^T)]는 [math(A)]의 전치(transpose)행렬.)
이 성질로부터 또한 우리가 아는 로런츠 변환식들을 얻어낼 수 있다. 일반적으로 위 식을 만족하는 행렬 A는 항상 다음과 같은 꼴로 표현이 된다.
[math(A = O_1 A_0 (O_2)^{-1})]
여기서 [math(O_1, O_2)]는 3차원 공간 성분을 유클리드 회전을 시키는 변환들에 해당하며, 그 모양은 (1, 1)-성분이, 1, (i, 1), (1, j)-성분들이 다 0, 나머지 3×3 행렬 성분이 3차원 회전 변환(orthogonal 행렬) 꼴인 형태이다. 특히 [math(O_2)]는 x축을 특정한 방향으로 돌리는 변환이다. 따라서 [math((O_2)^{-1})]는 그 역변환으로, 그 특정한 방향을 x축으로 돌리는 변환이다. 이러한 변환이 필요한 이유는 [math(A_0)]를 간단하게 표현하기 위함인데, 이때 [math(A_0)]의 각 성분들은 다음과 같이 쓸 수 있다.
[math(A_0 = \left( \begin{array}{cccc} \gamma \;\;& -\gamma \beta \;\;& 0 \;\;& 0 \\ -\gamma \beta \;\;& \gamma \;\;& 0 \;\;& 0 \\ 0 \;\;& 0 \;\;& 1 \;\;& 0 \\ 0 \;\;& 0 \;\;& 0 \;\;& 1 \end{array} \right))]
그리고 나머지 성분들, 예컨대 [math((A_0)_{31})] 같은 것들은 전부 0이다. 여기서 [math(\beta = \dfrac{v}{c})]이며 [math(\gamma = \dfrac{1}{\sqrt{1 - \beta^2}})]이다. 즉, 여러분이 잘 아는 로런츠 변환식인 것이다! 만약 [math(A_0)]를 한 4차원 점 [math((ct, x, y, z))](를 4x1 행렬로 나타낸 것)의 왼쪽에 곱하면 그 결과로 나타나는 점 [math((ct', x', y', z'))]들은 정확하게 여러분이 아는 그 로런츠 변환 공식이 된다. 즉,
[math(x' = \gamma (x - \beta (ct)) = \gamma (x - vt), t' = \dfrac{1}{c} \gamma (-\beta x + (ct)) = \gamma (t - \dfrac{vx}{c^2}))]
이때 행렬 [math(A_0)]는 로런츠 부스트라고 부른다. 이 행렬은 한 계의 점(이벤트)들이 x축 방향으로 속력 v로 날아가는 입자의 정지계에서 어떤 점들로 보내지는지를 결정해 준다. 왼쪽에 곱해주는 것으로 말이다. 이제, 이로부터 [math((O_2)^{-1})]의 의미가 분명해진다. 속도 [math(\vec{v})]가 주어져 있고[math(O_2)]가 x축 방향을 [math(\vec{v})]와 나란하게 회전시키는 변환이라고 하자. 다음 변환 [math(O_2 A_0 (O_2)^{-1})]는 이런 변환이다.
[math(\vec{v})]를 x축과 나란한 방향으로 돌려 놓기
→ [math(v)]만큼 로런츠 부스트
→ 다시 x축을 원래 [math(\vec{v})]과 나란한 방향으로 돌려 놓기
결과적으로 이 변환은 [math(\vec{v})]의 방향으로 [math(v)]만큼 로런츠 부스트를 취한 것과 같다! 원래 일반적인 [math(A)] 식을 보면 맨 앞에 [math(O_2)]가 아닌 [math(O_1)]이 붙어 있는데, 이는 [math(O_1 = O_3 O_2)]로 다시 썼을 때, [math(\vec{v})] 방향으로 v만큼 로런츠 부스트를 가한 다음, [math(O_3)]로 회전시키라는 뜻이다. 다시 말해 공간 축도 나중에 또 돌리겠다는 뜻이다. 물론 [math(O_3)]는 단순히 단위 행렬일 수도 있다. 그러면 [math(A)]는 로런츠 부스트만 있는 셈. 반대로 [math(A_0)]가 단위 행렬일 경우, 남는 건 [math(A = O_3)]이고, 따라서 단순한 3차원 공간의 회전 변환이 된다. 즉, 로런츠 변환을 나타내는 행렬은 일반적으로 공간의 회전까지 포함하고 있는데, 만약 로런츠 부스트를 시간과 공간을 같이 회전시키는 변환으로 보면, 로런츠 변환은 4차원 시공간의 (선형) 회전 변환을 의미하게 된다! 실제로 로런츠 변환은 다음 값을 바꾸지 않는다.
[math(ds^2 = c^2 dt^2 - dx^2 - dy^2 - dz^2)]
이것은 3차원에서의 미소 길이 [math(ds^2 = dx^2 + dy^2 + dz^2)]과 비슷하다. 현대 기하학에 따르면 이러한 '길이'를 불변시키는 변환을 회전이라고 부른다. 그런 의미에서 로런츠 변환은 4차원 시공간의 회전을 의미한다고 볼 수 있다.
이제 이걸 물리에서 생각해 보자. 3차원 공간만 놓고 생각했을 때, 회전과 물리 법칙 간의 관계를 생각해 보자. 우리가 어떤 실험 혹은 관측을 하고 있는 상황이라고 가정해 보자. 예를 들어 특정한 전하 분포를 만들어 맥스웰 방정식을 확인하는 중이라고 하자. 아예 주변의 다른 영향들을 제거하기 위해 이 실험이 주변에 지구도 태양도 아무 것도 없는, 태양계를 비롯해 모든 것으로부터 아주아주 먼 우주 공간에서 이루어진다고 해 보자. 이때 이 실험실이 통째로 조금 돌아간다고 해서 실험 결과가 바뀔까? 혹은 맥스웰 방정식이 다르게 적용될까? 그건 아닐 것이다.[14] 이렇듯, 일반적으로 회전에 대해서 물리 법칙은 변하지 않아야 할 것이다. 3차원 회전의 경우 맥스웰 방정식 뿐만 아니라 뉴턴 역학도 변하지 않으며 뉴턴의 중력 법칙 또한 그렇다.
그런데 뉴턴 역학은 갈릴레이 변환에서 변하지 않지만 맥스웰 방정식은 그렇지 않다. 맨 위 소개에서 나왔던 상황인 것이다. 따라서 만약 갈릴레이 변환을 우리 자연이 갖고 있는 '회전'이라고 본다면 맥스웰 방정식은 물리 법칙으로 보기 어려워지게 된다. 하지만 아인슈타인의 아이디어와 통찰력으로 얻어진 결과에 따르면 자연의 진짜 '회전'은 3차원 회전 + 갈릴레이 변환이 아니라 로런츠 변환인 것이다.[15] 그리고 맥스웰 방정식인 이 회전에 대해 불변이다. 따라서 맥스웰 방정식은 상대성 이론, 즉 로런츠 변환이 자연의 진정한 회전이라는 프레임[16] 아래에서 올바른 이론인 것이고, 지금까지 관측된 결과에 따르면 맥스웰 방정식 뿐만 아니라 모든 물리 법칙에 대해서도 그래야 할 것임이 분명하다.
이러한 상대성 이론의 틀 안에서는 어떤 양이 물리적으로 의미를 가지는가를 논할 수 있게 된다. 예를 들어 속도의 x좌표 값은 그 하나 만으로 물리적인 의미가 없다. 이 값이 의미를 가지려면 다른 성분들도 모두 필요하게 된다. 이해를 쉽게 하기 위해 뉴턴 역학에서 설명하도록 하자. 이 경우 y좌표 값과 z좌표 값이 같이 있어야 속도는 그 물리적 의미를 갖는데, 사실 그 이유는 간단하다. 회전을 시킬 때 x좌표 값 하나만 가지고 속도의 x좌표 값이 변하는 게 아니기 때문이다. 게다가 그 변환은 우리가 아는 행렬 곱 변환이다. 이러한 이유로 인해 백터는 주어진 회전 변환에 대해 행렬 곱 형식으로 변환이 되는 물리량을 의미한다. 스칼라도 그런 식으로 해석이 되어야 한다. 단순히 크기만 갖는, 즉 성분이 하나 짜리인 물리량이 아니라는 것이다. 정확하게, 스칼라는 회전 변환에 대해서 그 양이 전혀 변하지 않는 물리량을 가리키는 말이다. 따라서 속도의 x 성분은 스칼라도 아니다. 반면에 뉴턴 역학의 경우 속력(속도의 크기)은 스칼라인데, 벡터의 크기는 회전 변환에 대해 변하지 않기 때문이다. 이런 식으로 텐서가 정의될 수 있는데, 성분은 여러 개이면서 각 인덱스 별로 회전 변환이 따로 적용이 된다면 그것을 텐서라고 부를 수 있다. 그러면 벡터는 딱 하나의 인덱스만 갖는 텐서로 볼 수 있을 것이다. 말로 하면 어려운데, 이걸 수식으로 나타내면 이렇다. 회전 변환을 나타내는 행렬을 [math(A)]라고 하자. 그리고 그 성분들을 [math(A_{ij})]라고 표기하자. 그러면 스칼라 [math(s)], 벡터 [math(\vec{v})], (인덱스가 2개인) 텐서 [math(T_{ij})]는 [math(A)]에 의한 회전에 대하여 다음과 같이 변환된다.[17]
[math(\begin{aligned} s & \to s \\
(\vec{v})_i & \to \sum_{j = 1}^3 A_{ij} (\vec{v})_j \\
T_{ij} & \to \sum_{r = 1}^3 \sum_{s = 1}^3 A_{ir} A_{js} T_{rs} \end{aligned})]
뉴턴 역학에서 벡터가 아닌 텐서로 좋은 예는 아무래도 관성 모멘트 텐서일 것이다. 정확하게 위와 같이 변환을 한다. 아무튼, 이런 식으로 물리량들은 변환이 되어야 하며, 그렇지 않은 양들은 물리적인 의미를 부여하기 어렵다. 만약 주어진 한 양이 잘 정의된 물리량이려면 반드시 위와 같은 변환을 만족시키기 위한 다른 물리량들이 있어야 할 것이다. 좀 전에 예를 든 속도의 x 성분이 그 예인데, 이 값이 진정 물리적으로 의미를 가지려면 나머지 y 성분과 z 성분이 필요하다. 즉, 3개의 물리량이 필요하다는 것이다. 스칼라의 경우라면 하나만 있어도 되겠지만. 인덱스 2개 텐서라면 9개가 필요할 것이다. 즉, 1, 3, 9, ..., 3n개의 성분이 물리적으로 의미있는 양이 되기 위해 필요한 셈이다.
상대성 이론에서는 이것을 그대로 확장한 논리로 물리량들을 꽉 잡는다. 그러고 보면 고등학교 때에도 이런 얘기는 못 들어 봤잖은가. 희한하게도 이 논리는 상대성 이론에서 제대로 써먹힌다. 물론 상대성 이론을 배우거나 써먹기 전에는 좀 전에 말한 회전이며 진짜 물리량이며 하는 것들이 별 쓸모가 없을지도 모른다. 하지만 물리학의 베이스를 아예 새로 다지는 상대성 이론의 경우 이러한 논리는 무척 중요하다. 특히 이론을 만들고자 하는 경우라면. 아무튼, 상대성 이론은 스칼라, 벡터, 텐서 등으로 표현되는 물리량이 진정 물리적으로 의미가 있다는 것을 강조한다. 사실 더 있긴 한데, 스피너가 바로 그것이다. 이것은 로런츠 변환의 '표현(representation)'를 이해해야 알 수 있는 양인데… 자세한 내용은 해당 문서 참조. 이러한 논리 기반 위에 맥스웰 방정식이 견고해지고 일반 상대성 이론이 세워질 수 있는 것이다.
상대론으로 돌아가 보자. 뉴턴 역학의 경우에서 써먹었던 그 논리를 그대로 적용시키고자 한다면 일단 '3차원 회전'을 '4차원 로런츠 변환'으로 바꿔야 한다. 그렇다면 필요한 성분의 수도 바뀌어야 한다. 회전 변환의 행렬이 더 이상 3×3이 아닌 4×4니까. 따라서 상대성 이론의 경우라면 스칼라 1개, 벡터 4개, 인덱스 2개 짜리 텐서 16개, …와 같이 말이다.
더군다나 상대성 이론의 경우라면 3차원의 경우와 다른 형태의 변환도 가능하다. 다음 식들이 이를 보여주는데, 첫 번째 식은 기존의 식이고 두 번째 식은 새로운 식이다.
[math(\begin{aligned}u^\mu & \to \sum_{\nu = 0}^3 A^{\mu}_{\nu} u^\nu \\
u_\mu & \to \sum_{\nu = 0}^3 (A^{-1})_{\mu}^{\nu} u_\nu \end{aligned})]
여기서 위 첨자로 붙은 것들은 제곱이 아니라 인덱스 번호다. 착각하지 말 것.[18] 그리고 성분의 번호는 1, 2, 3, 4가 아닌 0, 1, 2, 3으로 매겨지며, 이들 네 개를 한꺼번에 가리키는 인덱스일 경우 그리스 문자로, 0 빼고 나머지(1, 2, 3)만 나타내는 인덱스인 경우 알파벳(i, j, k, ...)으로 보통 표기한다.[19] 표기법은 이쯤 하고, 표기법만 바뀌었지 첫 번째 식은 3차원에서의 기존 식과 다를 게 없다. 두 번째 식은 좀 다르다. 사실 3차원의 경우에는 회전 행렬의 특성 상 위 두 식이 사실 상 다를 게 없는 식들인데, 로런츠 변환 아래에서는 그렇지 않다. 첫 번째 식과 같이 변환되는 경우 주어진 물리량이 contravariant(반변)하다고 하고, 두 번째 식과 같이 변환되는 경우에는 covariant(공변)하다고 한다. 수학적으로 보면 듀얼(dual)의 개념과 맞닿아 있는 것인데, 자세한 설명은 생략하자…
하나 더. 상대성 이론으로 기술되는 경우에 주어진 텐서(스칼라, 벡터 포함)들로 또 다른 텐서들을 만들어 낼 수 있다. 예컨대 두 벡터 [math(A^\mu)]와 [math(B^\mu)]를 생각해 보자. 그러면 [math(A^\mu B^\nu)] 같이 성분들을 곱해서 얻은 물리량은 인덱스가 2개인 텐서로 볼 수 있다. 실제로 위에서 쓴 변환을 적용시키면 저 식이 텐서의 로런츠 변환을 잘 만족한다는 것을 알 수 있다. 한편, 이렇게 인덱스 수가 늘어나는 경우 말고 인덱스 수를 줄여주면서 로런츠 변환을 만족하는 물리량을 만들 수 있다. 예를 들어 텐서 [math(C^{\mu \nu})]가 있다고 하자. 이때 [math(\eta_{\mu \nu})]를 [math(\mu = \nu = 0)]일 때 1, [math(\mu = \nu = 1, 2, 3)]일 때 -1, [math(\mu \ne \nu)]일 때 0인 값이라고 하자. 그러면
[math(C^\mu_\mu := \eta_{\mu \nu} C^{\mu \nu})][20]
은 로런츠 변환을 가해도 변하지 않는다는 것을 알 수 있다. (우변의 네 인덱스에 대해 각각 로런츠 변환을 가한 다음 정리해 보면 금방 알 수 있다.) 이런 식으로 두 개의 다른 인덱스를 줄여주는 것을 축약(contraction)이라고 부른다. 이러한 축약은 위에서 들었던 [math(A^\mu B^\nu)]에도 적용이 가능하다. 즉, [math(A^\mu B_\mu)] 같은 게 가능하다. 그리고 [math(\eta_{\mu \nu})]는 하나의 텐서처럼 행동한다. 아예 주어진 contravariant 벡터를 가지고 [math(B_\mu = \eta_{\mu \nu} B^\mu)]와 같은 covariant 벡터를 만들 수 있다. 사실 텐서 [math(\eta_{\mu \nu})]는 상대성 이론에서 매우 중요한 역할을 하는 것으로, 위에서 로런츠 변환 행렬을 설명할 때 썼던 행렬 [math(J)]와 같은 것이다. 대각 성분이 모두 같지 않고 하나(시간 축에 해당하는 것)만 부호가 다른 것은 상대성 이론이 그리는 시공간의 기하학을 잘 드러낸다.
6. 축약과 내적, 기하학적 해석
한편으로 축약은 기하학적으로 스칼라 곱 혹은 내적과 같은 것으로 볼 수 있다. 3차원 유클리드 공간에서 두 벡터의 내적은 [math(\vec{v} \cdot \vec{w} = \sum_{i = 1}^3 v_i w_i)]로 주어지는 것임을 안다. 이 식은 사실 이렇게 쓸 수 있다.[math(\vec{v} \cdot \vec{w} = \sum_{i = 1}^n \sum_{j = 1}^n \delta_{ij} v_i w_j)]
물론 [math(\delta_{ij})]는 크로네커 델타로, 두 인덱스(i, j)가 같으면 1, 다르면 0인 값이다. 생략된 [math(\delta_{ij})]가 사실 '3차원 유클리드 공간'을 나타내 주는 것이라고 말할 수 있는 것이다. 모든 벡터 공간에는 이런 식으로 자연스럽게 내적을 정의할 수 있는데, 그 방법은 정말 다양하다. 그중 하나가 바로 3차원 유클리드 공간이고 물론 위 식에서 n을 4로 바꿔 쓰면 (혹은 n은 3으로 두고 맨 처음 인덱스만 1이 아닌 0으로 시작하게 하면) 저 식은 '4차원 유클리드 공간'에서의 내적이 되는 것이다.
다시 4차원에서 두 벡터의 축약을 보자. (이해를 돕기 위해 잠시 합 기호([math(\sum)])를 살렸다.)
[math(\displaystyle A^\mu B_\mu = \sum_{\mu = 0}^3 \sum_{\nu = 0}^3 \eta_{\mu \nu} A^\mu B^\nu)]
위에서 쓴 유클리드 공간에서의 내적 식과 거의 똑같다. 다만 [math(\delta_{ij})]가 [math(\eta_{\mu \nu})]로 바뀌었을 뿐이다. 이것은 '4차원 유클리드 기하학'과 4차원 시공간의 기하학이 다르다는 것을 의미한다. 두 기하학이 다르다는 것은 위에서도 밝혔던 것이지만, 그것이 내적에서 드러나는 것으로 이해하는 것은 상대성 이론을 이해하는 데 있어서 매우 중요한 내용이다. 사실 내적이 이렇게 주어진다는 것 자체만으로도 관성 좌표계 간의 좌표 변환이 반드시 로런츠 변환이어야 한다는 것을 의미하기도 한다.[21] 즉, 축약(내적)을 정한다는 것, 그러니까 내적 식에서 [math(\delta_{ij})] 혹은 [math(\eta_{\mu \nu})] 또는 다른 것들 중 어떤 것이 들어가느냐 함을 정한다는 것은 곧 관성 좌표계 간의 좌표 변환을 결정한다는 것이고, 한편으로는 (시)공간의 기하학적 성질을 결정지어 준다는 것이다.
그리고 [math(\delta_{ij})] 혹은 [math(\eta_{\mu \nu})] 자리에 뭐가 들어가느냐 하는 문제는 나중에 일반 상대성 이론에서 중요한 역할을 하게 된다.
7. 로런츠 불변성의 예
특수상대성이론의 특수란 말은, 이 이론이 등속도로 운동하는 관측자가 보는 경우에 한정된 특수한 이론이라는 의미다.앞서 살펴본 내용들은 일반물리학에서도 잘 다루지 않을 정도로 꽤 까다로운 개념들이다. 하지만 과학에 관심이 있는 사람이라면 누구나 시간 지연, 길이 수축, 질량-에너지 동등성 등을 많이 들어보았을 것이다. 사실 광속 불변의 원리에 철저히 입각하면 시간이 늦게 흘러가거나, 길이가 줄어드는 이유를 무리 없이 설명할 수 있다. 특히 시간이 늦어지는 현상은 일반인에게 정성적으로 설명하는 방식이기도 하다.
여기서 어떤 계산을 하게 되면 [math((ct)^2-(x^2+y^2+z^2))]라는 값이 이 값을 관측하는 관성계와 관계 없이 같다는 결과를 얻기 때문에 4차원과 연관짓기 시작했다고 한다.[22] 이를 시공간 거리라고 부르며, 사실 로런츠 변환을 유도함에 있어서 결정적인 역할을 하는 식이다. 또한, 위에서 말한 시공간 거리의 일정은 로런츠 변환 아래에서 일정하다는 뜻으로, 이는 시공간 거리와 로런츠 변환을 이용하여 새로운 기하학[23]을 만들어낼 수 있다는 의미이기도 하다. 이와 관련된 기하학이 바로 쌍곡선 기하학. 즉, 우리 우주를 지배하는 기하학은 우리가 아는 유클리드 기하학과는 판이한 것이다.[24][25]
- [2차원 시공간 쌍곡선 증명]
어떤 1차원의 시간과 1차원의 공간으로 만들어진 시공간의 사건 [math((t,x))]의 로런츠 변환은
[math(t' = \gamma \left( t-\dfrac{v}{c^2}x \right))]
[math(x' = \gamma (x - vt))]
그렇다면
[math(\begin{aligned} c^2 (t')^2-(x')^2 &= \gamma^2 \left( c^2t^2 - 2vtx + \dfrac{v^2}{c^2}x^2 \right) -\gamma^2(x^2 -2vtx + v^2t^2)=\gamma^2 \left( c^2t^2 + \dfrac{v^2}{c^2}x^2 - x^2 - v^2t^2 \right) \\
&= \dfrac{1}{1-\dfrac{v^2}{c^2}} \left( c^2t^2 +\dfrac{v^2}{c^2}x^2 - x^2 - v^2t^2 \right) = \dfrac{c^2t^2}{1-\dfrac{v^2}{c^2}}+\dfrac{v^2x^2}{c^2-v^2}-\dfrac{x^2}{1-\dfrac{v^2}{c^2}}-\dfrac{v^2t^2}{1-\dfrac{v^2}{c^2}} \\
&= \dfrac{c^4t^2}{c^2-v^2}+\dfrac{v^2x^2}{c^2-v^2}-\dfrac{c^2x^2}{c^2-v^2}-\dfrac{v^2c^2t^2}{c^2-v^2} = \dfrac{c^4t^2 + v^2x^2 - c^2x^2 -v^2c^2t^2}{c^2-v^2} = \dfrac{\cancel{(c^2-v^2)}(c^2t^2-x^2)}{\cancel{c^2-v^2}} = c^2t^2 - x^2 \end{aligned})]
[math(\therefore c^2 (t')^2-(x')^2 = c^2t^2 - x^2)]
어떤 사건의 [math(s^2 = c^2t^2 - x^2)]은 관성계에 상관없이 일정하다는걸 알 수 있다. 즉, 로런츠 변환이란 민코프스키 시공간의 쌍곡선 회전이다. 다시 말해서 어떤 시공간의 사건을 민코프스키 그래프 위에 있는 점으로 표현하고 이 점을 지나는 (초점이 x 또는 y축에 있는) 쌍곡선을 그린다면, 그 어떤 로런츠 부스트를 몇번이나 거쳐도 이 점은 이 쌍곡선을 벗어날 수 없다.[26] 로런츠 부스트를 머리속으로 그릴때 상당히 도움되는 사실이니 알아두면 좋다.[27]
7.1. 시간 지연
7.2. 길이 수축
7.3. 질량-에너지 동등성
8. 기하학적 접근
특수 상대성 이론을 더욱 체계적으로 접근하기 위해서는 시공간을 도입하여 그 기하학과 좌표 변환(로렌츠 변환)의 의미, 빛원뿔(light cone)에 대해 익힌 다음 벡터, 듀얼 벡터, 텐서 등 4차원 기하학적 양에 물리량들을 대응시켜야 한다. 각각은 다음 개별 문서에 상세히 다루고 있다.8.1. 민코프스키 다이어그램
민코프스키 공간, 빛원뿔, 로런츠 변환에 대해 다룬다.8.2. 상대론적 역학
속도, 운동량, 가속도, 힘 등을 4차원 벡터를 이용해 재정의한다. 이 때 에너지는 4차원 운동량의 시간 성분이다.8.2.1. 에너지-모멘텀 텐서
질량과 에너지, 압력과 전단력을 모두 모아 물질을 가장 일반화된 형태로 다루고, 에너지-운동량 보존법칙을 유도한다.8.3. 상대론적 전자기학
전자기장 혹은 퍼텐셜의 근원인 4-전류와 그로부터 유도되는 전자기장 텐서, 맥스웰 방정식과 로렌츠 힘의 상대론적 표현을 다룬다.8.4. 가속 좌표계
특수 상대성 이론은 기본적으로 관성 좌표계를 기준으로 전개되지만, 가속 좌표계도 몇가지 상황에 대해서 적절히 설명할 수 있다. 다음은 그 몇가지 예시.- 린들러 좌표계(Rindler coordinates) : 쌍곡선 가속계. 특수 상대론에서 물체가 등가속을 하면 포물선 운동([math(x=at^2)])을 하는 게 아니라, 광속에 한없이 접근하기 때문에 쌍곡선이 된다.
- 보른 좌표계(Born coordinates) : 일정하게 회전하는 가속계.
참고로 일반 상대성 이론은 가속 좌표계에 대한 좌표변환을 구하여 다루는 게 아니라, 좌표계의 제한을 그냥 다 풀어버린거다. 가속 좌표계가 어때야하는지에 대한 고민은 별로 없고 각각의 점에서 좌표계를 자유롭게 설정할 수 있다는 점을 이용해 오히려 관성 좌표계를 더 많이 찾는다. 일반적인 상황에서의 좌표계 역시 실제 운동계를 표현한다기보다는 그냥 가장 간단하게 잡히는 좌표계를 지형 위에 올려놓은 것이다. 일반 상대성 이론에서는 좌표계의 시간, 공간 좌표 자체는 전혀 물리적 의미가 없고 특정 물리적 과정의 최종 결과를 도출하기 위한 계산도구에 불과하다.
9. 역설
당연히 이해하기가 약간 힘든 이론인지라, 상당히 많은 역설들이 나와 반대하는 데 쓰이기도 하고 그냥 이론의 포스를 보여주려(!) 만들어진 역설들도 상당히 많다.9.1. 쌍둥이 역설
9.2. 막대와 헛간 역설
9.3. 에렌페스트 역설
정지해 있는 강체 원판이 존재하여, 그 외부의 정지된 관측자 A와 원판 위에 고정된 관측자 B가 존재한다고 하자.이때, 강체 원판의 중심을 회전축삼아 회전을 시작하여 그 각속도가 [math(\omega)]라는 미리 설정한 가속도 수치에 도달하면 가속을 중지할 경우에 발생하는 역설을 의미한다.
관측자 B는 이 강체 원판에 상대적으로 고정된 관측자이기 때문에, B의 입장에서 강체 원판의 모든 점은 동시에 가속을 시작하여 회전이 시작된다. 하지만, 관측자 A의 입장에서는 어떻게 되는건가 라는게 역설의 포인트다.
즉, 막대와 헛간 역설에서 사용되는 막대를 고리 형태로 만들어서 직진운동을 회전운동으로 바꿔놓은 형태가 된다. 막대와 헛간 역설은 진행방향의 뒤쪽일수록 관성계 내의 관측자에게는 시간이 상대적으로 늦게 관측된다라는 결론을 내포하고 있다.
그런데, 이를 반대로 말하면 "진행방향의 앞쪽일수록 관성계 내에서는 상대적으로 과거의 사건"이 벌어지게 된다는건데, 문제는 회전운동은 시작과 끝이 없는 운동이라는 점. 즉, 지점 P보다 약간 앞의 지점이 보다 먼저 일어난 사건이 되고…를 반복하여, 한바퀴를 돌면, 지점 P에서 일어난 사건(가속)은 지점 P에서 일어난 사건(가속)보다 먼저 일어난다. 라는 모순이 발생하게 된다. 이를 지칭하는 역설.
이 역설이 발생하는 이유는, 관측자 A의 입장에서 강체 원판의 모든 점이 동시에 가속될 수 있다라는 암묵적인 전제가 깔려있기 때문이며, 따라서 가속계상의 강체의 모든 점이 동시에 가속하는 것은 불가능하다라고 한다면 이 역설은 해결된다.
덤으로 외부 관측자의 입장에서는 회전하는 강체의 둘레는 결국 변하지 않지만, 내부 관측자의 입장에서는 회전하는 강체는 결국 그 회전방향으로 길이가 수축해야 하기 때문에, 강체 원판은 결국 제 형태를 유지하지 못하고 변형되게 된다는 게 특수 상대성 이론이 예측하는 결과다.
10. 실험적 검증
- 마이컬슨-몰리 실험(1887)
- 케네디-손다이크 실험(1932)
- 아이브스-스틸웰 실험(1938)
11. 여담
흔히 알려져 있는 것과 달리, 특수 상대성 이론이 발표되었던 당시의 사람들은 상대성 이론을 그 이론의 난해함 때문이 아니라 전제와 결론의 기묘함 때문에 쉽게 받아들이질 못했다. "물체의 속도가 빨라질수록 길이가 짧아지고 무거워진다"는 소리를 "운동 상태와 관계없이 광속은 일정한 속도로 관찰된다"는 전제에서 이끌어 내는 이론을 직관적으로 이해하고 받아들일 수 있는 사람이 얼마나 될까?이 탓에 사람들은 상대성 이론에 대해 말들이 많았고, 아인슈타인 선생은 말년에 "보편 상식에 때묻지 않은 순수한 마음을 가진 아이들이라면 이해하기 쉬울 거야"라며 "내 손녀딸도 이해하는 특수 상대성이론"이란 식으로 책을 쓰고야 만다. 사람들이 이 책을 일독한 손녀에게 정말 이해가 되더냐 묻자, "네, 다 이해했어요. 근데 딱 하나 모르겠는 게 있었거든요. 관성계가 뭐예요?"라고 대답했다고. 비유하자면, "전 축구 마스터 했어요. 그런데 골이 뭐에요?"란 질문과 비슷하다고 보면 되겠다.[28]
- 상대성 이론과 양자역학의 관계
하지만 일반 상대성 이론, 중력은 재규격화 불능 문제로 인해 완전한 양자역학적 기술이 불가능하다. 이 문제는 현대 물리학의 최대 숙제 중 하나이다. 뉴턴과 아인슈타인이 중력을 정복하여 물리학의 왕좌를 차지했듯, 앞으로 중력 문제를 해결하는 누군가가 다시금 물리학의 왕좌를 차지할 수도 있을 것이다.
- 광속불변 현상과 새로운 세계관
생각해 보자. 만약 우주가 편평한 둥근 구의 형태로 되어 있고 관찰자인 내가 구의 중심에 있다고 가정해 보자. 나와 구의 겉표면, 즉 우주의 경계까지의 모든 거리가 일정할 것이다. 그런데 만약 내가 중심에서 조금이라도 벗어난다면 구의 겉표면, 즉 우주의 경계까지의 거리가 모두 달라져야 할 것이다. 하지만 내가 어디에 있든 구의 겉표면, 즉 우주의 경계까지의 거리가 항상 일정하도록 우주가 작동한다면 어떨까? 우리는 우주에 대한 새로운 세계관이 필요할 것이다.
이것을 빛에 적용해 보자. 나를 중심으로 모든 방향에서 달려오는 빛이 있다고 생각해 보자. 내가 가만히 있다면 모든 빛의 속도는 광속 C로 일정할 것이다. 하지만 내가 조금이라도 한 방향으로 달려간다면, 모든 빛의 상대속도는 다르게 보여야 할 것이다. 그런데 실제로 내가 어떤 방향으로 어떤 속도로 달리든 간에 나를 둘러싼 모든 빛의 속도는 항상 일정하게 광속 C로 보인다. 마치 우주가 모든 방향의 모든 빛을 나와 상대속도가 일정하도록 조정해주고 있는 듯하다.
종합해 보면, 관찰자인 나를 중심으로 우주의 모든 빛의 상대속도가 일정하도록 우주가 작동하고 있다. 그 결과는 바로 관찰자인 내가 있는 위치를 우주의 중심점 혹은 좌표상 원점으로 정할 수 있다는 것이다. 조금더 과학적으로 표현하면 모든 관찰자의 관성계가 동등하다는 원리, 즉 '상대성 원리'를 따르고 있다. 반대로 말하면 광속불변 원리는 우주가 상대성 원리를 따르게 하기 위해 반드시 필요한 원리이다. 따라서 아인슈타인의 특수 상대성 이론은 실제로는 '상대성 원리' 단 하나의 가정만을 하고 있다고도 볼 수 있다. 상대성 원리에 오류가 없기 위해서는 광속이 반드시 불변이어야 하기 때문이다. 우주는 상대성 원리가 적용되기 위해서 모든 방향의 모든 빛의 상대속도를 광속 C로 일정하게 보이도록 작동하고 있다.
이로써 도출되는 새로운 세계관[30]이란 앞서 언급했듯, '모든 관찰자의 관성계가 동등'하므로 모든 관찰자는 자신을 우주의 중심, 원점으로 놓고 바라봐도 된다는 것이다. 우주상의 모든 관찰자는 한 치의 틀림도 없이 정확하게 동등한 관성계를 지니고 있으며, 따라서 진정한 의미에서 평등하다.
12. 고등학교 교육과정에서
물리학을 선택하는 수험생이라면 피할 수 없는 주제이다. 현재 교육과정의 기조가 현대물리를 매우 가볍게 다루고 넘어가는 것과 상반되게 상당히 자세하게 다룬다. 기본적인 시간 지연/길이 수축은 물론 로런츠 인자(15개정에서 삭제됨)[31], 동시성의 상대성, 광속 불변 원리 등을 종합적으로 이해해야 하기에 문제가 어렵게 나오면 시험에서 준킬러 위치를 갖기도 한다.
13. 관련 문서
[1] 여기서 가정이란 공리로 받아들이는 것이다. 즉 상대성이론은 아래 두 명제를 주춧돌로 하여 모든 것을 설명한다는 것이다. 만약 2가지의 원리, 즉 공리 중 하나라도 수정해야 한다면, 그 수정 공리를 발견한 사람은 뉴턴을 물리학의 왕좌에서 끌어내린 아인슈타인과 같이 아인슈타인을 왕좌에서 끌어내릴 수 있을 것이다![2] 등속직선운동하는 버스에서 공을 위로 던져보자. 던진 사람에게는 위로 올라갔다가 아래로 떨어지지만, 버스 밖의 정지한 사람에게는 포물선을 그리는 것처럼 보인다. 하지만 두 공에는 모두 [math(F=ma)]. 같은 물리 법칙이 동일하게 적용된다.[3] 푸앵카레-아인슈타인 동기화라고도 한다.[4] 과거에는 이것을 질량이 늘어난다고 해석했었으나 요즘 물리학계에서는 질량은 전하처럼 물체의 변하지 않는 속성으로 해석하기 때문에 더이상은 상대론적 질량이라는 말을 사용하지 않는다. 실제로 입자가속기 등에서 입자를 광속에 가깝게 가속시켰을 때 질량이 늘어났는지는 알 수 없다. 왜냐면 움직이는 물체의 질량을 잴 방법이 없기 때문이다. 우리가 측정하는 것은 운동량의 변화 뿐이다.[5] 값이 다를 수는 있다. 예컨대 중력 가속도나 지구 자전에 의한 효과는 지역마다 다를 수 있고 심지어 달과 지구의 중력은 다르며, 우주 공간은 말할 것도 없다. 그래도 중력 법칙 자체는 바뀌지 않는다.[6] A와 B의 상대적인 관측을 비교했을 때, 결과를 물을 수가 없다. 둘이 만나기 위해서는 광속으로 이동한 A가 B와 만나야 하는데, A가 되돌아오기 위해서는 '가속' 해야한다.[7] 저 두 원리를 만족하는 4차원 벡터 장을 만들어내면 튀어 나오는 게 바로 맥스웰 방정식이다! 물론 이 사실이 두 원리를 거부하였을 때 맥스웰 방정식이 부정된다는 걸 지지하는 건 논리적으로 전혀 아니지만, 어쨌든 상당히 강력한 근거임은 분명하다. 아니, 일단 과거의 뉴턴 역학이 전자기학과 대립하던 상황을 생각해 보자.[8] 상대성 이론과 다른 거다. 하지만 상대성 이론의 핵심 개념. 이걸 제대로 다루기 위해 상대성 이론이 있다고 봐도 되겠다.[9] 진짜 쉽게 설명하자면, 정지 또는 등속운동하는 관찰자의 속도와 무관하게 그 관찰자의 속도를 구별(인식)시켜주는 물리 법칙이 없다. 너는 네 속도를 알 방법이 없다![10] 물론 지자기라든가 중력의 영향 같은 것을 무시한다든가 관계 없는 실험이라든가 해야 한다. 그래서 맨 처음 가정이 주변에 지구도 태양도 아무것도 없는 텅 빈 우주 공간에 실험실에 놓여 있다는 것이었다.[11] 이런 상황에서 '절대 좌표계'라느니 '절대 속도' 같은 말은 그 가치를 상실해 버린다. 오로지 물리적으로 의미 있는 것은 (관성) 좌표계 간의 변환에도 그 모양이 변하지 않는, 즉 불변하는 것들인데, '절대' 같은 것들은 이런 것에 해당되지 않기 때문이다.[12] 시간축 방향으로 이동한 양([math(cdt)])의 제곱과, 공간 축에서 이동한 거리의 제곱의 크기가 서로 같다.[13] 부호가 반대, 즉 -1, 1, 1, 1로 놓을 수도 있다. 바뀌는 건 거의 없다. 물리적인 거는 아예 없고 성가신 부호 차이만 날 뿐인데, 문제는 이 두 가지 방법이 지금까지도 잘 쓰인다는 것이다. 입자 물리학에서는 본문의 부호를, 우주론에서는 이 주석의 부호를 흔히 쓴다.[14] 위에서 상대성 원리를 설명할 때 예를 들었던 실험실들이 이에 해당한다.[15] 회전이라는 기하학적인 아이디어는 아인슈타인 본인의 생각이 아니었다. 민코프스키에 의해 4차원 시공간이 정립되었고 바일(Weyl) 등에 의해 로런츠 변환의 기하학적 그리고 대수학적 해석이 덧붙여진 것이다. 심지어 아인슈타인은 처음에 이 아이디어를 접하고 나서 별로 좋아하지 않았다고 한다.[16] 사실 하나 더 있다. 계속 회전 얘기만 했지만 시간+공간에 대한 평행 이동에 대한 불변성도 필요하다. 로런츠 변환과 평행 이동 모두를 아우르는 변환을 모은 군(group)을 푸앵카레 군(Poincaré group)이고 관성 좌표계 간의 변한 전체는 로런츠 변환 뿐만 아니라 푸앵카레 군에 포함된 모든 변환에 관한 것이어야 할 것이다. 하지만 평행 이동에 대한 이야기는 이 문서에서 그리 중요한 것이 아니고, 따라서 이 문서에서 관성 좌표계 간의 변환은 로런츠 변환만 따지는 것으로도 충분하다.[17] 편의상 contravaraint인지 covariant인지는 구분하지 않았다. 어차피 3차원에서는 별 의미가 없지만.[18] 상대론 하에서 식을 쓰다 보면 성분의 제곱을 그대로 쓸 일이 그렇게 많지 않다. 어차피 다들 알아서 헷갈리지 않게 잘 표기하다 보니 (정말 거듭제곱일 경우 그게 딱 봐도 거듭제곱인 것 같이 써 놓긴 한다) 정작 헷갈릴 일은 없다.[19] 아예 반대로 적용하는 경우가 있다. Landau, Lifshitz의 The Classical Theory of Fields에서 그렇다.[20] 합 기호 [math(\displaystyle \sum_{\nu = 0}^3)]을 생략했다. 물리학자들은 이런 생략을 자주 쓴다. 이런 생략을 가리켜 아인슈타인 규약(Einstein's convention)이라고 부른다. 생략하되, (1) 같은 기호가 두 개만 쓰였고 (2) 그 두 기호 중 하나는 위 첨자에 다른 하나는 아래 첨자에 있는 경우에만 가능하다. 사실 그렇지 않은 경우는 물리적으로 의미가 없는 경우지만…[21] 직접 임의의 두 벡터에 대해 좌표 변환을 해 보면 금방 알 수 있다. 그러면 좌표 변환을 시키는 행렬이 [math(A)]라고 했을 때 저 위에 쓴 [math(A^T J A = J)]가 만족되어야 함을 알 수 있는데, 이미 우리는 이걸 만족하는 행렬 [math(A)]가 (일반적인) 로런츠 변환 행렬이라는 것을 봤었다. 따라서 변환 행렬은 반드시 로런츠 변환 행렬이어야 한다.[22] 4차원과 로런츠 변환을 조금 더 부연 설명하면, 이렇게 할 수 있다. 한 평면의 가로축을 공간, 세로축을 시간이라고 하자. 그런데 관측자의 속도가 바뀌면, 이 두 축의 방향이 바뀐다! 이는 두 축이 회전한다는 뜻이고, 이것이 로런츠 변환이다. 축이 회전했으니, 시간과 거리가 바뀔 수밖에 없다. 그리고 이렇게 생각하려면, 시간과 공간을 통합해서 생각해야 하고, 이것이 흔히 말하는 4차원 시공간, 혹은 최초로 고안해 낸 사람의 이름을 딴 민코프스키 시공간이다.[23] 현대 기하학에선 새로운 '길이'(거리함수)와 그 길이를 일정하게 하는 변환(등거리변환)을 가지고 기하학을 구축할 수 있다고 본다. 이런 관점에서 유클리드 기하학은 단지 한 예시일 뿐. 이 관점에서 유클리드 기하학이란 3차원 유클리드 거리함수와 회전변환을 통하여 만들어진 기하학이다.[24] 시공간 거리는 3차원 유클리드 기하학에서의 거리를 단순히 4차원 버전으로 바꾼 것과 전혀 다른 것이다. 그랬으면 [math((ct)^2 + x^2 + y^2 + z^2)] (부호 주의)이 일정해야 했을 것이다.[25] 하지만 시간축을 뺀 나머지 공간축이 이루는 '공간'을 지배하는 기하학은 (일반상대론을 뺀다면) 여전히 유클리드 기하학이다. 사실, 특수상대론에서 다루는 기하학은 유클리드 기하학을 일종의 부분집합으로 포함한다. 전문 용어로 하자면, 특수상대론의 시공간을 지배하는 군 O(3, 1)은 유클리드 기하학을 지배하는 군 O(3)를 부분군으로 갖는다.[26] 평범한 2차원 공간에서 어떤 점과 그 점을 지나는 (원점에 중심이 있는) 원이 있다고 생각해보자. 이 점을 평범하게 아무리 회전시켜봤자 이 원을 벗어날 수 없는 원리와 똑같다.[27] 참고로 여기서 로런츠 불변인 s를 시공간 간격 (spacetime interval)이라고 한다.[28] 직설적으로 말하자면, 이 소녀는 이해한 게 아니고 그냥 받아들인(수긍한) 거다.[29] QED의 창시자인 그 유명한 리차드 파인만은 이런 식으로 QED를 평했다. 이건 마치 위성 궤도에서 지상의 개미를 정확하게 관찰하는 것과 같은 정확도라고 한다.[30] 최규철, 최성호 공저 광속불변 현상에 대한 재해석과 새로운 세계관의 정립. 논문 저자들은 특수 상대성이론의 광속불변 원리에서 이러한 새로운 세계관을 이끌어 내고, '슈퍼세계관'이라고 명명하였다.[31] 단, 로런츠 인자를 정량적으로 구할 필요는 없지만 어디에서 시간지연/길이수축이 일어나는지 등의 대소 비교는 할 줄 알아야 한다.