실베스터 행렬

[[대수학\|대수학 Algebra ]]
{{{#!wiki style="margin: 0 -10px -5px; min-height: calc(1.5em + 5px)" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -5px -1px -11px"	이론
기본 대상		연산 · 항등식(가비의 이 · 곱셈 공식(통분 · 약분) · 인수분해) · 부등식(절대부등식) · 방정식(/풀이 · 근(무연근 · 허근 · 비에트의 정리(근과 계수의 관계) · 제곱근(이중근호 · 개방법) · 환원 불능) · 부정 · 불능) · 비례식 · 다항식 · 산술(시계 산술)
수 체계		자연수 · 소수 · 정수 · 음수 · 유리수 · 실수(무리수(대수적 무리수 · 초월수) · 초실수) · 복소수(허수) · 사원수 · 팔원수 · 대수적 수 · 벡터 공간
다루는 대상과 주요 토픽
대수적 구조
	군(group)	대칭군 · 기본군 · 자유군 · 리 군 · 괴물군 · 점군 · 순환군 · 군의 작용 · 동형 정리 · 실로우 정리 · 클라인 사원군
	환(ring)	아이디얼
	체(field)	갈루아 이론 · 분해체
	대수	가환대수 · 리 대수 · 불 대수(크로네커 델타)
마그마·반군·모노이드		자유 모노이드 · 가환 모노이드
선형대수학		스칼라 · 벡터 · 행렬 · 텐서(텐서곱) · 벡터 공간(선형사상) · 가군(module) · 내적 공간(그람-슈미트 과정 · 수반 연산자)
정리·추측
대수학의 기본정리 · 나머지 정리 · 유클리드 호제법 · 부분분수분해 · PID 위의 유한생성 가군의 기본정리 · 산술·기하 평균 부등식 · 바이어슈트라스 분해 정리 · 호지 추측^미해결 · 가환대수에서의 호몰로지 추측^미해결
관련 하위 분야
범주론		함자 · 수반 · 자연 변환 · 모나드 · 쌍대성 · 토포스 이론 · 타입 이론
대수 위상수학		연속변형성 · 사슬 복합체 · 호몰로지 대수학(호몰로지 · 코호몰로지) · mapping class group · 닐센-서스턴 분류 · 호프대수
대수기하학		대수 다양체 · 층 · 스킴 · 에탈 코호몰로지 · 모티브
대수적 정수론		타원곡선 · 디오판토스 방정식 · 유리근 정리 · 모듈러성 정리
가환대수학		스펙트럼 정리
표현론		실베스터 행렬
기타 및 관련 문서
수학 관련 정보 · 추상화 · 1학년의 꿈 · 노름 · 혼합계산 · 분배법칙 · 교환법칙 · 결합법칙 · 교재 · 과일 분수방정식 문제			}}}}}}}}}

1. 개요2. 정의3. Resultant

3.1. Resultant와 공통인수3.2. Resultant와 판별식

3.2.1. 예시: 2차 다항식 판별식 유도

3.3. 대수 기하학에서

4. 역사5. 관련 문서

1. 개요

Sylvester matrix

두 다항식이 공통인수를 갖는지에 대한 정보를 담고 있는 정사각 행렬이다. 예시에서처럼 n차 방정식의 판별식을 유도해 내는데 사용할 수 있다.

2. 정의

실베스터 행렬은 두 다항식

f,\ g\in k[x]

([math(k)]는 체)에 의해 결정되는 행렬로, 여기서는

\mathrm{Syl}(f,g)

라고 표기한다.

f(x)=a_m x^m+\cdots+a_1 x+a_0, \ \ g(x)=b_n x^n+\cdots+b_1 x+b_0 \ \ (a_m,\ b_n \neq 0)

일 때,

\mathrm{Syl}(f,g)

는 다음과 같은

(m+n)\times(m+n)

행렬이다.

\mathrm{Syl}(f,g)=\begin{pmatrix}a_m & \cdots & a_1 & a_0 & 0 & 0 & \cdots & 0 \\ 0 & a_m & \cdots & a_1 & a_0 & 0 & \cdots & 0 \\ & & & \vdots & & \\ 0 & 0 & \cdots & 0 & a_m & \cdots & a_1 & a_0 \\ b_n & \cdots & b_1 & b_0 & 0 & 0 & \cdots & 0 \\ 0 & b_n & \cdots & b_1 & b_0 & 0 & \cdots & 0 \\ & & & \vdots & & \\ 0 & 0 & \cdots & 0 & b_n & \cdots & b_1 & b_0 \\ \end{pmatrix}

3. Resultant

실베스터 행렬의 행렬식은 (Sylvester) resultant[1]라고 부르며,

\mathrm{Syl}(f,g)

의 행렬식을

\mathrm{Res}(f,g)

라고 표기한다.

3.1. Resultant와 공통인수

정리 다음은 동치이다.
*

\mathrm{Res}(f,g)=0

f

와

g

는 공통인수를 갖는다.

[ 증명 아이디어 보기 ]: 증명의 대략적인 아이디어는 다음과 같다. 차수가 [math(d)] 이하인 모든 다항식을 모은 [math(d+1)]차원 벡터공간을 [math(P_d)]라고 표기하자. 선형 변환 [math(\delta :\ P_{n-1}\oplus P_{m-1} \rightarrow P_{m+n-1})]을 [math(\delta(A,B)=Af+Bg)]가 되도록 정의한다. 그러면 [math(\delta)]는 다음과 같이 행렬로 표현된다.

[math(A=r_{n-1} x^{n-1}+\cdots +r_1 x + r_0,\ B=s_{m-1} x^{m-1}+\cdots +s_1 x+s_0)]라고 하면,
[math(\delta(A,B)=(r_{n-1}\ \cdots \ r_0 \ \ s_{m-1} \ \cdots \ s_0)\ \mathrm{Syl}(f,g) \begin{pmatrix} x^{m+n} \\ \vdots \\ x \\ 1 \end{pmatrix})]

따라서 [math(\mathrm{Res}(f,g)\neq 0)]은 [math(\delta)]가 전사함수라는 것과 동치이다.[2] 이제 [math(\delta)]가 전사함수라는 것과 [math(Af+Bg=1)]인 [math(A,\ B)]가 존재한다는 것이 동치임을 증명하고, 이것이 [math(f,\ g)]가 공통근을 갖는다는 것과 동치임을 증명하면 된다. 자세한 증명은 Brendan Hassett - Introduction to Algebraic Geometry의 Theorem 5.5 참고. □

대수적으로 닫힌 체에서는 다항식이 모두 일차식들로 인수분해되므로, 공통인수를 갖는 것과 공통근을 갖는 것이 동치이다. 따라서 [math(k)]가 대수적으로 닫힌 체이면 다음이 동치이다.

$\mathrm{Res}(f,g)=0$
$f$ 와 $g$ 는 공통근을 갖는다.

따름정리

f

가 중근을 가지면

\mathrm{Res}(f,f')=0

이다.

이는 [math(f)], [math(f')]가 공통근을 갖는 것과 [math(f)]가 중근을 갖는 것이 동치[3]이기 때문이다. 따라서 [math(k)]가 대수적으로 닫힌 체이면 위 따름정리의 역도 성립한다.

3.2. Resultant와 판별식

정리 [math(f)]의 근을 [math(\alpha_1, \cdots, \alpha_m)], [math(g)]의 근을 [math(\beta_1, \cdots , \beta_n)]이라고 할 때, 다음이 성립한다.
[math(\displaystyle \mathrm{Res}(f,g)=a_m^n b_n^m \prod_{i, j}^{\ } (\alpha_i-\beta_j))]

[ 증명 보기 ]: 다음은 Valery Bykov, Alexander Kytmanov, Mark Lazman - Elimination Methods in Polynomial Computer Algebra의 Theorem 6.1에서 소개된 증명이다. 우변은 다음과 같이 쓸 수 있다.

[math(\displaystyle S:=a_m^n b_n^m \prod_{i, j} (\alpha_i-\beta_j) = (-1)^{mn} b_n^m \prod_{j=1}^n (a_m \prod_{i=1}^m (\beta_j-\alpha_i)) = (-1)^{mn} b_n^m \prod_{j=1}^n f(\beta_j),)]
[math(\displaystyle S=a_m^n b_n^m \prod_{i, j} (\alpha_i-\beta_j) = a_m^n \prod_{i=1}^m (b_m \prod_{j=1}^n (\alpha_j-\beta_i)) = a_m^n \prod_{i=1}^m g(\alpha_i))]

다음과 같은 행렬식을 보자.

[math(M:=\begin{vmatrix} \beta_1^{m+n-1} & \beta_2^{m+n-1} & \cdots & \beta_n^{m+n-1} & \alpha_1^{m+n-1} & \alpha_2^{m+n-1} & \cdots & \alpha_m^{m+n-1} \\ \beta_1^{m+n-2} & \beta_2^{m+n-2} & \cdots & \beta_n^{m+n-2} & \alpha_1^{m+n-2} & \alpha_2^{m+n-2} & \cdots & \alpha_m^{m+n-2} \\ & & \vdots & & & & \vdots & \\ \beta_1 & \beta_2 & \cdots & \beta_n & \alpha_1 & \alpha_2 & \cdots & \alpha_m \\ 1 & 1 & \cdots & 1 & 1 & 1 & \cdots & 1 \end{vmatrix})]

이는 Vandermonde 행렬이므로 행렬식은 다음과 같다.

[math(\displaystyle M=\prod_{1\leq i<j \leq n} (\beta_j-\beta_i) \prod_{i=1}^m \prod_{j=1}^n (\beta_j-\alpha_i) \prod_{1\leq i<j \leq m} (\alpha_j-\alpha_i))]

[math(\displaystyle \therefore \ a_m^n b_n^m \ \mathrm{Res}(f,g) \cdot M =\ \mathrm{Res}(f,g) \cdot (-1)^{mn} S \prod_{1\leq i<j \leq n} (\beta_j-\beta_i) \prod_{1\leq i<j \leq m} (\alpha_j-\alpha_i) \ \ \ \ \cdots(1))]

그런데 [math(f(\alpha_i)=0)], [math(g(\beta_j)=0)]이므로 [math(\mathrm{Res}(f,g) \cdot M)]은 아래와 같이 계산될 수 있다.

[math(\displaystyle \mathrm{Res}(f,g) \cdot M = \begin{vmatrix} \beta_1^{n-1} f(\beta_1) & \beta_2^{n-1} f(\beta_2) & \cdots & \beta_n^{n-1} f(\beta_n) & 0 & \cdots & 0 \\ & & \vdots & & & \vdots & \\ \beta_1 f(\beta_1) & \beta_2 f(\beta_2) & \cdots & \beta_n f(\beta_n) & 0 & \cdots & 0 \\ f(\beta_1) & f(\beta_2) & \cdots & f(\beta_n) & 0 & \cdots & 0 \\ 0 & 0 & \cdots & 0 & \alpha_1^{m-1} g(\alpha_1) & \cdots & \alpha_m^{m-1} g(\alpha_m) \\ 0 & 0 & \cdots & 0 & \alpha_1^{m-2} g(\alpha_1) & \cdots & \alpha_m^{m-2} g(\alpha_m) \\ & & \vdots & & & \vdots & \\ 0 & 0 & \cdots & 0 & g(\alpha_1) & \cdots & g(\alpha_n) \end{vmatrix} \\ = \prod_{j=1}^n f(\beta_j) \prod_{i=1}^m g(\alpha_i) \cdot \begin{vmatrix} \beta_1^{n-1} & \beta_2^{n-1} & \cdots & \beta_n^{n-1} \\ & & \vdots & \\ \beta_1 & \beta_2 & \cdots & \beta_n \\ 1 & 1 & \cdots & 1 \end{vmatrix} \cdot \begin{vmatrix} \alpha_1^{m-1} & \alpha_2^{m-1} & \cdots & \alpha_m^{m-1} \\ & & \vdots & \\ \alpha_1 & \alpha_2 & \cdots & \alpha_m \\ 1 & 1 & \cdots & 1 \end{vmatrix} \\ = \prod_{j=1}^n f(\beta_j) \prod_{i=1}^m g(\alpha_i) \prod_{1\leq i<j \leq n} (\beta_j-\beta_i) \prod_{1\leq i<j \leq m} (\alpha_j-\alpha_i))]

[math(\displaystyle \therefore \ a_m^n b_n^m \ \mathrm{Res}(f,g) \cdot M = S \cdot (-1)^{mn} S \prod_{1\leq i<j \leq n} (\beta_j-\beta_i) \prod_{1\leq i<j \leq m} (\alpha_j-\alpha_i) \ \ \ \ \cdots(2))]

식 [math((1))]과 식 [math((2))]에 의해 [math(\mathrm{Res}(f,g)=S)]이다. ■

이때 [math(\alpha_i)], [math(\beta_j)]는 [math(k)]의 대수적 폐포(algebraic closure)의 원소이다.[4]

위 정리와 판별식의 정의에 의해 resultant와 판별식의 관계를 얻을 수 있다. 또는 아래 식으로 판별식을 정의하기도 한다. 차수가 [math(n)]이고 최고차항이 [math(a_n)]인 다항식

h

의 판별식 [math(D)]는 다음과 같다.

D= (-1)^{n(n-1)\over 2} a_n^{-1} \ \mathrm{Res}(h,h')

이때 판별식도 주어진 체 [math(k)]의 대수적 폐포에서의 근을 이용해 정의한다. 이렇게 정의하더라도 판별식은 [math(k)]의 원소가 되는데, 이는 resultant가 정의에 의해 [math(k)]의 원소가 되기 때문으로 이해할 수 있다.

상술된 따름정리로부터

f

가 중근을 가지면

D=0

임을 확인할 수 있다. 당연히 대수적으로 닫힌 체에서는 그 역도 성립한다. 대수적으로 닫힌 체가 아니면 역이 성립하지 않으며, [math((x^2+x+1)^2\in \mathbb R[x])]와 같은 반례가 있다.

다음과 같은 정리에 따라 판별식도 기약다항식(irreducible polynomial)임을 알 수 있다.

정리[5] Resultant는 기약다항식이다.

3.2.1. 예시: 2차 다항식 판별식 유도

다음은 resultant를 이용하여 2차 방정식의 판별식

D

를 유도하는 과정이다.

f(x)=ax^2+bx+c

f'(x)=2ax+b

\mathrm{Res}(f,f')= \begin{vmatrix} a & b & c \\ 2a & b & 0 \\ 0 & 2a & b \end{vmatrix}= a \begin{vmatrix} b & 0 \\ 2a & b \end{vmatrix} -b \begin{vmatrix} 2a & 0 \\ 0 & b \end{vmatrix} +c \begin{vmatrix} 2a & b \\ 0 & 2a \end{vmatrix}

a \begin{vmatrix} b & 0 \\ 2a & b \end{vmatrix}= a(b^2-0\cdot 2a)

-b \begin{vmatrix} 2a & 0 \\ 0 & b \end{vmatrix} = -b(2ab-0^2)

c \begin{vmatrix} 2a & b \\ 0 & 2a \end{vmatrix}=c((2a)^2-0\cdot b)

\therefore \;\; a \begin{vmatrix} b & 0 \\ 2a & b \end{vmatrix} -b \begin{vmatrix} 2a & 0 \\ 0 & b \end{vmatrix} +c \begin{vmatrix} 2a & b \\ 0 & 2a \end{vmatrix}= a(b^2-0\cdot 2a) -b(2ab-0^2)+c((2a)^2-0\cdot b)

= ab^2-0\cdot 2a^2 -2ab^2+0^2b+c\cdot 4a^2-0\cdot bc

= ab^2-2ab^2+c\cdot 4a^2

\therefore \mathrm{Res}(f,f') =-ab^2+4a^2 c

D= (-1)^{n(n-1)\over 2} a_n^{-1} \mathrm{Res}(f,f')

\therefore D= (-1)^{n(n-1)\over 2} a_n^{-1} (-ab^2+4ca^2)

\quad = -a^{-1}(-ab^2+4ca^2)

= {(-ab^2+4ca^2) \over -a}

= b^2-4ca

\therefore D= b^2-4ca

3.3. 대수 기하학에서

정리[6]

f(x)=a_m x^m+a_{m-1} x^{m-1}+\cdots+a_1 x+a_0, \ g(x)=b_n x^n+b_{n-1} x^{n-1}+\cdots+b_1 x+b_0

I\ =\ <f,g>\ \subset \ k[x,a_0,\cdots,a_m,b_0,\cdots,b_n]

\Rightarrow \ I\cap k[a_0,\cdots,a_m,b_0,\cdots,b_n]\ =\ <\mathrm{Res}(f,g)>

이 경우 elimination ideal

I\cap k[a_0,\cdots,a_m,b_0,\cdots,b_n]

은 principal ideal이 되며 그 생성원은

\mathrm{Res}(f,g)

가 된다. 이는 [math(\mathbb Q)]와 같은 체에서 여러 변수, 여러 다항식일 때도 마찬가지로 성립하며,[7] 이 때의 생성원을 multipolynomial resultant라고 한다. 즉 Sylvester resultant는 그 특수한 경우이다.

여기서 계수

a_0,\cdots,a_m,b_0,\cdots,b_n

를 변수취급 해줬다. 이렇게 계수들을 변수취급해준 뒤

x

와 같은 기존 변수를 소거(elimination)하여 계수들이 만족하는 조건을 알아내는 과정을 implicitization이라고 한다. 여기서는 그 조건이 resultant인 것이다.

4. 역사

제임스 조지프 실베스터(James Joseph Sylvester)[8]가 도입하였다.[9] 좀 더 구체적으로는 제임스 조지프 실베스터가 아서 케일리(Arthur Cayley)와 함께한 행렬연구에서[10] [11] 그의 업적이 알려진 바 있다. [12]

5. 관련 문서

[1] (실베스터 행렬의) 결괏값으로 해석할 수 있다.[2] 가역행렬의 기본정리 참고. 이때 [math(\delta)]의 정의역의 원소는 [math(\mathrm{Syl}(f,g))]의 우측에 곱해진 열벡터가 아니라 좌측에 곱해진 행벡터이다. 이 때문인지 일부 저자는 [math(\mathrm{Syl}(f,g))]를 여기서 정의한 것의 전치행렬로 정의하기도 한다. 물론 그러더라도 [math(\mathrm{Res}(f,g))]는 변하지 않는다.[3] 이는 인수정리를 이용하면 쉽게 보일 수 있다.[4] 대수적 폐포에서는 모든 n차 다항식이 중복 포함 n개의 근을 갖는다.[5] 증명은 Brendan Hassett - Introduction to Algebraic Geometry의 Proposition 5.12 참고.[6] 증명은 Brendan Hassett - Introduction to Algebraic Geometry의 Theorem 5.13 참고.[7] 증명은 Mateusz Michałek, Bernd Sturmfels - Invitation to Nonlinear Algebra의 Theorem 4.11 참고.[8] 실베스터-갈라이 정리를 증명한 사람이기도 하다.[9] 월프럼 매스월드, 실베스터 행렬 -https://mathworld.wolfram.com/SylvesterMatrix.html[10] 고등학교 기하와 벡터, 성지출판 (

\text{I}

일차변환과 행렬) 수학이야기-행렬과 행렬식37p 2017[11] A Memoir on the Theory of Matrices , Arthur Cayley , Philosophical Transactions of the Royal Society of London, Vol. 148 (1858), pp. 17-37 (21 pages) Published by Royal Society -https://www.jstor.org/stable/108649[12] L. On Hamilton's quadratic equation and the general unilateral equation in matrices J.J. Sylvester F.R.S. 1884/11/01 Pages 454-458 | Published online: 29 Apr 2009 DOI https://doi.org/10.1080/14786448408627619

실베스터 행렬

1. 개요

2. 정의

3. Resultant

3.1. Resultant와 공통인수

3.2. Resultant와 판별식

3.2.1. 예시: 2차 다항식 판별식 유도

3.3. 대수 기하학에서

4. 역사

5. 관련 문서

분류