1. 개요
실베스터 행렬(Sylvester matrix)은 두 다항식이 공통인수를 갖는지에 대한 정보를 담고 있는 정사각 행렬이다. 예시에서처럼 n차 방정식의 판별식을 유도해 내는데 사용할수있다.2. 정의
실베스터 행렬은 두 다항식 ([math(k)]는 체)에 의해 결정되는 행렬로, 여기서는 라고 표기한다.일 때, 는 다음과 같은 행렬이다.
3. Resultant
실베스터 행렬의 행렬식은 (Sylvester) resultant라고 부르며, 의 행렬식을 라고 표기한다.3.1. Resultant와 공통인수
정리 다음은 동치이다.
*
* 와 는 공통인수를 갖는다.
*
* 와 는 공통인수를 갖는다.
- [ 증명 아이디어 보기 ]
- 증명의 대략적인 아이디어는 다음과 같다. 차수가 [math(d)] 이하인 모든 다항식을 모은 [math(d+1)]차원 벡터공간을 [math(P_d)]라고 표기하자. 선형 변환 [math(\delta :\ P_{n-1}\oplus P_{m-1} \rightarrow P_{m+n-1})]을 [math(\delta(A,B)=Af+Bg)]가 되도록 정의한다. 그러면 [math(\delta)]는 다음과 같이 행렬로 표현된다.
[math(A=r_{n-1} x^{n-1}+\cdots +r_1 x + r_0,\ B=s_{m-1} x^{m-1}+\cdots +s_1 x+s_0)]라고 하면,[math(\delta(A,B)=(r_{n-1}\ \cdots \ r_0 \ \ s_{m-1} \ \cdots \ s_0)\ \mathrm{Syl}(f,g) \begin{pmatrix} x^{m+n} \\ \vdots \\ x \\ 1 \end{pmatrix})]
따라서 [math(\mathrm{Res}(f,g)\neq 0)]은 [math(\delta)]가 전사함수라는 것과 동치이다.[1] 이제 [math(\delta)]가 전사함수라는 것과 [math(Af+Bg=1)]인 [math(A,\ B)]가 존재한다는 것이 동치임을 증명하고, 이것이 [math(f,\ g)]가 공통근을 갖는다는 것과 동치임을 증명하면 된다. 자세한 증명은 Brendan Hassett - Introduction to Algebraic Geometry의 Theorem 5.5 참고. □
대수적으로 닫힌 체에서는 다항식이 모두 일차식들로 인수분해되므로, 공통인수를 갖는 것과 공통근을 갖는 것이 동치이다. 따라서 [math(k)]가 대수적으로 닫힌 체이면 다음이 동치이다.
- 와 는 공통근을 갖는다.
따름정리 가 중근을 가지면 이다.
이는 [math(f)], [math(f')]가 공통근을 갖는 것과 [math(f)]가 중근을 갖는 것이 동치[2]이기 때문이다. 따라서 [math(k)]가 대수적으로 닫힌 체이면 위 따름정리의 역도 성립한다.3.2. Resultant와 판별식
정리 [math(f)]의 근을 [math(\alpha_1, \cdots, \alpha_m)], [math(g)]의 근을 [math(\beta_1, \cdots , \beta_n)]이라고 할 때, 다음이 성립한다.
[math(\displaystyle \mathrm{Res}(f,g)=a_m^n b_n^m \prod_{i, j}^{\ } (\alpha_i-\beta_j))]
[math(\displaystyle \mathrm{Res}(f,g)=a_m^n b_n^m \prod_{i, j}^{\ } (\alpha_i-\beta_j))]
- [ 증명 보기 ]
- 다음은 Valery Bykov, Alexander Kytmanov, Mark Lazman - Elimination Methods in Polynomial Computer Algebra의 Theorem 6.1에서 소개된 증명이다. 우변은 다음과 같이 쓸 수 있다.[math(\displaystyle S:=a_m^n b_n^m \prod_{i, j} (\alpha_i-\beta_j) = (-1)^{mn} b_n^m \prod_{j=1}^n (a_m \prod_{i=1}^m (\beta_j-\alpha_i)) = (-1)^{mn} b_n^m \prod_{j=1}^n f(\beta_j),)]
[math(\displaystyle S=a_m^n b_n^m \prod_{i, j} (\alpha_i-\beta_j) = a_m^n \prod_{i=1}^m (b_m \prod_{j=1}^n (\alpha_j-\beta_i)) = a_m^n \prod_{i=1}^m g(\alpha_i))]
다음과 같은 행렬식을 보자.[math(M:=\begin{vmatrix} \beta_1^{m+n-1} & \beta_2^{m+n-1} & \cdots & \beta_n^{m+n-1} & \alpha_1^{m+n-1} & \alpha_2^{m+n-1} & \cdots & \alpha_m^{m+n-1} \\ \beta_1^{m+n-2} & \beta_2^{m+n-2} & \cdots & \beta_n^{m+n-2} & \alpha_1^{m+n-2} & \alpha_2^{m+n-2} & \cdots & \alpha_m^{m+n-2} \\ & & \vdots & & & & \vdots & \\ \beta_1 & \beta_2 & \cdots & \beta_n & \alpha_1 & \alpha_2 & \cdots & \alpha_m \\ 1 & 1 & \cdots & 1 & 1 & 1 & \cdots & 1 \end{vmatrix})]
이는 Vandermonde 행렬이므로 행렬식은 다음과 같다.[math(\displaystyle M=\prod_{1\leq i<j \leq n} (\beta_j-\beta_i) \prod_{i=1}^m \prod_{j=1}^n (\beta_j-\alpha_i) \prod_{1\leq i<j \leq m} (\alpha_j-\alpha_i))]
[math(\displaystyle \therefore \ a_m^n b_n^m \ \mathrm{Res}(f,g) \cdot M =\ \mathrm{Res}(f,g) \cdot (-1)^{mn} S \prod_{1\leq i<j \leq n} (\beta_j-\beta_i) \prod_{1\leq i<j \leq m} (\alpha_j-\alpha_i) \ \ \ \ \cdots(1))]
그런데 [math(f(\alpha_i)=0)], [math(g(\beta_j)=0)]이므로 [math(\mathrm{Res}(f,g) \cdot M)]은 아래와 같이 계산될 수 있다.[math(\displaystyle \mathrm{Res}(f,g) \cdot M = \begin{vmatrix} \beta_1^{n-1} f(\beta_1) & \beta_2^{n-1} f(\beta_2) & \cdots & \beta_n^{n-1} f(\beta_n) & 0 & \cdots & 0 \\ & & \vdots & & & \vdots & \\ \beta_1 f(\beta_1) & \beta_2 f(\beta_2) & \cdots & \beta_n f(\beta_n) & 0 & \cdots & 0 \\ f(\beta_1) & f(\beta_2) & \cdots & f(\beta_n) & 0 & \cdots & 0 \\ 0 & 0 & \cdots & 0 & \alpha_1^{m-1} g(\alpha_1) & \cdots & \alpha_m^{m-1} g(\alpha_m) \\ 0 & 0 & \cdots & 0 & \alpha_1^{m-2} g(\alpha_1) & \cdots & \alpha_m^{m-2} g(\alpha_m) \\ & & \vdots & & & \vdots & \\ 0 & 0 & \cdots & 0 & g(\alpha_1) & \cdots & g(\alpha_n) \end{vmatrix} \\ = \prod_{j=1}^n f(\beta_j) \prod_{i=1}^m g(\alpha_i) \cdot \begin{vmatrix} \beta_1^{n-1} & \beta_2^{n-1} & \cdots & \beta_n^{n-1} \\ & & \vdots & \\ \beta_1 & \beta_2 & \cdots & \beta_n \\ 1 & 1 & \cdots & 1 \end{vmatrix} \cdot \begin{vmatrix} \alpha_1^{m-1} & \alpha_2^{m-1} & \cdots & \alpha_m^{m-1} \\ & & \vdots & \\ \alpha_1 & \alpha_2 & \cdots & \alpha_m \\ 1 & 1 & \cdots & 1 \end{vmatrix} \\ = \prod_{j=1}^n f(\beta_j) \prod_{i=1}^m g(\alpha_i) \prod_{1\leq i<j \leq n} (\beta_j-\beta_i) \prod_{1\leq i<j \leq m} (\alpha_j-\alpha_i))]
[math(\displaystyle \therefore \ a_m^n b_n^m \ \mathrm{Res}(f,g) \cdot M = S \cdot (-1)^{mn} S \prod_{1\leq i<j \leq n} (\beta_j-\beta_i) \prod_{1\leq i<j \leq m} (\alpha_j-\alpha_i) \ \ \ \ \cdots(2))]
식 [math((1))]과 식 [math((2))]에 의해 [math(\mathrm{Res}(f,g)=S)]이다. ■
이때 [math(\alpha_i)], [math(\beta_j)]는 [math(k)]의 대수적 폐포(algebraic closure)의 원소이다.[3]
위 정리와 판별식의 정의에 의해 resultant와 판별식의 관계를 얻을 수 있다. 또는 아래 식으로 판별식을 정의하기도 한다. 차수가 [math(n)]이고 최고차항이 [math(a_n)]인 다항식 의 판별식 [math(D)]는 다음과 같다.
이때 판별식도 주어진 체 [math(k)]의 대수적 폐포에서의 근을 이용해 정의한다. 이렇게 정의하더라도 판별식은 [math(k)]의 원소가 되는데, 이는 resultant가 정의에 의해 [math(k)]의 원소가 되기 때문으로 이해할 수 있다.
상술된 따름정리로부터 가 중근을 가지면 임을 확인할 수 있다. 당연히 대수적으로 닫힌 체에서는 그 역도 성립한다. 대수적으로 닫힌 체가 아니면 역이 성립하지 않으며, [math((x^2+x+1)^2\in \mathbb R[x])]와 같은 반례가 있다.
다음과 같은 정리에 따라 판별식도 기약다항식(irreducible polynomial)임을 알 수 있다.
정리[4] Resultant는 기약다항식이다.
3.2.1. 예시: 2차 다항식 판별식 유도
다음은 resultant를 이용하여 2차 방정식의 판별식 를 유도하는 과정이다.3.3. 대수 기하학에서
이 경우 elimination ideal 은 principal ideal이 되며 그 생성원은 가 된다. 이는 [math(\mathbb Q)]와 같은 체에서 여러 변수, 여러 다항식일 때도 마찬가지로 성립하며,[6] 이 때의 생성원을 multipolynomial resultant라고 한다. 즉 Sylvester resultant는 그 특수한 경우이다.여기서 계수 를 변수취급 해줬다. 이렇게 계수들을 변수취급해준 뒤 와 같은 기존 변수를 소거(elimination)하여 계수들이 만족하는 조건을 알아내는 과정을 implicitization이라고 한다. 여기서는 그 조건이 resultant인 것이다.
4. 역사
제임스 조지프 실베스터(James Joseph Sylvester)[7]가 도입하였다.[8] 좀 더 구체적으로는 제임스 조지프 실베스터가 아서 케일리(Arthur Cayley)와 함께한 행렬연구에서[9] [10] 그의 업적이 알려진 바 있다. [11]5. 관련 문서
[1] 가역행렬의 기본정리 참고. 이때 [math(\delta)]의 정의역의 원소는 [math(\mathrm{Syl}(f,g))]의 우측에 곱해진 열벡터가 아니라 좌측에 곱해진 행벡터이다. 이 때문인지 일부 저자는 [math(\mathrm{Syl}(f,g))]를 여기서 정의한 것의 전치행렬로 정의하기도 한다. 물론 그러더라도 [math(\mathrm{Res}(f,g))]는 변하지 않는다.[2] 이는 인수정리를 이용하면 쉽게 보일 수 있다.[3] 대수적 폐포에서는 모든 n차 다항식이 중복 포함 n개의 근을 갖는다.[4] 증명은 Brendan Hassett - Introduction to Algebraic Geometry의 Proposition 5.12 참고.[5] 증명은 Brendan Hassett - Introduction to Algebraic Geometry의 Theorem 5.13 참고.[6] 증명은 Mateusz Michałek, Bernd Sturmfels - Invitation to Nonlinear Algebra의 Theorem 4.11 참고.[7] 실베스터-갈라이 정리를 증명한 사람이기도 하다.[8] 월프럼 매스월드, 실베스터 행렬 -https://mathworld.wolfram.com/SylvesterMatrix.html[9] 고등학교 기하와 벡터, 성지출판 ( 일차변환과 행렬) 수학이야기-행렬과 행렬식37p 2017[10] A Memoir on the Theory of Matrices , Arthur Cayley , Philosophical Transactions of the Royal Society of London, Vol. 148 (1858), pp. 17-37 (21 pages) Published by Royal Society -https://www.jstor.org/stable/108649[11] L. On Hamilton's quadratic equation and the general unilateral equation in matrices J.J. Sylvester F.R.S. 1884/11/01 Pages 454-458 | Published online: 29 Apr 2009 DOI https://doi.org/10.1080/14786448408627619