1. 정의
Stieltjes integral수학자 스틸체스(Thomas Joannes Stieltjes, 1856-1894)가 고안한 실수 위에서의 적분의 한 종류로, 실함수 [math(f)], [math(g)]에 대해 다음과 같은 꼴의 적분을 말한다.
[math(\displaystyle \int_a^b f(x) \,{\rm d}g(x) )]
이 적분의 정의는 마치 리만 적분처럼 리만합의 극한으로 정의할 수 있다. 즉, [math([a,\,b])]의 분할 [math(a = t_0 < t_1 < \cdots < t_n = b)]에 대해 다음처럼 정의한다.
[math(\displaystyle \int_a^b f(x) \,{\rm d}g(x) = \lim_{\sup|t_i-t_{i-1}| \to 0} \sum_{i=1}^n f(x_i) \{g(t_i)-g(t_{i-1})\} \quad (x_i\in[t_{i-1},t_i]) )]
스틸체스 적분이 존재하려면, 어떤 식으로든 구간을 잡고 그 안의 어떤 원소를 잡더라도 저 극한값이 일정해야 한다. 리만 적분을 일반화한 이러한 정의 때문에 리만-스틸체스 적분(Riemann-Stieltjes integral)이라 부르기도 한다.
다만, [math(f)], [math(g)]가 모두 연속함수일지라도 이 극한이 존재하지 않을 때가 있다. 만약 [math(f)]가 연속이고 [math(g)]가 조각적으로(piecewise) 단조증가/단조감소라면[1] 적분을 잘 정의할 수 있다. 혹은 [math(g)]가 미분가능해도 된다. 자세히는 얘기하지 않겠지만, 더 고급 과정에서는 [math(g)]가 유계변동(bounded variation)[2]이면 된다는 등 더욱 포괄적인 조건을 찾을 수 있다.
그런데 사실 [math(g)]가 미분 가능하면 이건 그냥 리만 적분이다. 정확히는 다음이 성립한다. (우변은 일반 적분) 평균값의 정리를 쓰면 증명할 수 있다.
[math(\displaystyle \int_a^b f(x) \,{\rm d}g(x) = \int_a^b f(x) \,g'(x) \,{\rm d}x )]
굳이 잘 쳐준다면 치환적분이나 부분적분의 편한 표기에서 나오는 다른 변수에 대한 적분을 엄밀하게 정의했다고 볼 수 있긴 하지만, 그게 끝이다. 이렇게 보면 보통 적분이랑 크게 다를 바 없어 보여서 대학 미적분학 과정에서도 언급이 잘 안되는 비운의 대상이다. 굳이 이런 것에까지 이름을 붙이다니 수학자들 참 할 일 없다싶지만, 학부생 2학년 수준 해석학보다 더 높은 수준에서 사용되는 아래의 쓰임새를 보면 놀라울 따름이다.
2. 기묘한 쓰임새
아래와 같이 적분구간 [math(g)]에 불연속함수를 넣으면, 놀라운 성질이 나온다.[math(g)]를 헤비사이드 계단 함수
[math(\displaystyle H(x) = \begin{cases} 1 & x\ge0 \\ 0 & x<0 \end{cases} )]
라고 하고, 구간 [math([-1,\,1])]에서 연속함수 [math(f)]의 적분을 계산해보자. 분할 [math(-1 = t_0 < t_1 < \cdots < t_n = 1)]에 대해, [math(H(t_{i}) - H(t_{i-1}))]은 오로지 [math(t_i \ge 0 > t_{i-1})]일 때만 값이 [math(1)]이고 나머지는 모두 [math(0)]이 된다. 즉, 리만 합은 [math(f(x_i))] ([math(x_i \in [t_{i-1},\,t_i])])인데, [math(t_i - t_{i-1} \rightarrow 0)]이고 [math(t_i \ge 0 > t_{i-1})]이므로 [math(x_i)]도 [math(0)]으로 수렴한다. [math(f)]가 연속이므로
[math(\displaystyle \int_{-1}^1 f(x) \,{\rm d}H(x) = f(0) )]
이 된다. 적분을 했는데 함수값이 나오는, 소위 말하는 디랙 델타 함수식 적분이 여기서 나올 수 있는 것이다.
더 나아가, 이 계단함수의 다음과 같은 일차결합
[math(\displaystyle g(x) = \sum_{i=1}^n \lambda_iH(x-x_i) )]
등을 생각한다면, 스틸체스 적분으로 다음과 같은 함수값 조합을 생각할 수도 있다.
[math(\displaystyle \int_{-\infty}^{\infty} f(x) \,{\rm d}g(x) = \sum_{i=1}^n \lambda_i f(x_i) )]
이는 이산확률 변수의 기댓값이다.[3] 한편, 연속확률변수의 기댓값도 확률분포함수 [math(\varphi(x))]에 대한 다음 적분으로 나타난다는 걸 생각하면 무언가 묘하다.
[math(\displaystyle \mathbb{E}[f(X) ] = \int_{-\infty}^{\infty} f(x) \,\varphi(x) \,{\rm d}x )]
즉, 확률변수가 이산이건 연속이건, 기댓값은 누적분포함수 [math(F_X(a) = P(X \le a))]만을 사용하여 다음처럼 나타낼 수 있다.
[math(\displaystyle \mathbb{E}[f(X) ] = \int_{-\infty}^{\infty} f(x) \,{\rm d}F_X(x) )]
스틸체스 적분의 입장에서는, 이산확률변수와 연속확률변수를 구별할 필요가 없을 뿐더러, 이산도 연속도 아닌 확률분포도 누적분포함수만 있으면 같은 기준으로 품을 수 있다. 더 나아가서, 확률분포의 공간을 누적분포함수의 모음으로서 동일하게 생각할 수 있는데, 사실 누적분포함수가 만족해야 할 조건은 치역이 [math((0,\,1))]을 포함하고 [math([0,\,1])]에 포함되는 단조증가 함수이면 충분하다. 이산과 연속 사이의 틈을 완벽히 메꿔주었을 뿐만 아니라 이 틈을 포함한 실체가 무엇인지도 완벽하게 규명해낸 것이다.
이산적 경우의 비슷한 예로, 수열의 합을 구할 때 최대정수함수를 이용해 [math(\sum a_n = \int a(x) \,{\rm d}\lfloor x \rfloor)] 같이 나타낼 수 있다. 이렇게만 쓰면 장난 같아 보이지만, 스틸체스 적분에 대한 부분적분, 즉
[math(\displaystyle \int f \,{\rm d}g = fg - \int g \,{\rm d}f)]
를 활용하면 생각보다 기상천외한 결과들을 끌어낼 수 있다. 해석적 정수론에서 매우 유용한 기법으로, 이걸 이용해 오일러-마스케로니 상수의 존재성 같은 걸 증명하거나 심지어는 리만 제타 함수의 근사식을 구하기도 하는 등 스틸체스 적분은 정말 다방면에 활용된다.
3. 측도론적 해석: 르벡-스틸체스 적분
리만 적분과 르벡 적분의 관계처럼 스틸체스 적분을 측도론의 관점에서 일반화한 개념이다. 함수 [math(g)]가 구간 [math([a,\,b])] 내에서 유계변동이고 우연속(right continuous)[4]이면 [math({\rm d}g)]가[math({\rm d}g([p,\,q]) = g(q)-g(p))]
를 만족하게 보렐 측도공간 [math(([a,\,b],\,\mathcal{B}([a,\,b])))] 위의 보렐 대수의 부호 있는 측도(signed measure)로 정의할 수 있다. 이렇게 보면 유계변동 조건의 의미를 [math(g)]의 '변량'인 [math({\rm d}g)]의 양수 파트와 음수 파트의 총합이 유한해야 한다는 조건으로 해석할 수도 있다. 하여튼 [math(f)]가 보렐 가측이고 [math({\rm d}g)]에 대해 적분가능이면, [math( \int_a^b f \,{\rm d}g)]는 단순히 이 [math({\rm d}g)]에 대한 (측도론적) 적분으로 정의할 수 있다. 이를 르벡-스틸체스 적분(Lebesgue-Stieltjes integral)이라 부르며, 만약 [math(f,\,g)]에 대해 리만-스틸체스 적분이 존재한다면 둘은 일치한다. 덕분에 측도론을 배운 이후라면 마치 리만 적분을 르벡 적분으로 모두 대체하듯이 르벡-스틸체스 적분은 스틸체스 적분을 모두 대체하는 역할을 맡게 된다.
이렇게만 쓰면 비교적 간단해 보이지만, 이는 측도론을 이해하는 데에 필요한 노력들이 모두 생략되어 있기 때문이다. 하지만, 바꿔 말하면, 이 스틸체스 적분도 측도를 이해하는 데에 나름 흥미로운 동기부여로 사용될 수 있다는 뜻이 된다. 실제로 르벡이 여기에 영감을 받았는지는 정확하게 알 수는 없겠지만, 확률론 등을 배우고 있는 사람들은 이런 연결고리도 한번쯤 생각해 볼 수 있을 것이다.
4. 관련 문서
[1] 즉, 주어진 구간을 유한 개의 구간으로 분할해서 각각의 구간에서 [math(g)]가 단조증가 혹은 단조감소가 되게 할 수 있으면[2] 유계변동의 정확한 정의는 다음과 같다. 임의의 분할 [math(a = t_0 < t_1 < \cdots < t_n = b)]에 대해 [math(|g(t_{i+1})-g(t_i)|)]의 총합이 상계를 가질 때, 함수 [math(g)]가 구간 [math([a,\,b])]에서 유계변동이라고 한다. 연속보다는 강하고 미분가능보다는 약한 조건이다.[3] 정확히 말하면, [math(P(X=x_i) = \lambda_i)]인 확률변수 [math(X)]에 대한 기댓값 [math(\mathbb E[f(X) ])][4] 우극한이 존재하고 함수값이랑 항상 일치하는 조건. 비슷하게 좌연속(left continuous)도 생각할 수 있고, 좌연속이며 우연속이면 연속함수이다.