1. 정의
볼록 집합 [math( S \subseteq \mathbb{R}^n)] 위에 정의된 함수 [math( f : S \to \mathbb{R} )]가 볼록(convex)임은 다음과 같다:임의의 점 [math( (x, y) \in S^2)]과 실수 [math(t \in [0, 1])]에 대해, [math(f\left(tx+\left(1-t\right)y\right)\leq tf\left(x\right)+\left(1-t\right)f\left(y\right))][1]
다르게 말하면:
볼록 집합 [math( S )] [math(\subseteq \mathbb{R}^n)] 위에 정의된 함수 [math( f : S \to \mathbb{R} )]에 대해, [math(\left\{ (x, y) \in f : y \geq f(x) \right\})]가 볼록집합이면 '''볼록(convex)이다.
[math(-f)]가 볼록한 경우 [math(f)]가 오목이다. 다음의 표를 참고하여라:
나무위키 | 고등학교 교과 |
볼록 | 아래로 볼록 |
위로 오목 | |
오목 | 위로 볼록 |
아래로 오목 |
즉, 볼록/오목 함수는 특별한 말이 없으면 아래로 볼록/오목한지를 의미하는 것이라고 이해하면 된다.
2. 성질
참고로 중점만을 가지고 볼록함수를 판별하는 것은 충분하지 않다. 즉 [math(\displaystyle {f(x)+f(y) \over 2} \ge \displaystyle f({x+y \over 2}))](*) 라고 다 볼록함수가 아니라는 소리다. 예시로 코시 함수 방정식의 불연속해들이 여기 해당한다. 하지만 미분가능한 함수이며 (*)를 만족시키면 볼록함수가 된다.
볼록함수가 구간 내에서 두번 미분가능하면 [math(f(x) \ge 0)]을 만족시킨다. 역으로 두번 미분가능한 함수가 열린 구간 내에서 [math(f(x) \ge 0)]을 만족시키면 [math(f)]는 그 구간 안에서 볼록이다. 증명은 평균값의 정리를 사용하면 된다.
한편, 일반적인 볼록함수 [math(f)]에 대해서도 다음과 같은 사실이 알려져 있다. (고교과정 외 수준)
- [math(f)]는 열린 구간에서 연속이다.
- 임의의 점 [math(x)]에 대해 좌미분(left derivative) [math(\partial_{-}f(x)= \lim_{h \rightarrow -0} \frac{f(x+h) - f(x))}{h} )] 과 우미분(right derivative) [math(\partial_{+}f(x) = \lim_{h \rightarrow +0} \frac{f(x+h) - f(x)}{h} )] 이 존재하며, 임의의 [math(\epsilon>0)]에 대해 [math(\partial_{-}f(x) \le \partial_{+}f(x) \le \partial_{-}f(x+\epsilon))]이다.
- [math(\partial_{-}f(x_0) \le a \le \partial_{+}f(x_0) )]을 만족시키는 상수 [math(a)]에 대해서, 직선 [math( y = a(x-f(x_0)) + f(x_0) )]은 볼록함수 아래에 있다. 즉 [math( a(x-f(x_0)) + f(x_0) \ge f(x) )]가 성립한다. 이 [math(a)]를 'subderivative'라 부르기도 한다.
- [math(f)]는 가산 개의(countable) 점을 제외하면 미분가능하다.
- 닫힌 구간 내에서 볼록함수의 최대점은 양끝 경계점 중 하나이고, 최소점은 유일하게 존재한다.
한편, 어느 점 근방에서도 볼록/오목하지 않은 함수도 있다.
- 완전 불연속함수: 디리클레 함수가 대표적이다.
- 병리적 연속함수: 바이어슈트라스 함수가 대표적이다.
3. 공식
닫힌 구간 [math([a,\,b])]에서 연속인 함수 [math(f(x))]에 대하여 양수인 두 상수 [math(m)], [math(n)]에 대하여 다음이 성립한다.
특히 [math(m=n=1)]이면
|
각 수식의 의미를 먼저 파악해보자.
[math(\displaystyle \frac{mb+na}{m+n} )]
의 경우 [math(x)]축 위의 두 점 [math((a,\,0))], [math((b,\,0))]을 [math(m:n)]으로 내분하는 점의 [math(x)]좌표이다. 즉,
[math(\displaystyle f \biggl( \frac{mb+na}{m+n} \biggr) )]
는 해당 내분점의 [math(x)]좌표에 대한 [math(f(x))]의 함숫값이다.
이번에는 두 점 [math((a,\,f(a)))], [math((b,\,f(b)))]를 연결하는 직선 [math(l)]을 생각한다. 위에서 구한 내분점의 [math(x)]좌표에 대한 직선 위의 점은 곧 두 점 [math((a,\,f(a)))], [math((b,\,f(b)))]를 [math(m:n)]으로 내분하는 점이다.[2] 따라서 해당 점의 [math(y)]좌표는
[math(\displaystyle \frac{mf(b)+nf(a)}{m+n} )]
가 된다. 위 결과는 곧
- [math(x)]축 위의 내분점의 [math(x)]좌표에 대한 직선 [math(l)] 위의 함숫값 [math(\dfrac{mf(b)+nf(a)}{m+n})]
- [math(x)]축 위의 내분점의 [math(x)]좌표에 대한 [math(f(x))]의 함숫값 [math(\displaystyle f \biggl( \frac{mb+na}{m+n} \biggr))]
의 대소를 비교하는 것으로 이르게 된다.
곡선의 오목·볼록의 정의에 따라 구간 내에서 아래로 볼록한 함수의 함숫값은 직선 [math(l)]보다 밑에 있게 되어 2는 1보다 항상 아래에 있으므로
[math(\displaystyle \frac{mf(b)+nf(a)}{m+n}>f \biggl( \frac{mb+na}{m+n} \biggr) )]
반대로 구간 내에서 위로 볼록한 함수의 함숫값은 직선 [math(l)]보다 밑에 있게 되어 2는 1보다 항상 위에 있으므로
[math(\displaystyle \frac{mf(b)+nf(a)}{m+n}<f \biggl( \frac{mb+na}{m+n} \biggr) )]
위 내용을 좌표평면상에서 시각화하면 아래와 같다. [math((\rm a))], [math((\rm b))]는 각각 [math(f(x))]가 구간에서 아래로 볼록한 경우, 위로 볼록한 경우이다.
닫힌 구간 [math([a,\,b])]에서 연속인 함수 [math(f(x))]에 대하여 다음이 성립한다.
|
이를 쉽게 생각하기 위해서 [math(f(x) \geq 0)]이라는 제약을 걸고 분석을 해보자. 우선 수식
[math(\dfrac{b-a}{2}\{f(a)+f(b)\}=S)]
의 의미를 파악해보자. 이는 구간 [math([a,\,b])]에서 높이가 [math(b-a)]이고, 윗변과 아랫변의 길이가 각각 [math(f(a))], [math(f(b))]인 사다리꼴의 넓이가 된다.[3] 이 사다리꼴은 [math(x)]축, [math(x=a)], [math(x=b)], [math((a,\,f(a)))], [math((b,\,f(b)))]를 지나는 직선 [math(l)] 이렇게 네 직선으로 둘러싸인 도형이다. 또한 수식
[math(\displaystyle \int_{a}^{b}f(x)\,{\rm d}x=T)]
는 [math(x)]축, [math(x=a)], [math(x=b)], [math(f(x))]의 그래프로 둘러싸인 영역의 넓이를 의미한다.
함수가 아래로 볼록할 경우 구간 [math([a,\,b])]의 함숫값은 직선 [math(l)]보다 아래에 위치하므로 [math(S < T)], 위로 볼록할 경우 위에 위치하므로 [math(S>T)]인 것이다.
단, [math(f(x) \leq 0)]인 경우에는 [math(S)], [math(T)]를 영역의 넓이에 음의 부호를 붙인 것임에 유의하자. 이 경우에도 위 수식은 성립한다.
모든 경우가 포함된 경우에도 위 수식은 성립하며, 한 영역을 [math(f(x) \geq 0)] 혹은 [math(f(x) \leq 0)]인 구간으로 나누고 적용한 결과를 종합하면 이를 증명할 수 있다.
[math(f(x) \geq 0)]일 때 [math((\rm a))]의 아래로 볼록한 경우와 [math((\rm b))]의 위로 볼록한 경우에 대한 위 내용을 좌표평면상에서 시각화해보면 아래와 같다.
|
- 예제 [펼치기·접기]
- -----
이 내용은 2004년 수능 가형 8번에 출제되었다.
문제의 그래프는 [math(x)]축보다 위에 있고 아래로 볼록하므로 답은 'ㄱ, ㄷ'이다. [math(\overline{\rm PQ})]의 기울기는 [math(\{F(b)-F(a)\}/(b-a))]가 아니라 [math(\{f(b)-f(a)\}/(b-a))]이므로 ㄴ은 옳지 않다.
상수함수는 오목함수이기도 하고 볼록함수이기도 하다.[4] 디리클레 함수 같은 완전 불연속함수나 바이어슈트라스 함수 같은 병리적 연속함수는 어떤 점 근방을 잡더라도 그 위에서 오목하지도 볼록하지도 않다.
4. 기타
- 볼록은 최적화 이론의 근간이 된다.
[1] 젠센 부등식의 변수 2개일 때 형태와 같다.[2] 직접 [math(\biggl( \dfrac{mb+na}{m+n},\,0 \biggr))]을 직선 [math(l)]의 방정식 [math(y=\dfrac{f(b)-f(a)}{b-a}(x-a)+f(a))]에 대입하여 구해봐도 되지만 닮음에 의하여 [math(m:n)]으로 내분하는 점임이 명백하다.[3] 단, [math(f(a))]와 [math(f(b))] 중 하나가 0이면 직각삼각형의 넓이가 됨에 유의하자.[4] 강오목함수 혹은 강볼록함수는 아니다.