1. 정의
볼록 집합 [math( S \subseteq \mathbb{R}^n)] 위에 정의된 함수 [math( f : S \to \mathbb{R} )]가 볼록(convex)임은 다음과 같이 정의된다.임의의 점 [math( (x, y) \in S^2)]과 실수 [math(t \in [0, 1])]에 대해, [math(f(tx+\left(1-t\right)y)\leq tf(x)+(1-t)f(y))]를 만족한다.[1]
다르게 말하면:
볼록 집합 [math( S )] [math(\subseteq \mathbb{R}^n)] 위에 정의된 함수 [math( f : S \to \mathbb{R} )]에 대해, [math(\left\{ (x, y) \in f : y \geq f(x) \right\})]가 볼록집합이면 볼록(convex)이다.
또한 함수 [math(f)]가 [math(S)]에서 오목(concave)[2]임은 [math(-f)]가 [math(S)]에서 볼록한 경우로 정의된다.
이 문서에서 서술하는 '볼록/오목'과 미적분Ⅱ에서 서술되는 '○○로 볼록/오목'은 다음과 같이 대응된다.
나무위키 | 고등학교 교과 |
볼록 | 아래로 볼록 |
위로 오목 | |
오목 | 위로 볼록 |
아래로 오목 |
2. 성질
참고로 중점만을 가지고 볼록함수를 판별하는 것은 충분하지 않으며, 미분 가능 + [math(\displaystyle {f(x)+f(y) \over 2} \ge \displaystyle f({x+y \over 2}))](*)를 만족하는 함수는 볼록함수이다. 미분 불가능한 함수 [math(f)]에 대한 코시 함수 방정식의 불연속해들이 (*)만을 만족하는 예시. 물론 볼록성을 가진다고 단정할 수 없다.
볼록함수가 구간 내에서 두번 미분가능하면 [math(f(x) \ge 0)]을 만족시킨다. 역으로 두번 미분가능한 함수가 열린 구간 내에서 [math(f(x) \ge 0)]을 만족시키면 [math(f)]는 그 구간 안에서 볼록이다. 증명은 평균값의 정리를 사용하면 된다.
한편, 일반적인 볼록함수 [math(f)]에 대해서도 다음과 같은 사실이 알려져 있다. (고교과정 외 수준)
- [math(f)]는 열린 구간에서 연속이다.
- 임의의 점 [math(x_0)]에 대해 좌미분계수 [math(f'_-(x_0)=\displaystyle \lim_{h\to0^-}\frac{f(x_0+h) - f(x_0)}{h})]와 우미분계수 [math(f'_+(x_0)=\displaystyle\lim_{h\to0^+}\frac{f(x_0+h)-f(x_0)}h)]가 존재하며, 임의의 [math(\epsilon>0)]에 대해 [math(f'_-(x_0) \le f'_+(x_0) \le f'_-(x_0+\epsilon))]이 성립한다.
- [math(f'_-(x_0) \le a \le f'_+(x_0) )]을 만족시키는 상수 [math(a)]에 대해서, 직선 [math( y = a(x-f(x_0)) + f(x_0) )]은 볼록함수 아래에 있다. 즉 [math( a(x-f(x_0)) + f(x_0) \ge f(x) )]가 성립한다. 이 [math(a)]를 하방 미분(subderivative)이라 부르기도 한다.
- [math(f)]는 가산 개의(countable) 점을 제외하면 미분가능하다.
- 닫힌 구간 내에서 볼록함수의 최대점은 양끝 경계점 중 하나이고, 최소점은 유일하게 존재한다.
한편, 어느 점 근방에서도 볼록/오목하지 않은 함수도 있다.
- 완전 불연속함수: 디리클레 함수가 대표적이다.
- 병리적 연속함수: 바이어슈트라스 함수가 대표적이다.
3. 공식
닫힌 구간 [math([a,\,b])]에서 연속인 함수 [math(f)]에 대하여 양수인 두 상수 [math(m)], [math(n)]에 대하여 다음이 성립한다.
특히 [math(m=n=1)]이면
|
각 수식의 의미를 먼저 파악해보자.
[math(\displaystyle \frac{mb+na}{m+n} )]
의 경우 [math(x)]축 위의 두 점 [math((a,\,0))], [math((b,\,0))]을 [math(m:n)]으로 내분하는 점의 [math(x)]좌표이다. 즉,
[math(\displaystyle f \biggl( \frac{mb+na}{m+n} \biggr) )]
는 해당 내분점의 [math(x)]좌표에 대한 [math(f(x))]의 함숫값이다.
이번에는 두 점 [math((a,\,f(a)))], [math((b,\,f(b)))]를 연결하는 직선 [math(l)]을 생각한다. 위에서 구한 내분점의 [math(x)]좌표에 대한 직선 위의 점은 곧 두 점 [math((a,\,f(a)))], [math((b,\,f(b)))]를 [math(m:n)]으로 내분하는 점이다.[3] 따라서 해당 점의 [math(y)]좌표는
[math(\displaystyle \frac{mf(b)+nf(a)}{m+n} )]
가 된다. 위 결과는 곧
- [math(x)]축 위의 내분점의 [math(x)]좌표에 대한 직선 [math(l)] 위의 함숫값 [math(\dfrac{mf(b)+nf(a)}{m+n})]
- [math(x)]축 위의 내분점의 [math(x)]좌표에 대한 [math(f(x))]의 함숫값 [math(\displaystyle f \biggl( \frac{mb+na}{m+n} \biggr))]
의 대소를 비교하는 것으로 이르게 된다.
곡선의 오목·볼록의 정의에 따라 구간 내에서 아래로 볼록한 함수의 함숫값은 직선 [math(l)]보다 밑에 있게 되어 2는 1보다 항상 아래에 있으므로
[math(\displaystyle \frac{mf(b)+nf(a)}{m+n}>f \biggl( \frac{mb+na}{m+n} \biggr) )]
반대로 구간 내에서 위로 볼록한 함수의 함숫값은 직선 [math(l)]보다 밑에 있게 되어 2는 1보다 항상 위에 있으므로
[math(\displaystyle \frac{mf(b)+nf(a)}{m+n}<f \biggl( \frac{mb+na}{m+n} \biggr) )]
위 내용을 좌표평면상에서 시각화하면 아래와 같다. [math((\rm a))], [math((\rm b))]는 각각 [math(f(x))]가 구간에서 아래로 볼록한 경우, 위로 볼록한 경우이다.
닫힌 구간 [math([a,\,b])]에서 연속인 함수 [math(f)]에 대하여 다음이 성립한다.
|
이를 쉽게 생각하기 위해서 [math(f(x) \geq 0)]이라는 제약을 걸고 분석을 해보자. 우선 수식
[math(\dfrac{b-a}{2}\{f(a)+f(b)\}=S)]
의 의미를 파악해보자. 이는 구간 [math([a,\,b])]에서 높이가 [math(b-a)]이고, 윗변과 아랫변의 길이가 각각 [math(f(a))], [math(f(b))]인 사다리꼴의 넓이가 된다.[4] 이 사다리꼴은 [math(x)]축, [math(x=a)], [math(x=b)], [math((a,\,f(a)))], [math((b,\,f(b)))]를 지나는 직선 [math(l)] 이렇게 네 직선으로 둘러싸인 도형이다. 또한 수식
[math(\displaystyle \int_{a}^{b}f(x)\,{\rm d}x=T)]
는 [math(x)]축, [math(x=a)], [math(x=b)], [math(f(x))]의 그래프로 둘러싸인 영역의 넓이를 의미한다.
함수가 아래로 볼록할 경우 구간 [math([a,\,b])]의 함숫값은 직선 [math(l)]보다 아래에 위치하므로 [math(S < T)], 위로 볼록할 경우 위에 위치하므로 [math(S>T)]인 것이다.
단, [math(f(x) \leq 0)]인 경우에는 [math(S)], [math(T)]를 영역의 넓이에 음의 부호를 붙인 것임에 유의하자. 이 경우에도 위 수식은 성립한다.
모든 경우가 포함된 경우에도 위 수식은 성립하며, 한 영역을 [math(f(x) \geq 0)] 혹은 [math(f(x) \leq 0)]인 구간으로 나누고 적용한 결과를 종합하면 이를 증명할 수 있다.
[math(f(x) \geq 0)]일 때 [math((\rm a))]의 아래로 볼록한 경우와 [math((\rm b))]의 위로 볼록한 경우에 대한 위 내용을 좌표평면상에서 시각화해보면 아래와 같다.
|
- 예제 [펼치기·접기]
- -----
이 내용은 2004년 수능 가형 8번에 출제되었다.
문제의 그래프는 [math(x)]축보다 위에 있고 아래로 볼록하므로 답은 'ㄱ, ㄷ'이다. [math(\overline{\rm PQ})]의 기울기는 [math(\{F(b)-F(a)\}/(b-a))]가 아니라 [math(\{f(b)-f(a)\}/(b-a))]이므로 ㄴ은 옳지 않다.
상수함수는 오목함수이기도 하고 볼록함수이기도 하다.[5] 디리클레 함수 같은 완전 불연속함수나 바이어슈트라스 함수 같은 병리적 연속함수는 어떤 점 근방을 잡더라도 그 위에서 오목하지도 볼록하지도 않다.
4. 기타
- 볼록은 최적화 이론의 근간이 된다.
[1]
젠센 부등식의 변수 2개일 때 형태와 같다.
[2]
보통 미분적분학 교과서에서 나오는 'CU', 'CD'의 'C'는 이 concave의 C이다.
[3]
직접 [math(\biggl( \dfrac{mb+na}{m+n},\,0 \biggr))]을 직선 [math(l)]의 방정식 [math(y=\dfrac{f(b)-f(a)}{b-a}(x-a)+f(a))]에 대입하여 구해봐도 되지만 닮음에 의하여 [math(m:n)]으로 내분하는 점임이 명백하다.
[4]
단, [math(f(a))]와 [math(f(b))] 중 하나가 0이면
직각삼각형의 넓이가 됨에 유의하자.
[5]
강오목함수 혹은 강볼록함수는 아니다.