1. 개념
多 變 數 函 數 / function of several variables, multivariate function변수가 두 개 이상인 함수.
가장 기본적인 꼴의 함수는 [math(y=f(x))] 꼴로, 변수가 두 개이다. 이런 함수는 변수 [math(x)]와 변수 [math(y)]가 직접적인 영향을 주고받으며, [math(y)]가 종속변수가 되는 가운데 독립변수는 [math(x)] 단 하나이다. 또한, 변수의 개수는 여러 개일 수 있으므로 두 개, 세 개 그 이상으로 늘어나도 무방하다. 하나의 종속변수를 제외한 나머지 변수가 독립변수가 되므로 이 경우 독립변수가 두 개 이상이 된다.
[math(z=f(x, y))] 꼴이 되는 변수가 세 개인 다변수함수는, 좌표평면에 [math(x)]축과 [math(y)]축에 동시에 수직이 되고 원점을 지나는 [math(z)]축을 도입하여 3차원 좌표공간에 그래프로 나타낼 수 있다. 이때 그래프를 나타내기 위해 등고선, 밀도 그래프[1] 등을 이용할 수 있다. 정다포체처럼 차원이 4 이상인 도형은 실제로 현실 세계에다가 그리기 어렵고 복잡하므로 변수가 4개 이상인 다변수함수는 3차원 좌표공간 축에다가 축을 하나 이상 더하는 등의 방법으로 그래프로 나타낼 수 있다. 그러나 초기하함수처럼 집합을 변수로 하는 함수는 해당 변수를 좌표축으로 둘 수 없다.
다변수함수는 다변수 실함수(function of several real variables)와 다변수 복소함수(function of several complex variables)로 나뉜다. 큰 맥락으로는 벡터 함수, 텐서 함수 등도 포괄한다.
이 문서에서는 편의상 변수가 세 개인 다변수함수로 여러 정보를 설명하며, 임계점, 극대·극소, 변곡점, 안장점과 같은 개념들은 그 다변수함수를 그래프로 나타낼 수 있음을 전제하며, 따라서 함수의 변수도 세 개임을 전제하는 셈임을 기억하라.
2. 다변수함수가 되기 위한 조건
식 [math(y=f(x))]가 함수가 되려면, [math(f)]의 정의역에 속하는 [math(x)]에 값에 대해 오직 하나의 [math(y)]값이 [math(f)]의 치역에 존재해야 한다.이와 마찬가지로, 식 [math(z=f(x,y))]가 함수가 되려면, [math(f)]의 정의역에 속하는 [math((x,y))]로 이루어진 순서쌍 각각에 대해 오직 하나의 [math(z)]값만이 [math(f)]의 치역에 존재해야 한다. 이 경우 [math(x)]와 [math(y)]는 독립변수, [math(z)]는 종속변수가 된다. [math(x)]라는 독립변수의 값이 달라지지 않았는데 [math(z)]의 값이 달라졌다고 해서 함수가 아니라고 단정할 수 없다. [math(y)]의 값이 달라졌다면 순서쌍 [math((x,y))]가 결국 달라진 것이므로, 함수가 될 수 있다. 함수가 아닌 경우는 [math(x)]와 [math(y)]의 값이 모두 달라지지 않았는데 [math(z)]의 값이 달라질 수 있는 경우이다. 이 경우는 순서쌍 [math((x,y))]가 달라지지 않기 때문이다.
3. 편도함수
偏 導 函 數 / partial derivative다변수함수 [math(z=f(x,y))]에서 어느 한 독립변수([math(x)] 또는 [math(y)])가 종속변수 [math(z)]에 미치는 영향을 알기 위해서는 다변수함수의 편도함수를 구해야 한다.
[math(x)]에 대한 [math(z)]의 편도함수란, 다른 모든 독립변수는 변화 없이 일정하게 고정한 상태에서 [math(x)]의 변화가 [math(z)]에 끼치는 직접적인 영향, 즉 [math(x)]의 변화에 대한 [math(z)]의 순간변화율을 나타낸다. [math(f_x)], [math(z_x)], [math(f_x(x,y))], [math({\partial z\over \partial x})], [math({\partial f\over \partial x})]로 표기한다. [math(y)]에 대한 [math(z)]의 편도함수 역시 모든 것이 마찬가지이다. 이를 수학적으로 나타내면 다음과 같다.
[math(\displaystyle{\partial z\over \partial x}=\lim_{\Delta{x}\rightarrow 0}{f(x+\Delta{x},y)-f(x,y)\over \Delta{x}})]
[math(\displaystyle{\partial z\over\partial y}=\lim_{\Delta{y}\rightarrow 0}{f(x,y+\Delta{y})-f(x,y)\over \Delta{y}})]
3.1. 구하는 법
도함수를 구하는 것을 '미분'이라고 하듯이, 편도함수를 구하는 것은 '편미분'이라고 한다.자세한 내용은 편미분 문서 참고하십시오.
3.2. 편미분방정식
편도함수로 이뤄진 방정식으로, 이 방정식의 해는 다변수함수가 된다.자세한 내용은 편미분방정식 문서 참고하십시오.
4. 이차편도함수
二 次 偏 導 函 數 / quadratic partial derivative어느 한 독립변수에 대하여 두 번을 편미분하여 나오는 함수. 함수 [math(z=f(x,y))]에 대해, [math(x)]에 대한 이차편도함수는 [math(f_{xx})], [math((f_x)_x)], [math(\dfrac{\partial }{\partial x}\left(\dfrac{\partial z}{\partial x} \right))], [math(\dfrac{\partial ^2z}{\partial x^2})]로 표기한다. [math(y)]에 대한 이차편도함수 역시 모든 것이 마찬가지이다. [math(f_{xx})]는 두 독립변수 [math(x)]와 [math(y)] 중 [math(y)]가 고정된 상태에서의 [math(f_x)]의 변화율을 나타낸다. 마찬가지로 [math(f_{yy})]는 두 독립변수 [math(x)]와 [math(y)] 중 [math(x)]가 고정된 상태에서의 [math(f_y)]의 변화율을 나타낸다.
예를 들어 [math(f(x,y)=3x^2+4xy+2y^3)]을 [math(x)]에 대해 한 번 편미분하면 [math(f_x=6x+4y)], 두 번 편미분하면 [math(f_{xx}=6)]이다.
5. 교차편도함수 · 혼합편도함수
교차편도함수, 交 叉 偏 導 函 數 / cross partial derivative혼합편도함수, 混 合 偏 導 函 數 / mixed partial derivative
원시함수를 하나의 독립변수에 대해 편미분한 후 이를 다시 또다른 독립변수에 대해 편미분하여 나오는 함수. 함수 [math(z=f(x,y))]에 대해 먼저 [math(x)]에 대해 편미분한 후 [math(y)]에 대해 편미분한 교차편도함수는 [math(f_{xy})]로 쓴다. 마찬가지로, 함수 [math(z=f(x,y))]에 대해 먼저 [math(y)]에 대해 편미분한 후 [math(x)]에 대해 편미분한 교차편도함수는 [math(f_{yx})]로 쓴다. 다시 말해 편미분한 변수의 순서에 맞추어 표기하는 것이다.
교차편도함수는 1차편도함수를 구할 때 고정했던 독립변수[2] 중 어느 하나에 대한 1차편도함수의 변화율을 나타낸다.
한편, 언제 [math(\boldsymbol{f_{xy}=f_{yx}})]가 성립하는지는 큰 떡밥인데, 충분조건은 많은 수학자들이 찾아냈지만 필요충분조건은 아직 요원하다. 일상적 수준에선 이계 편미분이 연속이라는 충분조건 정도에서 넘어간다.
6. 임계점
臨 界 點 / critical point다변수함수의 극대점과 극소점, 안장점 |
임계점 [math(p)]의 근방 [math(U)]를 생각하자. [math(f(p))]가 [math(U)] 위에서 [math(f)]의 최대값/최소값이 될 때, [math(p)]를 각각 극대점(local maximum) 및 극소점(local minimum)이라 부른다. 극대점도 극소점도 아닌 임계점을 안장점(saddle point)이라 부른다.
모든 극대점과 극소점은 임계점이 되므로, 미분가능한 함수의 경우 가능한 임계점을 모두 조사해 극소점과 극대점들을 찾아낼 수 있다.
6.1. 극대
極 大 / relative maximum어떤 임계점에서 두 2차편도함수의 값의 곱이 두 교차편도함수의 곱[3]보다 크고 두 2차편도함수의 부호가 모두 음이면, 그 임계점은 극대가 된다. 곧,
[math(\displaystyle{1.})] [math(\displaystyle{f_x=f_y=0})] [math(\displaystyle{2.})] [math(\displaystyle{f_{xx}·f_{yy}>(f_{xy})^2})][4] [math(\displaystyle{3.})] [math(\displaystyle{f_{xx}<0, f_{yy}<0})] 를 만족시키는 점 [math((a,b))]는 극대이다. |
1번 조건은 점 [math((a,b))]가 임계점이 되도록 하며, 2번 조건은 그 임계점이 극대 혹은 극소가 되도록 범위를 좁히며, 3번 조건은 그 임계점이 극대로 최종적으로 결정되도록 한다.
6.2. 극소
極 小 / relative minimum어떤 임계점에서 두 2차편도함수의 곱이 두 교차편도함수의 곱보다 크고 두 2차편도함수의 부호가 모두 양이면, 그 임계점은 극소가 된다. 곧,
[math(\displaystyle{1.})] [math(\displaystyle{f_x=f_y=0})] [math(\displaystyle{2.})] [math(\displaystyle{f_{xx}·f_{yy}>(f_{xy})^2})] [math(\displaystyle{3.})] [math(\displaystyle{f_{xx}>0, f_{yy}>0})] 를 만족시키는 점 [math((a,b))]는 극소이다. |
1번 조건은 점 [math((a,b))]가 임계점이 되도록 하며, 2번 조건은 그 임계점이 극대 혹은 극소가 되도록 범위를 좁히며, 3번 조건은 그 임계점이 극소로 최종적으로 결정되도록 한다.
6.3. 변곡점
變 曲 點 / inflection point어떤 임계점에서 두 2차편도함수의 곱이 두 교차편도함수의 곱보다 작고 두 2차편도함수의 부호가 서로 같으면, 그 임계점은 변곡점이 된다.
곧,
[math(\displaystyle{1.})] [math(\displaystyle{f_x=f_y=0})] [math(\displaystyle{2.})] [math(\displaystyle{f_{xx}·f_{yy}<(f_{xy})^2})] [math(\displaystyle{3.})] [math(\displaystyle{f_{xx}·f_{yy}>0})] 를 만족시키는 점 [math((a,b))]는 변곡점이다. |
1번 조건은 점 [math((a,b))]가 임계점이 되도록 하며, 2번 조건은 그 임계점이 변곡점 혹은 안장점이 되도록 범위를 좁히며, 3번 조건은 그 임계점이 변곡점으로 최종적으로 결정되도록 한다.
6.4. 안장점/안점
鞍 裝 點, 鞍 點 / saddle point어떤 임계점에서 두 2차편도함수의 곱이 두 교차편도함수의 곱보다 작고 두 2차편도함수의 부호가 서로 다르면, 그 임계점은 안장점(안점)이 된다. 곧,
[math(\displaystyle{1.})] [math(\displaystyle{f_x=f_y=0})] [math(\displaystyle{2.})] [math(\displaystyle{f_{xx}·f_{yy}<(f_{xy})^2})] [math(\displaystyle{3.})] [math(\displaystyle{f_{xx}·f_{yy}<0})] 를 만족시키는 점 [math((a,b))]는 안장점이다. |
1번 조건은 점 [math((a,b))]가 임계점이 되도록 하며, 2번 조건은 그 임계점이 변곡점 혹은 안장점이 되도록 범위를 좁히며, 3번 조건은 그 임계점이 안장점으로 최종적으로 결정되도록 한다.
6.5. 그 외
어떤 임계점에서 두 2차편도함수의 곱이 두 교차편도함수의 곱과 같으면, 어떤 특수한 결론도 내릴 수 없다. 엄밀히 말하면, 극대도, 극소도, 변곡점도, 안장점도 아닌 임계점이 된다. 곧,
[math(\displaystyle{1.})] [math(\displaystyle{f_x=f_y=0})] [math(\displaystyle{2.})] [math(\displaystyle{f_{xx}·f_{yy}=(f_{xy})^2})] 를 만족시키는 점 [math((a,b))]는 극대도, 극소도, 변곡점도, 안장점도 아닌 임계점이다. |
1번 조건은 점 [math((a,b))]가 임계점이 되도록 하며, 2번 조건은 그 임계점이 극대도, 극소도, 변곡점도, 안장점도 아닌 임계점으로 최종적으로 결정되도록 한다.
6.6. 총정리
총정리하여 표로 나타내면 다음과 같다.그래프 [math(\displaystyle\boldsymbol{z=f(x,y)})] 위의 점 [math(\displaystyle\boldsymbol{(a,b)})]는 어떤 점인가? | ||||
[math(\displaystyle\boldsymbol{x=a, y=b})]를 대입하여 판단한다. | ||||
[math(\displaystyle{f_x=0, f_y=0})] (임계점) |
||||
[math(\displaystyle{f_{xx}·f_{yy}>(f_{xy})^2})] (극대 or 극소) |
[math(\displaystyle{f_{xx}·f_{yy}<(f_{xy})^2})] (변곡점 or 안장점) |
[math(\displaystyle{f_{xx}·f_{yy}=(f_{xy})^2})] (극대도, 극소도, 변곡점도, 안장점도 아닌 임계점) |
||
[math(\displaystyle{f_{xx}<0, f_{yy}<0})] (극대) |
[math(\displaystyle{f_{xx}>0, f_{yy}>0})] (극소) |
[math(\displaystyle{f_{xx}·f_{yy}>0})] (변곡점) |
[math(\displaystyle{f_{xx}·f_{yy}<0})] (안장점) |
6.7. 이계도함수 판정법
함수가 임계점 [math(p)] 근방에서 이계 미분이 존재할 경우, 헤세 행렬(Hessian matrix 또는 Hesse-Matrix) 혹은 헤시안(Hessian)은 이계도함수들을 모아놓은 다음의 대칭행렬로 정의된다.
[math(\displaystyle \mathrm{Hess}(f) = \left(\frac{\partial^2 f} {\partial x_i \partial x_j} \right)_{i,j=1,\cdots, n})]
대칭행렬에 대한
스펙트럼 정리에 의해, n변수 다변수함수의 헤세 행렬은 항상 대각화가 가능하며 n개의 고윳값을 갖는다. 이들 고윳값의 부호가 특정 조건을 만족시킬 경우 임계점의 특성을 다음과 같이 판정할 수 있다.
이계도함수 판정법/헤세 판정법(Second derivative test) 다변수함수가 임계점 [math(p)] 근방에서 모든 이계도함수가 존재하고 연속일 때([math(C^2)]),
|
고윳값이 반정치(semidefinite)인 경우에는 안장점 및 극점이 되는 것이 모두 가능하다. 예를 들어 [math(f(x,y) = x^2 + ky^4)] 같은 경우 헤세 행렬은 항상 양반정치(positive semidefinite)이지만, 점 [math((0,0))]은 [math(k<0)]이면 안장점이 되고, [math(k \ge 0)]이면 극대점이 된다. 다만 양수 고윳값이 있으면 적어도 극소점이 될 수는 없다는 것은 증명할 수 있다.
이계도함수 판정법의 증명은 다변수 테일러 정리를 2차항까지 전개하여 진행된다.
6.8. 이변수 함수에서의 이계도함수 판정법
이변수 함수의 이계도함수 판정법 다변수함수 [math(f(x,y))]가 임계점 [math(p)] 근방에서 모든 이계도함수가 존재하고 연속일 때([math(C^2)]),
|
식 [math(f_{xx} f_{yy} > f_{xy}^2)]은 헤세 행렬의 행렬식이며, 이변수 함수의 경우에는 이 행렬식은 고윳값 [math(\lambda_1, \lambda_2)]의 곱이 된다. 따라서 만약 행렬식이 0보다 작다면 두 고윳값의 부호는 달라진다. 만약 행렬식이 양수이고 [math(f_{xx}>0)]이면, 실베스터 판정법(Sylvester's criterion)에 의해 좌상단 [math(k \times k)]의 주 소행렬식(principal minors)이 모두 0보다 크므로 헤세 행렬이 양정치가 됨을 알 수 있다. 음정치인 경우에는 [math(-f)]에 1번 조건을 적용하면 된다.
6.9. 예시
복잡한 다변수 함수의 다항식 [math( f(x,y) =x^2-x y+y^2-4 x+2 y-3 )]의 경우를 예로 들면 [math( f_x = f_y = 0 )] 에서 임계점(critical point)인 2차 편도함수를 조사해야 한다. [5][6][math( f_x = 2x -y -4 = 0 )]
[math( f_y = -x +2y +2 = 0 )]
[math( x = 2 , y = 0 )]
[math( f_{xx} = 2 )]
[math( f_{yy} = 2 )]
[math( f_{xy} = -1 )]
이계도함수 판정법에 의해
[math( f_{xx}f_{yy} =2\cdot 2 , (f_{xy})^2 = (-1)^2 )]
[math( 4 > 1 )]
[math( f_{xx}f_{yy} > (f_{xy})^2 \text{이면서} f_{xx} > 0)]를 조사할수있다.
포인트[math(p(x,y))]는 최소값이다.
x축(빨간색),y축(녹색),z축(파랑색)에서 3D 모델
아래그림은 위 3D 모델의 등고선(Level Curves)이다.
포인트[math(p(2,0))] 최소값을 보여주는 등고선(Level Curves) |
7. 목록
- 다변수 다항함수
- 분할
- 어림 함수
- 최대공약수
- 최소공배수
- 약수 함수
- 초기하함수
- 폴리로그함수
- 지시함수
- 이변수 역탄젠트 함수
- 베타 함수
- 불완전 감마 함수
- 타원 적분 함수
- 야코비 타원 함수
- 세타 함수
- 르장드르 함수
- 에르미트 함수
- 라게르 함수
- 베셀 함수
8. 관련 문서
[1]
density plot
[2]
곧, 첫째 편미분의 대상이 되지 않은 독립변수
[3]
앞서 언급한 영의 정리에 의해, 두 교차편도함수의 곱이란 결국 어느 한 교차편도함수의 제곱과 같다. 곧, [math(\boldsymbol{f_{xy}=f_{yx}})]이므로 [math(\boldsymbol{(f_{xy})^2=(f_{yx})^2=f_{xy}·f_{yx}})]이다.
[4]
영의 정리에 의해 [math(\displaystyle{f_{xx}·f_{yy}>f_{xy}·f_{yx}})]이기 때문에, [math((f_{xy})^2)]이든 [math((f_{yx})^2)]이든 어느 것을 써도 상관없다.
[5]
\[참고 및 테스트\]
지오지브라geogebra 3d calculator
https://www.geogebra.org/3d
[6]
Matrix calculator(연립 선형 방정식 풀기)가우스 소거법에 의한 해
https://matrixcalc.org/ko/slu.html