최근 수정 시각 : 2024-12-17 21:58:51

연쇄 법칙

합성함수의 미분법에서 넘어옴

해석학· 미적분학
Analysis · Calculus
{{{#!wiki style="margin: 0 -10px -5px; min-height: calc(1.5em + 5px)"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -5px -1px -11px"
<colbgcolor=#26455A>실수와 복소수 실수( 실직선 · 아르키메데스 성질) · 복소수( 복소평면 · 극형식 · 편각) · 근방 · 유계 · 콤팩트성 · 완비성
함수 함수 · 조각적 정의 · 항등함수 · 역함수 · 멱함수 · 다변수함수( 동차함수 · 음함수) · 다가 함수 · 함수의 그래프 · 좌표계 · 닮은꼴 함수 · 극값 · 볼록/오목 · 증감표
초등함수( 대수함수 · 초월함수 · 로그함수 · 지수함수 · 삼각함수) · 특수함수 · 범함수( 변분법 · 오일러 방정식) · 병리적 함수
극한·연속 함수의 극한 · 수열의 극한 · 연속함수 · ε-δ 논법 · 수렴( 균등수렴) · 발산 · 부정형 · 점근선 · 무한대 · 무한소 · 특이점 · 0.999…=1
중간값 정리 · 최대·최소 정리 · 부동점 정리 · 스털링 근사 · 선형근사( 어림)
수열· 급수 수열( 규칙과 대응) · 급수( 멱급수 · 테일러 급수( /목록) · 조화급수 · 그란디 급수( 라마누잔합) · 망원급수( 부분분수분해)) · 그물
오일러 수열 · 베르누이 수열 · 월리스 곱
단조 수렴 정리 · 슈톨츠-체사로 정리 · 축소구간정리 · 급수의 수렴 판정 · 리만 재배열 정리 · 바젤 문제 · 파울하버의 공식 · 오일러-매클로린 공식 · 콜라츠 추측미해결
미분 미분 · 도함수( 이계도함수 · 도함수 일람) · 곱미분 · 몫미분 · 연쇄 법칙 · 임계점( 변곡점 · 안장점) · 매끄러움
평균값 정리( 롤의 정리) · 테일러 정리 · 역함수 정리 · 다르부 정리 · 로피탈 정리
립시츠 규칙 · 뉴턴-랩슨 방법 · 유율법 · 경사하강법
적분 적분 · 정적분( /예제) · 스틸체스 적분 · 부정적분( 부정적분 일람) · 부분적분( LIATE 법칙 · 도표적분법 · /예제) · 치환적분 · 이상적분( 코시 주요값)
미적분의 기본정리 · 적분의 평균값 정리
리시 방법 · 2학년의 꿈
다변수· 벡터 미적분 편도함수 · 미분형식 · · 중적분( 선적분 · 면적분 · 야코비안) · 야코비 공식
라그랑주 승수법 · 오일러 동차함수 정리 · 선적분의 기본정리 · 스토크스 정리( 발산 정리 · 그린 정리 변분법
미분방정식 미분방정식( /풀이) · 라플라스 변환
측도론 측도 · 가측함수 · 곱측도 · 르베그 적분 · 절대 연속 측도 · 라돈-니코딤 도함수
칸토어 집합 · 비탈리 집합
복소해석 코시-리만 방정식 · 로랑 급수( 주부) · 유수 · 해석적 연속 · 오일러 공식( 오일러 등식 · 드 무아브르 공식) · 리우빌의 정리 · 바이어슈트라스 분해 정리 · 미타그레플레르 정리
함수해석 공간 위상 벡터 공간 · 국소 볼록 공간 · 거리공간 · 프레셰 공간 · 노름공간 · 바나흐 공간 · 내적공간 · 힐베르트 공간 · Lp 공간
작용소 수반 작용소 · 에르미트 작용소 · 정규 작용소 · 유니터리 작용소 · 컴팩트 작용소
대수 C*-대수 · 폰 노이만 대수
정리 한-바나흐 정리 · 스펙트럼 정리 · 베르 범주 정리
이론 디랙 델타 함수( 분포이론)
조화해석 푸리에 해석( 푸리에 변환 · 아다마르 변환)
관련 분야 해석 기하학 · 미분 기하학 · 해석적 정수론( 1의 거듭제곱근 · 가우스 정수 · 아이젠슈타인 정수 · 소수 정리 · 리만 가설미해결) · 확률론( 확률 변수 · 중심극한정리) · 수치해석학 · 카오스 이론 · 분수계 미적분학 · 수리물리학( 양-밀스 질량 간극 가설미해결 · 나비에 스토크스 방정식의 해 존재 및 매끄러움미해결) · 수리경제학( 경제수학) · 공업수학
기타 퍼지 논리 · 합성곱
}}}}}}}}} ||

1. 개요2. 일변수함수3. 다변수함수4. 주의점5. 활용
5.1. 수학
5.1.1. 역함수의 도함수5.1.2. 음함수의 미분
5.2. 경제학

1. 개요

/ chain rule
합성함수를 미분하는 공식이다. 곧잘 체인룰(chain rule)로 언급된다. 합성함수의 미분법이라고도 한다. 연쇄 법칙을 반대로 적용한 것이 치환적분법이다.

2. 일변수함수

겉미분, 속미분 등의 말로 배우는 '합성함수의 미분'이 바로 연쇄 법칙을 간편한 형태로 적용한 것이다.

[math( f )]와 [math( g )]가 미분가능한 함수라고 하자. [math( y=f(u) )]이고 [math( u=g(x) )]일 때, [math( y )]는 [math( x )]로 미분가능하고 다음이 성립한다.
[math(\displaystyle \frac{\mathrm{d}y}{\mathrm{d}x} = \frac{\mathrm{d}y}{\mathrm{d}u} \frac{\mathrm{d}u}{\mathrm{d}x} )]
이때 [math(\displaystyle \frac{\mathrm{d}u}{\mathrm{d}x})]를 흔히 속미분이라고 부른다.

3. 다변수함수

[math( u )]가 [math( x_1, x_2, \cdots , x_n )]에 대한 미분가능한 [math( n )]변수 함수이고, [math( x_j )]가 각각 [math( t_1, t_2, \cdots , t_m )]에 대한 미분가능한 [math( m )]변수 함수이면, [math( u )]는 [math( t_1, t_2, \cdots, t_m )]에 대한 미분가능한 함수이고, 각 [math( i = 1,2, \cdots , m )]에 대하여 다음이 성립한다.
[math(\displaystyle \frac{\partial u}{\partial t_i} = \frac{\partial u}{\partial x_1} \frac{\partial x_1}{\partial t_i} + \frac{\partial u}{\partial x_2} \frac{\partial x_2}{\partial t_i} + \cdots + \frac{\partial u}{\partial x_n} \frac{\partial x_n}{\partial t_i})]

다변수의 미분을 선형 변환 혹은 행렬로 이해했다면 다음의 버전이 가장 일반적이다.
유클리드 공간의 열린 집합 [math(X, Y, Z)]에 대해 [math(g : X \rightarrow Y)], [math( f : Y \rightarrow Z)]가 각각 점 [math(x_0 \in X)], [math(y_0 = g(x_0))]에서 미분가능할 때, [math( h = f \circ g : X \rightarrow Z)]도 [math(x_0)]에서 미분가능하고, 그 도함수는 다음을 만족시킨다.
[math( \displaystyle Dh = Df \circ Dg )]
여기서 [math(Df, Dg)]를 야코비 행렬로 보고 행렬곱을 계산하면 위의 버전을 얻을 수 있다.

4. 주의점

흔히 고등학교 과정에서 나와 있는 1변수 연쇄법칙의 증명은 엄밀하지 않은 경우가 대부분이다. 일단 위아래에서 du를 약분한다는 헛소리는 걸러도 된다 주로 다음의 극한식을 사용하는데
[math(\displaystyle \lim_{x_1 \rightarrow x} \frac{f(g(x_1)) - f(g(x))}{x_1 - x} = \lim_{x_1 \rightarrow x} \frac{f(g(x_1)) - f(g(x))}{g(x_1) - g(x)} \frac{g(x_1) - g(x)}{x_1 - x} )]
언뜻 보면 완벽해 보이지만 이건 [math(g(x_1) -g(x))]가 도중에 0이 되는 경우는 우변의 분수식을 설명할 수 없다. 이것을 해결하기 위한 별도의 트릭을 사용하거나, 아니면 그냥 미분계수에 분수를 사용하지 않는 엡실론-델타 버전에 기대는 (즉 [math( |f(x+h) - f(x) - hf'(x)| < \epsilon h)] 이런 느낌으로) 방법이 있지만 첫번째는 번거롭고, 두번째는 고교과정 외이므로 보통 생략된다.

첫 번째 방식을 이용한 일변수 연쇄법칙의 증명(접기/펼치기)
보조함수 [math(F)]를
[math(\displaystyle F(y) = \begin{cases} \displaystyle \frac{f(y)-f(g(x))}{y-g(x)} & y \neq g(x) \\ f'(g(x)) & y = g(x) \end{cases} )]
라 정의하자. [math(f)]가 [math(g(x))]에서 미분가능하다는 가정을 이용하면 [math(F)]의 연속성을 증명할 수 있다. 이제 위의 분수식하고 거의 흡사하지만 약간 다른 다음의 식을 생각한다.
[math(\displaystyle \frac{f(g(x_1)) - f(g(x))}{x_1 - x} = F(g(x_1))\frac{g(x_1) - g(x)}{x_1 - x} )]
만약 [math(g(x_1) \neq g(x))]이면 [math(F)]의 정의를 대입하면 성립하고, [math(g(x_1)=g(x))]라면 양변은 모두 0이니까 성립한다. 즉 위 식은 항상 맞으면서도, 이제는 모든 함수들이 연속이기 때문에 [math(x_1 \rightarrow x)]로 극한을 보낼 수 있다. 그러면 우변은 [math(F(g(x))g'(x) = f'(g(x))g'(x))]가 되어 증명 끝.

두 번째 방식을 이용한 다변수 연쇄법칙의 증명(접기/펼치기)
다음 일반적인 미분의 정의를 사용한다. [math( g: X \rightarrow Y)]가 [math(x_0 \in X)]에서 미분가능하다는 것은, 임의의 [math(\epsilon>0)]에 대해 [math( |g(x_1) - g(x_0) - Dg(x_0) (x_1 - x_0)| < \epsilon |x_1 - x_0| )]이 만족되는 [math(x)]의 근방이 존재한다는 것이다. 여기서 [math(Dg(x_0))]는 선형사상으로 간주. 이제 [math(y_0 = g(x_0), y_1 = g(x_1))]과 [math(h = f \circ g)]에 대해, 다음의 등식을 생각한다.
[math( \displaystyle h(x_1) - h(x_0) - Df(y_0) Dg(x_0) (x_1 - x_0) = \left( f(y_1) - f(y_0) - Df(y_0) (y_1 - y_0) \right) + Df(y_0) \left(g(x_1) - g(x_0) - Dg(x) (x_1 - x_0) \right) )]
임의의 [math(\epsilon_1, \epsilon_2>0)]에 대해서,
[math( |f(y_1) - f(y_0) - Df(y_0) (y_1 - y_0)| < \epsilon_1 |y_1 - y_0| )]가 만족되는 [math(y_0)]의 근방을 [math(V_1)],
[math( |g(x_1) - g(x_0) - Dg(x_0) (x_1 - x_0)| < \epsilon_2 |x_1 - x_0|)]가 만족되는 [math(x_0)]의 근방을 [math(U_1)]
라 하고, [math(U = g^{-1}(V_1) \cap U_1)]으로 잡자. 그러면 [math(U)] 위에서
[math( \displaystyle |h(x_1) - h(x_0) - Df(y) Dg(x) (x_1 - x_0) | < \epsilon_1 |y_1 - y_0| + \epsilon_2 \| Df(y_0) \| |x_1 - x_0| )]
이고 특히 [math( |y_1 - y_0| \le (\|Dg(x_0)\| + \epsilon_2) |x_1 - x_0|)] 이므로,
[math( \displaystyle |h(x_1) - h(x_0) - Df(y) Dg(x) (x_1 - x_0) | < \left( \epsilon_1( \|D(g(x_0)\| + \epsilon_2) + \|Df(y_0)\| \epsilon_2 \right) |x_1 - x_0| )]
을 얻는다. 이제 주어진 [math(\epsilon>0)]에 대해 [math(\epsilon_1,\epsilon_2 >0)]을 적절히 잡으면, 선형사상 [math( Df(y) Dg(x) )]가 [math(h)]의 미분계수의 조건을 만족한다는 것을 증명할 수 있다.


대학교에서는 문제를 풀 때 단순히 합성함수 미분을 하더라도 연쇄법칙에 의한 것임을 언급해주어야 점수가 안 까인다.

5. 활용

5.1. 수학

5.1.1. 역함수의 도함수

파일:상세 내용 아이콘.svg   자세한 내용은 역함수 정리 문서
번 문단을
부분을
참고하십시오.

5.1.2. 음함수의 미분

[math(y)]가 [math(x)]에 대한 함수로 정의되면 [math(y)]를 [math(x)]에 대한 양함수(explicit function, )라 하고, 원의 방정식처럼 여러 개의 변수들의 관계식, 즉 [math(F(x,\,y)=0)]의 꼴로 정의되면 [math(y)]를 [math(x)]에 대한 음함수(implicit function, )[1]라 한다. 관계식 [math(F(x,\,y)=0)]을 [math(y)]에 대한 함수로 나타내어 미분하는 것이 쉽지 않은 경우가 많기 때문에, 관계식 [math(F(x,\,y)=0)]를 그대로 미분하되 [math(y)]가 [math(x)]에 대한 식으로 표현됨에 유의하여 연쇄법칙을 적용한다.
즉, [math(y)]를 [math(f(x))]로 취급하고 미분하면
[math(\displaystyle \frac{\mathrm{d}}{\mathrm{d}x})][math(f(x,\,y))] = [math(\displaystyle \frac{\partial f}{\partial x})] + [math(\dfrac{\partial f}{\partial y}\dfrac{{\rm d}y}{{\rm d}x}=0)]이 나오므로 이것을 [math(\frac{\mathrm{d}y}{\mathrm{d}x})]에 대한 식으로 만들면
[math(\displaystyle \frac{\mathrm{d}y}{\mathrm{d}x} = -\frac{\frac{\partial f}{\partial x}}{\frac{\partial f}{\partial y}})]이 되는데 이것을 음함수의 미분법이라 부른다.
음함수의 미분법은 단순 음함수 표현을 띄는 초월함수식들부터 시작해서 특히 이차곡선에서 많이 쓰인다. 이들 곡선은 [math(x)]값 하나에 [math(y)]값 [math(2)]개가 대응되므로 함수가 아니다. 단, [math(x^2=4py)]는 이차함수이므로 다항함수의 미분법을 적용해도 미분이 가능하다.

사실 음함수의 미분'법'이라고 하는 것은 chain rule에 의한 자명한 결과이다. 이변수 함수 [math(f(x,\,y))]와 일변수 함수 [math(g(x))]가 각각 미분가능하면 두 함수로 만들어낸 새로운 일변수 함수[math(f(x,\,g(x)))]또한 미분가능하고 그 값은 chain rule에 의해 구할 수 있게 된다.
그럼에도 불구하고 많은 미적분학 책에서는 이를 따로 가르치고 있는데 이는 단순한 미분'법'을 가르치기 위해서가 아니라(사실 미분법은 chain rule에서 이미 가르쳤다.) [math(y)]를 [math(x)]에 대한 함수로 본다는 사실을 강조하기 위함을 보여진다. 즉, 어떤 이변수 함수 [math(f(x,\,y))]가 주어질 때 [math(f(x,\,g(x))=0)]을 만족시키는 미분가능한 [math(g(x))]가 존재하는가? 라는 것을 강조하기 위함이다.
이러한 의문은 '음함수의 정리'가 만족시켜 주는데 기본적으로 미적분학책에서 나올 정도의 함수는 대부분 다 음함수 정리의 조건을 만족시키는 좋은 함수라고 할 수 있다.

파일:상세 내용 아이콘.svg   자세한 내용은 음함수 문서
번 문단을
음함수의 미분법 부분을
참고하십시오.

5.2. 경제학


[1] 간혹 함수의 정의에 입각해 음함수를 이해 못 하는 학생들이 종종 있다. 함수란 하나의(또는 한쌍의) 조작변수에 대해 하나의 종속변수가 대응하는 관계인데, 예시로 든[math(x^2+y^2-1=0)]의 식은 하나의 조작변수 x에 대응하는 값이 [math(y=\pm \sqrt {1-x^2})]로 두개이기 때문이다. 이것은 애초에 음함수라는 개념부터 엉성하게 이해하고 있기 때문에 발생하는 착각이다. 애초에 음함수 자체는 함수가 아니다. 음함수를 뜻하는 'implicit function'을 직역하면 '내재적 함수'로, 이는 공역을 잘 분리하면 '(명시적)함수'(explicit function)가 될 수 있다는 의미이다. 실제로 예시로 든[math(x^2+y^2-1=0)]는 공역을 [math(y_1,\in\{0≤y_1<∞\}, y_2\in\{-∞<y_2≤0\})]로 분리 할 경우 명시적 함수(explicit function)가 된다. 이러한 오해는 음함수를 배우는 이유나 음함수의 역할에 대한 설명 없이 바로 음함수의 미분법부터 배우는 잘못된 교육체계 때문에 발생하는 것이며, '음'함수라는 한자식 표현이 'implicit' function이라는 의미를 제대로 표현하지 못하고 있기 때문이다.