직교 대각 화 - jiggyo daegag hwa

대칭행렬은 다른 형태의 행렬들보다 활용면에서 더 빈번하게 쓰입니다.

그래서 이번 포스트에서 대칭행렬에서의 대각화 속성에 대해서 알아봅시다.

그리고 추후에 행렬의 함수를 정의하는 방법에 대해서 논의해봅시다.

직교닮음

[2.83]에서 우리는

직교 대각 화 - jiggyo daegag hwa
를 만족하게 만드는 가역행렬 P가 존재하면 두 n×n 행렬 A와 C는 서로 닮았다고 했었습니다.

이의 특별한 케이스인

직교 대각 화 - jiggyo daegag hwa
를 만족하게 만드는 직교행렬 P1가 존재하는 경우를 고려해봅시다.

이와 같은 특별한 경우는 굉장히 중요하며 이러한 관계를 아래와 같이 표현합니다.

 [1] 행렬의 직교적으로 닮음(orthogonallysimilar)의 정의

 A와 C가 같은 크기의 정사각행렬이고

직교 대각 화 - jiggyo daegag hwa
를 만족하는 직교행렬 P가 존재한다면 C는 A와 직교적으로 닮았다(C is similar to A)고 말한다.

C는 A와 직교적으로 닮았다고 해봅시다. 그리고

직교 대각 화 - jiggyo daegag hwa
라고 해봅시다.

그렇다면

직교 대각 화 - jiggyo daegag hwa
라는 방정식에 의해서 A는 아래와 같이 표현됩니다.

직교 대각 화 - jiggyo daegag hwa

여기서 Q는 직교행렬이므로 결국 A는 C와 직교적으로 닮았습니다. 즉, 행렬의 직교닮음은 반드시 상호관계입니다.

따라서 우리는 A와 C가 서로 직교적으로 닮았다(A and C are orthogonally similar)고 표현할 수 있습니다.

다음 정리는 행렬의 직교닮음이 이전에 배운 연산자의 행렬과 밀접한 관련성이 있음을 보여주고 있습니다. ([2.83]의 [2]와 유사합니다.)

 [2] 행렬의 직교닮음과 연산자의 행렬 사이의 관계 정리

 A와 C가 서로 직교적으로 닮으면 어떤 선형연산자 T에 대하여 정규직교기저 B에 대한 T의 행렬이 C이면서 동시에 정규직교기저 B'에 대한 T의 행렬이 A가 되게 만드는 정규직교기저 B, B'이 존재한다. 역으로, 정규직교기저 B에 대한 T의 행렬이 C이면서 동시에 정규직교기저 B'에 대한 T의 행렬이 A라면 A와 C는 서로 직교적으로 닮았다.

먼저 A와 C가 서로 직교적으로 닮은 n×n 행렬이라고 할 때 

직교 대각 화 - jiggyo daegag hwa
 상의 어떤 선형연산자 T에 대하여 정규직교기저 B에 대한 T의 행렬이 C이면서 동시에 정규직교기저 B'에 대한 T의 행렬이 A가 되게 만드는 정규직교기저 B, B'이 존재함을 보이겠다.

B'을 

직교 대각 화 - jiggyo daegag hwa
의 표준기저(정규직교기저) S로 잡아보자. 그렇다면 [T]=A가 되어야한다.

A와 C는 서로 닮았으므로 

직교 대각 화 - jiggyo daegag hwa
를 만족하는 직교행렬 P가 존재한다. 즉, 
직교 대각 화 - jiggyo daegag hwa
를 만족하는 직교행렬 P가 존재한다.

그리고 그 P의 형태는 아래와 같다고 해보자.

직교 대각 화 - jiggyo daegag hwa

여기서 

직교 대각 화 - jiggyo daegag hwa
라고 해보자. P의 가역성과 [2.53]의 [3]에 의해 B 역시 
직교 대각 화 - jiggyo daegag hwa
의 기저가 된다. 그리고 P가 직교행렬이므로 B는 결국 
직교 대각 화 - jiggyo daegag hwa
의 정규직교기저가 된다.

[2.78]에 의하면 이러한 P는 마치 B에서 

직교 대각 화 - jiggyo daegag hwa
의 표준기저 S로의 추이행렬로 간주할 수 있으며 따라서 [2.81]의 [2]에 의해 아래와 같다.

직교 대각 화 - jiggyo daegag hwa

즉, A와 C가 서로 닮은 n×n 행렬이라면 표준행렬이 A인 

직교 대각 화 - jiggyo daegag hwa
 상의 선형연산자 T를 잡고 B'을 
직교 대각 화 - jiggyo daegag hwa
의 표준기저로 잡고 B를 
직교 대각 화 - jiggyo daegag hwa
를 만족시키는 가역행렬 P의 열벡터들로 "순서대로"2 구성된 집합으로 잡으면 정규직교기저 B에 대한 T의 행렬이 C이면서 동시에 정규직교기저 B'에 대한 T의 행렬이 A가 되게 만들 수 있다.

증명이 완료된다.

다음으로 

직교 대각 화 - jiggyo daegag hwa
 상의 어떤 선형연산자 T에 대하여 정규직교기저 B에 대한 T의 행렬이 C이면서 동시에 정규직교기저 B'에 대한 T의 행렬이 A라면 A와 C가 서로 직교적으로 닮았음을 보이겠다.

즉, 아래와 같을 때 A와 C가 서로 직교적으로 닮았음을 보이겠다.

직교 대각 화 - jiggyo daegag hwa

P가 B에서 B'로의 추이행렬이라면 [2.81]의 [1]에 의해 아래의 식이 만족됨을 알고 있다.

직교 대각 화 - jiggyo daegag hwa

즉, 아래와 같다.

직교 대각 화 - jiggyo daegag hwa

이는 

직교 대각 화 - jiggyo daegag hwa
와 같으므로 A와 C는 서로 닮았음을 알 수 있다. 그리고 B와 B'은 
직교 대각 화 - jiggyo daegag hwa
의 정규직교기저이므로 [2.78]의 [6]에 의해 여기서 P는 직교행렬이다.

따라서 A와 C는 서로 직교적으로 닮았다.

증명이 완료된다. 

이번 포스트에서 가장 중요한 부분은 바로 대각행렬과 직교적으로 닮은 행렬은 어떠한 조건을 만족해야하는지입니다.

이 질문은 아래 문제와 같아집니다.

 [3] 직교대각화 문제(The Orthogonal Diagonalization Problem)

 정사각행렬 A가 주어져있을 때 

직교 대각 화 - jiggyo daegag hwa
가 대각행렬이 되게 만드는 직교행렬 P가 존재하는가? 그리고 만약 그렇다면 어떻게 이와 같은 P를 찾을 수 있는가? 만약 이러한 행렬 P가 존재한다면 A를 직교대각화가능(orthogonally diagonalizable)하다고 하고 P가 A를 직교대각화한다(orthogonally diagonalize)고 말한다.

여기서 A를 한 선형연산자의 표준행렬이라고 생각하면 직교대각화문제는 정확히 어떤 정규직교기저에 대한 해당 연산자의 행렬이 대각행렬이 되는지 여부를 묻는 문제와 같아집니다.

A가 직교대각화가능하다면 행렬 A가 만족해야할 (필요)조건이 무엇일까요?

단도직입적으로 말하자면 A가 대칭행렬이 되어야만 합니다.

이를 보이기 위해 먼저 A가 아래와 같다고 해봅시다. 여기서 P는 직교행렬이고 D는 대각행렬이 됩니다.

직교 대각 화 - jiggyo daegag hwa

P가 직교행렬이므로 아래와 같습니다.

직교 대각 화 - jiggyo daegag hwa

그리고 D는 대칭행렬이기도 하므로 아래에 의해서 A는 반드시 대칭행렬이 되어야만함을 알 수 있습니다.

직교 대각 화 - jiggyo daegag hwa

그러나 A가 대칭행렬이다는 조건이 직교대각화가능의 필요조건임은 보였지만 충분조건임을 보이지는 않았습니다. 

(물론 조금 있다가 이는 충분조건도 됨을 보일 예정입니다.)

그렇다면 A가 직교대각화가능하다는 것과 동치가 되는 조건은 뭘까요?

바로 아래와 같습니다. (이는 [2.84]의 [2]와 유사합니다.)

 [4] 직교대각화가능과 고유벡터의 선형독립성 사이의 관계 정리

 n×n 행렬 A가 직교대각화가능하다는 말은 A가 서로 정규직교하는 n개의 고유벡터들을 가진다는 말과 동치가 된다.

먼저 A가 직교대각화가능할 때 서로 정규직교하는 n개의 고유벡터들을 가진다는 것을 보이겠다.

A가 직교대각화가 가능하므로 

직교 대각 화 - jiggyo daegag hwa
=D가 되는 직교행렬 P와 대각행렬 D가 존재한다.

따라서 P의 열벡터들은 서로 정규직교하며 [2.84]의 [2]의 증명에서 P의 열벡터들은 P의 열벡터들은 A의 n개의 고유벡터들을 형성한다.

즉, A는 서로 정규직교하는 n개의 고유벡터들을 가진다.

다음으로 A가 서로 정규직교하는 n개의 고유벡터 

직교 대각 화 - jiggyo daegag hwa
을 가질 때 A가 직교대각화가능함을 보이겠다.

이를 위해서 

직교 대각 화 - jiggyo daegag hwa
를 열벡터로 하는 행렬을 P라고 해보자.

그렇다면 P의 열벡터들은 서로 정규직교하므로 P는 직교행렬이 되며 [2.84]의 [2]의 증명에 의해서 P는 A를 대각화한다.

그러므로 P는 A를 직교대각화한다.

직교 대각 화 - jiggyo daegag hwa
 상의 n개의 정규직교벡터들의 집합은 반드시 
직교 대각 화 - jiggyo daegag hwa
의 정규직교기저가 됩니다. 따라서 [4]는 아래의 말과 동치가 됩니다.

"n×n 행렬 A가 직교대각화가능하다는 말은 A의 고유벡터들로 구성된 

직교 대각 화 - jiggyo daegag hwa
의 정규직교기저가 존재한다는 말과 동치가 된다."

우리는 이전에 직교대각화가능한 행렬은 반드시 대칭행렬이 됨을 보였습니다.

다음 정리는 모든 대칭행렬은 반드시 직교대각화가능함을 보여줍니다.

그리고 대칭행렬을 직교대각화하기 위한 방법을 제공하는 대칭행렬의 속성을 알려줍니다.

 [5] 대칭행렬과 직교대각화 사이의 관계 정리

 (a) 행렬이 직교대각화가능하다는 말은 대칭행렬이다는 말과 동치가 된다.

 (b) A가 대칭행렬3이라면 다른 고유공간으로부터 각각 하나씩 추출한 고유벡터들은 서로 직교한다.

여기서 [5]의 (a)를 증명하기 위해서는 대칭행렬의 고윳값에 대한 독특한 특징을 알아야합니다.

우리는 예전에 [2.27]의 [4]에서 모든 성분이 실수인 2×2 행렬은 반드시 실수 고윳값을 가짐을 보인 바 있습니다.

그러나 일반적으로 모든 성분이 실수인 n×n 행렬 역시 반드시 실수 고윳값을 가집니다.

안타깝게도 일반적인 사실을 증명하기 위해서는 복소수 차원으로 행렬과 벡터와 스칼라를 확장시킬 필요가 있습니다.

그러나 이를 확장시키려면 배보다 배꼽이 커지기 때문에 꼼꼼하게 확장시키지는 않을 것이고 아주 어설프게나마 증명과정에서 간략하게 확장시켜봅시다.

아래 보조정리 [5-1]의 증명에서만큼은 행렬과 벡터와 스칼라를 모두 복소수차원에서 생각해봅시다.

(물론 [5-1]에서 행렬 A는 모든 성분이 실수이지만 이는 마치 허수성분이 0인 복소수로 이해할 수 있습니다.)

 [5-1] 대칭행렬의 고윳값 정리

 A가 모든 성분이 실수인 대칭행렬이라면 A는 실수 고윳값만을 갖는다.

복소수차원에서도 여러가지 행렬연산(특히 행렬식 연산)과 그 연산의 성질은 실수차원과 전혀 다르지 않다. 또한 고윳값과 고유벡터 역시 실수차원과 전혀 다르지 않다.

임의의 n×n 복소수 행렬(모든 성분이 복소수인 행렬, complex matrix) A에 대하여 p(λ)=det(λI-A)은 복소수차원에서도 복소수계수를 가지는 n차 다항식이 되며 대수학의 기본정리에 p(λ)=0는 반드시 중복을 포함하여 n개의 복소수근을 반드시 가진다.

이러한 복소수근을 복소수 고윳값(complex eigenvalue)이라고 부른다. 

(즉, 실수 고윳값은 존재하지 않을 수 있지만 다르게 복소수 고윳값은 반드시 존재한다.)

λ가 복소수 고윳값이라는 말은 

직교 대각 화 - jiggyo daegag hwa
를 만족하는 C^n(
직교 대각 화 - jiggyo daegag hwa
의 복소수버전, 복소수 n공간(complex n-space)이라고 부른다.) 상의 복소수 n짝(complex n-tuple)인 영벡터가 아닌 벡터 
직교 대각 화 - jiggyo daegag hwa
가 존재한다는 말과 동치가 된다.

위를 입증하는데 필요할 수 있는 정리들은 실수차원에서만 한정되어 있었지만 복소수 차원으로 확장하더라도 그대로 성립하기 때문에 위가 성립한다.

이러한 벡터 

직교 대각 화 - jiggyo daegag hwa
를 λ에 대응하는 A의 복소수 고유벡터(complex eigenvector)라고 부른다.

벡터 

직교 대각 화 - jiggyo daegag hwa
와 행렬 A켤레복소수(complex conjugate)는 각각 모든 성분의 켤레복소수를 성분으로 삼은 벡터 혹은 행렬을 의미하며 각각 
직교 대각 화 - jiggyo daegag hwa
,
직교 대각 화 - jiggyo daegag hwa
라고 표현한다. (이러한 표현방식은 스칼라의 켤레복소수의 표현방식을 그대로 따온 것에 불과하다.)

그러나 복소수차원에서는 실수차원과 달리 점곱(dot product)의 정의가 약간 다릅니다.

직교 대각 화 - jiggyo daegag hwa
=(u1, u2, ..., un)과 
직교 대각 화 - jiggyo daegag hwa
=(v1, v2, ..., vn)이 C^n 상의 벡터일 때 
직교 대각 화 - jiggyo daegag hwa
와 
직교 대각 화 - jiggyo daegag hwa
복소수점곱(complex dot product) 혹은 복소수 유클리드 내적(complex Euclidean inner product)는 
직교 대각 화 - jiggyo daegag hwa
로 표현하며 아래와 같이 정의된다.

직교 대각 화 - jiggyo daegag hwa

따라서 C^n 상의 유클리드 노름(Euclidean norm)도 아래와 같이 정의되어진다.

직교 대각 화 - jiggyo daegag hwa

여기서 |v1|, |v2|, ..., |vn|은 복소수 v1, v2, ..., vn의 절댓값(absolute value) 혹은 모듈러스(modulus)라고 부른다. 

([1.40]에서 정의한 바 있다.)

이와 같은 개념을 이용하면 이제 증명할 수 있다.

A가 모든 성분이 실수인 대칭행렬이라고 하자. 그리고 λ가 A의 복소수 고윳값이며 

직교 대각 화 - jiggyo daegag hwa
가 이에 대응하는 C^n 상의 복소수 고유벡터라고 하자.

그렇다면 아래와 같다. 

직교 대각 화 - jiggyo daegag hwa

그리고 위의 사실을 이용하면 아래와 같다.

직교 대각 화 - jiggyo daegag hwa

여기서 

직교 대각 화 - jiggyo daegag hwa
는 영벡터가 아니다. 고윳값 λ는 아래와 같이 얻어진다.

직교 대각 화 - jiggyo daegag hwa

여기서 분모는 당연히 실수가 되며 분자가 실수임을 보이면 고윳값 λ가 실수임을 보일 수 있다.

분자는 아래와 같이 분자와 그 분자의 켤레복소수와 서로 같으므로 실수임을 보일 수 있다. 따라서 A의 고윳값은 반드시 실수가 된다.

(고등학교 때 배웠던 켤레복소수의 성질과 A가 실수 성분인 행렬임을 이용)

직교 대각 화 - jiggyo daegag hwa

n×n 대칭행렬의 경우 이의 특성다항식은 n차 다항식이므로 대수학의 기본정리에 의해 대칭행렬은 반드시 중복을 포함하여 n개의 고윳값을 가지며 [5-1]에 의해서 이러한 n개의 고윳값은 모두 실수 고윳값이 됩니다.

그리고 이에 따라 대칭행렬의 특성다항식은 반드시 실수차원에서 인수분해가능합니다.

이러한 사실과 [5-1]을 이용하여 [5]를 증명해봅시다.

(b)부터 증명하고 (a)를 증명하겠다.

(b) 증명

직교 대각 화 - jiggyo daegag hwa
가 각각 서로다른 고윳값 λ1, λ2에 대응하는 고유벡터라고 해보자. 

이 때 [2.2]의 Theorem 2.2.2.4a의 (a)를 잘 이용하면 아래와 같다.

직교 대각 화 - jiggyo daegag hwa
 

따라서 

직교 대각 화 - jiggyo daegag hwa
이고 λ1, λ2는 서로 다르므로 
직교 대각 화 - jiggyo daegag hwa
가 된다.

결국 다른 고유공간으로부터 각각 하나씩 추출한 고유벡터는 서로 직교한다.

(a) 증명

행렬 A가 직교대각화가능하면 대칭행렬이 됨은 이미 보인 바 있다.

따라서 행렬 A가 대칭행렬이라면 직교대각화가능함만 보이면 된다.

A가 n×n 대칭행렬이라고하자. 

그렇다면 [5-1]에 의해서 행렬 A의 특성다항식은 실수차원에서 인수분해되며 중복을 포함하여 n개의 실수 고윳값을 가진다.

따라서 임의의 실수 고윳값 λ0의 기하적 중복도와 대수적 중복도가 항상 같으면 [2.84]의 [8]의 (e)에 의해서 A는 대각화가능해진다.

이를 보이기 위해 λ0의 기하적 중복도를 k라고 해보자. 그리고 W를 λ0에 대응하는 고유공간이라고 해보자.

그리고 B0=

직교 대각 화 - jiggyo daegag hwa
는 W의 정규직교기저라고 해보자.

그렇다면 [2.72]의 [5]의 (b)를 통해 적절한 벡터를 추가함으로써 R^n의 정규직교기저 

직교 대각 화 - jiggyo daegag hwa
를 얻을 수 있다.

이제 n×n 행렬 P가 아래와 같다고 해보자. 그렇다면 P는 직교행렬이다.

(여기서 B2는 n×(n-k) 행렬이 된다.)

직교 대각 화 - jiggyo daegag hwa

그리고 n×n 행렬 C가 아래와 같다고 해보자.

(여기서 영행렬은 (n-k)×k 행렬, X는 k×(n-k) 행렬, Y는 (n-k)×(n-k) 행렬이다.)

직교 대각 화 - jiggyo daegag hwa

여기서 C의 부분행렬인 n×(n-k) 행렬 Z가 아래와 같다고 해보자.

직교 대각 화 - jiggyo daegag hwa

그리고 

직교 대각 화 - jiggyo daegag hwa
라고 해보자. 그렇다면 [2.84]의 [7]의 증명에 의해서 AP=PC가 된다.

P는 직교행렬이여서 P^TAP=P^TPC=C가 되므로 C는 대칭행렬이 되어 C의 부분행렬 X는 k×(n-k) 영행렬이 되어야만 한다.

A와 C는 서로 닮았으며 특성다항식은 닮음불변이므로 C의 특성다항식은 A의 특성다항식 p(λ)와 같다.

[2.84]의 [7]의 증명에 의해서 C의 특성다항식이자 A의 특성다항식은 아래와 같다.

직교 대각 화 - jiggyo daegag hwa

여기서 pY(λ)는 Y의 특성다항식이다.

따라서 pY(λ0)≠0임을 보이면 A에 대한 λ0의 대수적 중복도는 기하적 중복도 k와 같게 된다.

이를 보이기 위해 귀류법을 적용해보자. 즉, pY(λ0)=0일 때 모순이 발생함을 보여보자.

pY(λ0)=0라면 λ0는 Y의 고윳값이 되므로 

직교 대각 화 - jiggyo daegag hwa
를 만족하는 
직교 대각 화 - jiggyo daegag hwa
 상의 영벡터가 아닌 벡터 
직교 대각 화 - jiggyo daegag hwa
가 존재한다.

여기서 

직교 대각 화 - jiggyo daegag hwa
 상의 벡터 
직교 대각 화 - jiggyo daegag hwa
를 아래와 같이 정의해보자. 
직교 대각 화 - jiggyo daegag hwa
의 첫 k개의 성분은 0이 되고 나머지 n-k 성분은 
직교 대각 화 - jiggyo daegag hwa
가 된다.

직교 대각 화 - jiggyo daegag hwa
 

그렇다면 블록곱셈에 의해서 아래와 같다.

직교 대각 화 - jiggyo daegag hwa

즉,

직교 대각 화 - jiggyo daegag hwa
는 λ0에 대응하는 C의 고유벡터가 된다.

별도로

직교 대각 화 - jiggyo daegag hwa
의 정규기저벡터인
직교 대각 화 - jiggyo daegag hwa
도 λ0에 대응하는 C의 고유벡터가 된다. (직접 블록곱셈을 통해 증명해보라. 생략)

그리고

직교 대각 화 - jiggyo daegag hwa
직교 대각 화 - jiggyo daegag hwa
의 일차결합으로 절대 표현할 수 없으므로
직교 대각 화 - jiggyo daegag hwa
는 선형독립집합이 된다.

여기서 P는 가역행렬이므로

직교 대각 화 - jiggyo daegag hwa
도 선형독립집합이 된다. (선형독립의 정의를 이용하면 쉽게 증명가능. 생략)

또한

직교 대각 화 - jiggyo daegag hwa
이므로 [2.83]의 [5]의 (a)에 의해
직교 대각 화 - jiggyo daegag hwa
는 λ0에 대응하는 A의 고유벡터들로 구성된 선형독립집합이 된다.

W는 영부분공간이 아니므로 [2.46]의 [3]에 의해 dim(W)≥k+1이 된다.

그러나 이는 A에 대한 λ0의 기하적 중복도가 k라는 사실(dim(W)=k)과 모순된다.

따라서 pY(λ0)≠0임을 보이면 A에 대한 λ0의 대수적 중복도는 기하적 중복도 k와 같게 된다.

결국 A는 대각화가능하다.

A의 서로다른 고윳값이 λ1, λ2, ..., λk라고 해보자. 이는 [5-1]에 의해서 모두 실수가 된다.

그리고 고윳값 λi에 대응하는 고유공간을 Wi라고 해보자. 그리고 Wi의 정규직교기저를 Di라고 해보자.

이 때 D=D1∪D2∪...∪Dk라고 해보자. 그렇다면 D는 A의 고유벡터들로 구성된 집합이 된다.

그렇다면 i≠j일 때 (b)에 의해서 Di∩Dj는 공집합이 되어야하며 따라서 A가 대각화가능하므로 D의 원소의 개수는 dim(W1)+dim(W2)+...dim(Wk)=n이 된다. (대각화가능하면 기하적 중복도의 합은 n이 되므로)

그리고 (b)에 의해서 D는 정규직교기저가 된다. 결국 D에 의해서 A는 서로 정규직교하는 n개의 고유벡터들을 가지게 되므로 A는 직교대각화가능하다. 

1. 직교행렬은 자동적으로 가역행렬이다.
2. B가 사실은 "순서"기저임을 명심하라.
3. 여태까지 그래왔던 것처럼 행렬의 성분은 모두 실수다.