これまでn元連立1次方程式
を直接法,反復法などで解くことだけを考えてきた.
それでは実際の問題ではこのような線形システムはどのように扱われるだろうか.
たとえば,制御の分野ではシステムの状態変化を捉えるために用いている.
係数行列Aがシステム内部を表し,右辺の定数ベクトルbで外乱などの状態を表す.
システム内部が変わらず,外の状態が様々に変化したときの状態を知りたいとき,
係数行列Aは変化せず,bのみが変わるだけである.
このように係数行列が固定で右辺の定数ベクトルだけが変化するということは,
物理学などの他の分野でも多くある.
このとき,係数行列Aを解きやすい形に分解しておけば,計算量を大幅に減らすことができる.
ここではそのような分解の一つであるLU分解について述べる.
n元連立1次方程式の係数行列を考える.
これを以下の下三角行列(lower triangular matrix) L と 上三角行列 (upper triangular matrix) U に分解する.
ここで,
である.
このように分解することをLU分解と呼ぶ.
LU分解した行列で連立1次方程式を解くことを考える.
まず,
より,
とすると,
となる.Lは下三角行列であるので,1行目から順番に代入していくことで,
容易に
を算出することができる.この処理を前進代入(forward substitution)と呼ぶ.
が求まったらそれを2番目の式に代入する.
Uは上三角行列であるので,ガウスの消去法と同じく後退代入(backward substitution)
していくことで解
を求めることができる.
LU分解の手順†
係数行列AをLU分解するためには,以下の式を1行目から順番に適用していく.
メモリを節約するために,LU分解した結果を以下のように1つの行列に格納する.
LU分解の実装†
LU分解をC++で実装した例を以下に示す.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
| |
int LUDecomp(vector< vector<double> > &A, int n)
{
if(n <= 0) return 0;
for(int i = 0; i < n; ++i){
for(int j = 0; j <= i; ++j){
double lu = A[i][j];
for(int k = 0; k < j; ++k){
lu -= A[i][k]*A[k][j]; }
A[i][j] = lu;
}
for(int j = i+1; j < n; ++j){
double lu = A[i][j];
for(int k = 0; k < i; ++k){
lu -= A[i][k]*A[k][j]; }
A[i][j] = lu/A[i][i];
}
}
return 1;
}
|
LU分解で連立1次方程式を解く手順†
LU分解で連立1次方程式を解く方法は上でも述べたがここではより具体的な手順について説明する.
LU分解で連立1次方程式を解く手順は以下である.
- 下三角行列Lと上三角行列Uを求める.
- 前進代入により
を求める.
- 後退代入により
を求める.
1はすでに述べているので2,3について説明する.
- 前進代入
下三角行列Lと定数ベクトルbからyを求める.
Lは下三角行列であるので,1行目は単純に
で
が算出される.
得られた
を2行目の式に代入して同様に計算すると
が得られる.これをn行目まで繰り返す.式で書くと以下となる.
ここで,
である.
- 後退代入
前進代入で得られたyと上三角行列Uからxを求める.
基本的にはガウスの消去法の後退代入と同じである.
ただし,各行は対角項で正規化されている(対角成分がすべて1).
前進代入とは逆にn行目から順番に
を求めていく.
ここで,
である.
LU分解を用いた連立1次方程式の解法の実装†
LU分解で連立1次方程式を解くコードをC++で実装した例を以下に示す.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
| |
int LUSolver(const vector< vector<double> > &A, const vector<double> &b, vector<double> &x, int n)
{
if(n <= 0) return 0;
for(int i = 0; i < n; ++i){
double bly = b[i];
for(int j = 0; j < i; ++j){
bly -= A[i][j]*x[j];
}
x[i] = bly/A[i][i];
}
for(int i = n-1; i >= 0; --i){
double yux = x[i];
for(int j = i+1; j < n; ++j){
yux -= A[i][j]*x[j];
}
x[i] = yux;
}
return 1;
}
|