2008-07-10

交差検証法による変数選択

交差検証法

今期の課題は先週の「緯度、経度、標高の全てを使うモデル」と「緯度と標高だけを使うモデル」のどちらが良いかを交差検証法で比較するプログラムまでです。
今後の発展としては、「緯度、経度、標高それぞれを使うか使わないか、合計23=8通りのモデル全てについて交差検証法を行い、どれが一番良いかを調べる」ことになります。
今回は直感的に、緯度と標高は役に立ちそうだけれど経度は役に立たないのではないか、と考えられましたので、最初は2通りだけの比較を考えましたが、そのような直感が使えない場合は全ての組み合わせを試す必要があります。

8通りの組み合わせの作り方は色々考えられますが、簡単に考えられるのは2進法展開、つまり0から23-1=7までのループで
0=000
1=001
2=010

7=111
と展開して、右から順に1ならば使う、0ならば使わない、つまり
000なら空集合
001ならx1を使う
010ならx2を使う

111ならx1, x2, x3を使う
このようにして8つのモデルを一つのループで表現して比較します。

0 件のコメント: