2007-11-27

多項式回帰

実験の結果(x,y)に関して、次の20個のデータが観測されました。
xy
0.000.854
0.050.786
0.100.706
0.150.763
0.200.772
0.250.693
0.300.805
0.350.739
0.400.760
0.450.764
0.500.810
0.550.791
0.600.798
0.650.841
0.700.882
0.750.879
0.800.863
0.850.934
0.900.971
0.950.985
出典:小西貞則、北川源四郎著「情報量規準」共立出版株式会社

このデータに多項式モデル

y=β01x+β2x2+…βpxp

を当てはめてみます。0次多項式(定数), 1次多項式(直線)から6次多項式を当てはめて、交差検証法を用いて、何次多項式モデルが最も良いか選択してください。

x,x2,…,x6を前回のデータにおける緯度、経度、標高と同じようにそれぞれ別の変量として扱うことで、前回同様の方法で回帰式の係数や、残差平方和を求めることが出来ます。

前回同様、CSV形式で書いておきますので、CSVファイルとして保存してください。

x, y
0.00, 0.854
0.05, 0.786
0.10, 0.706
0.15, 0.763
0.20, 0.772
0.25, 0.693
0.30, 0.805
0.35, 0.739
0.40, 0.760
0.45, 0.764
0.50, 0.810
0.55, 0.791
0.60, 0.798
0.65, 0.841
0.70, 0.882
0.75, 0.879
0.80, 0.863
0.85, 0.934
0.90, 0.971
0.95, 0.985

気温のデータの場合は、緯度だけ使う、経度だけ使う、など全部で23=8通りの組み合わせがありましたが、多項式の場合は1次の項を使わず2次の項だけ使う、ということはありえないので、検証すべき組み合わせは

  • 定数項だけ
  • 1次の項まで
  • 2次の項まで
  • 3次の項まで
  • 4次の項まで
  • 5次の項まで
  • 6次の項まで
となります。

0 件のコメント: