2009-07-27

統計学I期末試験解答

第1問

E(Y)=E(aX+b)=aE(X)+b=aμ+b
V(Y)=E((Y-E(Y))2)=E(((aX+b)-(aμ+b))2)=E((aX+b-aμ-b)2)= E((aX-aμ)2)=E(a2(X-μ)2)=a2E((X-μ)2)=a2σ2

第2問

(x, y)=(0.67, 0.2486)と(x, y)=(0.68, 0.2517)の2点を通る直線の方程式は
y-0.2486=(0.2517-0.2486)/(0.68-0.67)×(x-0.67)=0.31(x-0.67)
これにy=0.25を代入して、
x=(0.25-0.2486)/0.31+0.67=0.6745…≒0.675

第3問

問1 100回投げて表が出た回数の確率分布は二項分布B(100, 0.1)なので、期待値は100×0.1=10、分散は100×0.1×0.9=9である。
第1問の答にa=1/100, b=0を代入して、Xの期待値は10/100=0.1、分散は9/1002=0.0009。
問2 ラプラスの極限定理より100回投げて表が出た回数の確率分布は正規分布で近似されるのでそれに定数を掛けたり足した確率変数の分布も正規分布で近似される、あるいは中心極限定理より正規分布で近似される。平均、分散は問1で求めているので、正規分布N(0.1, 0.032)
問3 Xの分布がN(0.1, 0.032)で近似されるので、(X-0.1)/0.03の分布は標準正規分布で近似される。
P(0.1-a≦X≦0.1+a)=0.5
P((0.1-a-0.1)/0.03≦(X-0.1)/0.03≦(0.1+a-0.1)/0.03)=0.5
P(a/0.03≦(X-0.1)/0.03≦a/0.03)=0.5
標準正規分布はX=0に関して左右対称であることと第2問よりZが標準正規分布に従うならP(0≦Z≦0.675)=0.25より、a/0.03=0.675なのでa=0.675×0.03=0.02025
同様に P(0.1-b≦X≦0.1+b)=0.95
P((0.1-b-0.1)/0.03≦(X-0.1)/0.03≦(0.1+b-0.1)/0.03)=0.95
P(b/0.03≦(X-0.1)/0.03≦b/0.03)=0.95
標準正規分布はX=0に関して左右対称であることと正規分布表よりZが標準正規分布に従うならP(0≦Z≦1.96)=0.475なので、b/0.03=1.96。よってなのでb=1.96×0.03=0.0588
問4 10000回投げて表が出た回数の確率分布は二項分布B(10000, 0.1)なので、期待値は10000×0.1=1000、分散は10000×0.1×0.9=900である。
よってYの期待値は1000/10000=0.1、分散は900/100002=0.000009であり、Yの確率分布は正規分布N(0.1, 0.0032)で近似できる。
P(0.1-c≦Y≦0.1+c)=0.5
P((0.1-c-0.1)/0.003≦(Y-0.1)/0.003≦(0.1+c-0.1)/0.003)=0.5
P(c/0.003≦(Y-0.1)/0.003≦c/0.003)=0.5
問3同様に考えてc/0.003=0.675なのでc=0.675×0.003=0.002025
同様に P(0.1-d≦X≦0.1+d)=0.95
P((0.1-d-0.1)/0.003≦(Y-0.1)/0.003≦(0.1+d-0.1)/0.003)=0.95
P(d/0.003≦(Y-0.1)/0.003≦d/0.003)=0.95
問3同様に考えてd/0.003=1.96。よってなのでd=1.96×0.003=0.00588

基本的に、始めの方の問題で間違えた場合、その間違った答えに基づいて後のほうを理論的に正しく答えた場合は、後の方の問題は1問に限り答えが違っていても正解とします。例えば第2問の回答がx=0.675ではない人は第3問ではその値を使った回答が正解となります。正解とする理由は、同じ間違いで最初に既に減点済みだからで、1問に限る理由は、最初に間違えた値が偶々計算しやすい値であった場合、その後の問を計算するときに、最初から正しい値を求めて使っている人よりも有利になりすぎるからです。同様の理由で、同じ間違いを繰り返した場合、最初の1問だけ部分点をつけています。
但し第1問に限っては、持ち込み可能の教科書にも載っていますので、第1問を間違えた場合でも第3問の問1では教科書どおりに計算しなければ正解としません。そうしないと、第1問の間違えた解答を用いて答えてもでも教科書どおりに答えても両方正解となってしまいますので。

解説

第3問はモンテカルロ・シミュレーションの精度に関する問題です。回数を100倍にしても精度は√100=10倍しか向上しません。またpの値が小さくなると標準偏差は大凡√pで小さくなりますので誤差は小さくなりますが、pに対する相対的な誤差は大きくなります。
pが0に近いとき1-pは1に近いので表の回数の分散はnp(1-p)≒np、よって表の回数をnで割って得られる推定値の分散はp/n。従って、許容される確率に応じて上で求めた0.675とか1.96に√(p/n)をかけたものがばらつきの片側の幅になります。
pが小さくなると相対的に√pは大きくなるので、pが小さいほどnを大きくする必要があります。

0 件のコメント: