2013-11-29

主な確率分布

主な離散型分布と、連続型分布の中の指数分布を説明しました。

2013-11-28

リンクと表

リンク

他のページへのリンクを張るには、例えば、岡山大学のホームページhttp://www.okayama-u.ac.jp/にリンクを張るには
<A HREF="http://www.okayama-u.ac.jp/">岡山大学</A>
と書きます。
自分のサイトに複数のページを作ってリンクを張る場合は、例えばindex2.htmというページを作ってそこに行くには
<A HREF="index2.htm">2枚目のページ</A>
と書きます。

ホームページでは表を使うことが多いです。 このような
ABC
244
2-1-6
23-2
Sheet1
良く見かける表だけでなく、様々な文字や画像を並べるときも使えます。例えば

銀杏並木が美しい
岡山大学へようこそ
春は桜が美しい
環境理工学部全景

のようにレイアウトも、実は表を使って

銀杏並木が美しい
岡山大学へようこそ
春は桜が美しい
環境理工学部全景
のように並べておいて、内側の表の罫線を表示させず、一方外側の表は枠として表示させることで実現しています。
そこで表の作り方を勉強しましょう。メモ帳で

<HTML>
<HEAD>
<TITLE>
表の練習
</TITLE>
</HEAD>
<BODY>
ここに表を書きます。
</BODY>
</HTML>

という内容のファイルを作って、index2.htmというファイル名で保存して下さい。ここに表を書いていきましょう。
最も基本的な表の形は

<TABLE>
<TBODY>
<TR><TD>左上 </TD><TD>右上 </TD></TR>
<TR><TD>左下 </TD><TD>右下 </TD></TR>
</TBODY>
</TABLE>
です。この通りに入力すると

左上 右上
左下 右下
になります。順を追って説明します。

HTMLでは<命令>と</命令>がペアで使われるのでしたよね。
表では<TABLE>と</TABLE>がペアとなって、表の始まり、表の終わり、を表します。
表では<TBODY>と</TBODY>がペアとなって、表の本文の始まり、表の本文の終わり、を表します。
そして表の中では<TR>と</TR>がペアとなって、行の始まり、行の終わり、を表します。
最後に、各行の中では<TD>と</TD>がペアとなって、セルの始まり、セルの終わり、を表します。

練習問題1

:次の表を作ってください。

左上 中上 右上
左中 中中 右中
左下 中下 右下

<TABLE>を<TABLE border="1">に書き換えると、表の境界線が表示されます。

表に関するいくつかの補足

  • 表の見出のために太文字にするには<TD> </TD>の代わりに<TH> </TH>と書きます。
  • 複数のセルを横に繋げて表示するには<TD colspan="2">中身</TD>のように書きます。これで二つのセルが横に繋がります。
  • 縦に繋げて表示するには<TD rowspan="2">中身</TD>のように書きます。
  • セルの中央に文字を表示するには<TD>を<TD align="center">に、右に表示するには<TD>を<TD align="right">に書き直します。
  • セルの上のほうに表示するには<TD valign="top">, 中央なら<TD valign="middle">, 下のほうなら<TD valign="bottom">です。
  • 文字に色を付けたいときは<FONT COLOR="red">赤い文字</FONT>と書いてください。 大きさを変えるなら<FONT SIZE=大きさ>です。例えば<FONT COLOR="green" size="7">大きな緑の文字</FONT>のように、両方同時に指定することも出来ます。
    詳しくは<FONT> を見てください。
  • 色の名前は、色の名前を見てください。
  • bgcolor="色の名前"という方法で表の塗りつぶしが出来ます。<TABLE bgcolor="red">とか<TR bgcolor="green">とか<TD bgcolor="blue">を試してみてください。どこに色がつきましたか?

練習問題2

以前使った中国地方の県別人口データを次の表のように書いてください。
県別人口性別
県名鳥取294321
島根368402
岡山9391014
広島13981484
山口734817

図書館の工事ももうすぐ完了します。

2013-11-26

気温データの解析

前回までの方法で用意したデータを使って、気温データの解析を始めます。

今日の講義で使うデータを用意しておきました。

すっかり落葉しました。

2013-11-22

確率分布

今日のキーワード:確率変数、確率分布、確率関数、密度関数、分布関数

講義に行く途中、やたら太った猫を見かけました。

2013-11-21

ホームページ作成

ホームページを作ってみましょう。

準備

この実習室で公開する方法は利用の手引き7.2 WWW サーバの利用についてに書かれています。この中で出てくる統合認証管理システムのアドレスは利用の手引き8.1リンク集に書かれています。
準備に関して詳しいことは皆さんの操作を見ながら説明します。
準備として行うことは、自分のホームページを公開するときのアドレスを決めることです。
http://www.edu.cc.okayama-u.ac.jp/[公開DIR名]/
という形式で公開されますので、[公開DIR名]の部分を自分で決めてください。

何にするか考えたら、教育 WWW 公開 DIR 設定手順書(学生用)を見て公開DIRを設定した後、配信処理をしてください。
そして http://www.edu.cc.okayama-u.ac.jp/[公開DIR名]/ をInternet Explorerで見てください。

はじめに

ホームページの原稿は、HTMLという言語で書かれています。
メモ帳を使って

<FONT COLOR="red">こんにちは</FONT>こんばんわ

と書いてください。このとき、<FONT COLOR="red">などは仮名漢字変換をOFFにして入力してください。そして「名前を付けて保存」でhello.htmという名前でW:ドライブに保存してください。保存したら、W:ドライブを開いて、hello.htmというファイルをダブルクリックしてください。
こんにちは、という文字が赤く表示され、こんばんわ、という文字は黒く表示された筈です。そして<FONT COLOR="red">などは表示されていないでしょう。

< >で挟まれた部分は、実際には表示されず、表示を飾る命令になります。
<FONT COLOR="red">は文字を赤くしなさい、という命令、そして</FONT>は文字に関する命令おわり、という意味です。このように、HTML言語では<命令>と</命令>がペアで使われます。

基本

では、本格的にホームページの原稿を作ってみましょう。基本的なHTMLファイルは

<HTML>
<HEAD>
<TITLE>
タイトル
</TITLE>
</HEAD>
<BODY>
本文
</BODY>
</HTML>

です。これをindex.htmというファイル名で保存してから、InternetExplorerで

http://www.edu.cc.okayama-u.ac.jp/[公開DIR名]/

を見てください。先ほど書いたファイルの内容が表示されたはずです。
先ほど書いたファイルの説明をします。

<HTML>  ←ここからHTMLファイルが始まります。
<HEAD>  ←ここから前書きが始まります。
<TITLE>  ←ここからタイトルが始まります。
タイトル     ←ホームページのタイトルです。自由に書き換えてください。
</TITLE>  ←ここまでがタイトルです。
</HEAD>  ←ここまでが前書きです。
<BODY>  ←ここから本文が始まります。
本文      ←ホームページの本文です。自由に書き換えてください。
</BODY>  ←ここまでが本文です。
</HTML>  ←ここまでがHTMLファイルです。

これだけでは本文が物足りないので、色々飾りましょう。沢山のコマンドがありますが、この講義ではその中の一部だけを紹介します。全部のコマンドは HTMLタグリファレンスを見てください。

  • 改行は<BR>、段落は<P>です。
  • 本文全体の色を決めるには、<BODY TEXT=文字の色 BGCOLOR=背景の色>と書きます。例えば<BODY TEXT="white" BGCOLOR="black">のように。
    詳しくは <BODY>を見てください。
  • 一部分の文字の色を変えるには、上の例のように<FONT COLOR=文字の色>と書きます。大きさを変えるなら<FONT SIZE=大きさ>です。例えば<FONT COLOR="green" size="7">大きな緑の文字</FONT>のように、両方同時に指定することも出来ます。
    詳しくは<FONT> を見てください。
  • 色の名前は、色の名前を見てください。
  • 画像を貼り付けるには、例えば、http://www.okayama-u.ac.jp/jp/img/topss_01.jpgを皆さんのホームページに貼るには
    <IMG SRC="http://www.okayama-u.ac.jp/jp/img/topss_01.jpg">と書きます。画像のアドレスは、画像にマウスを合わせて右クリックして「プロパティ」を見ます。デジカメの画像をW:ドライブに保存して使うことも出来ます。
    詳しくは <IMG>を見てください。

  • 他のページへのリンクを張るには、例えば、岡山大学のホームページhttp://www.okayama-u.ac.jp/にリンクを張るには
    <A HREF="http://www.okayama-u.ac.jp/">岡山大学</A>と書きます。
    詳しくは<A>を見てください。

すっかり紅葉しました。

2013-11-08

パソコン実習

講義では数式を使って説明しましたが、実際に何十個もの数値の計算をするのは大変です。
面倒な計算はパソコンにやってもらいましょう。

準備

左上のファイルからオプションを選びます。

アドインを選んで下の設定を押します。

ソルバーアドインと分析ツールにチェックを付けます。

データ

皆さんが持っている教科書のデータを、一つ一つ入力していると時間がかかりますので、あらかじめ書いておきました。
例1.1例1.2例1.6
120
106
112
168
120
140
160
160
116
118
104
172
130
124
134
142
112
112
110
120
134
136
138
144
120
120
160
108
140
98
142
130
138
126
108
120
136
118
118
122
128
124
110
134
116
138
116
158
106
166
118
158
124
124
110
166
132
126
122
132
4
5
5
6
6
8
8
8
8
8
9
9
10
10
11
11
11
11
12
12
13
13
15
16
16
16
17
18
20
20
生徒身長座高
115988
215084
315786
415381
515883
615285
715583
815783
914576
1015885
1116185
1215083
1314879
1415484
1515485
1615985
1714983
1815586
1915384
2016088
出典

ヒストグラム

例1のデータのヒストグラムを書きましょう。
例1のデータをエクセルのA列にコピーしてください。

講義で説明したように、95~105, 105~115,...,165~175の区間に分けます。
区間の境界となる105,115,...,165をC列に書きます。

データからデータ分析を選びます。

データ分析からヒストグラムを選びます。

入力範囲欄に観測値を入力したセルを、データ区間欄に区間の境界を書いたセルを指定し、 出力先は少し右隣のE1セルを指定します。
右下のグラフ作成にもチェックを付けてOKを押します。

すると度数分布表とヒストグラムが出来上がります。

このままではx軸の表記がおかしいです。105と書かれた部分は95~105ですし、次の級と書かれた部分は165~175です。そこで各区間の中心値をD列に書いて、これをx軸に使います。
D列のデータをx軸に使うために、グラフを右クリックしてデータの選択を選びます。

右側の横(項目)軸ラベルの編集を押します。

D列に書いた数字を指定します。

これで、横軸に中心値が表示されました。

一種類しかないのに右側に説明がつくのは邪魔ですので消します。

このヒストグラムでは、102と104の人は同じ縦棒に含まれるのに、104の人と106の人は遠くに離れてしまっていますので、棒をくっつけます。
棒の上で右クリックして、データ系列の書式設定を選びます。

要素の間隔をなし(左側)にします。

これで完成です。あとは見やすい大きさに調整してください。

データの特性値

Sheet2に切り替えて、例1.2のデータをA1セルから貼り付けてください。
Excelを使って、教科書の例1.2, 例1.4の計算をします。

合計値と代表値を計算します。 B1セルに合計値と書いて、C1セルに =SUM(A1:A30)と書いてください。 B2セルに平均値と書いて、C2セルに =AVERAGE(A1:A30)と書いてください。 B3セルに中央値と書いて、C3セルに =MEDIAN(A1:A30)と書いてください。

次に散布度を計算します。エクセルの参考書で分散を調べるとVARと書かれていますので、
B4セルに分散と書いて、C4セルに =VAR(A1:A30)と書いてください。
すると19.75…と表示されます。
教科書例1.4では19.09となっていますので、計算誤差にしては違いが大きすぎます。
理由は、このVAR関数は不偏分散 を計算しているからです。
これは教科書第4章で、母集団分布の分散を推定するために計算した式です。
教科書第1章では、推定ではなくデータそのものの分散を計算するので を計算します。
B4セルに先ほど書いた分散を不偏分散に修正して、
B5セルに標本分散と書いて、C5セルに =VARP(A1:A30)と書いてください。
標準偏差も同様に二種類あります。
B6セルに標準偏差と書いて、C6セルに =STDEV(A1:A30)と書いてください。
B7セルに標本標準偏差と書いて、C7セルに =STDEVP(A1:A30)と書いてください。

その他の特性値としては
B8セルに平均偏差と書いて、C7セルに =AVEDEV(A1:A30)と書いてください。
B9セルに最小値と書いて、C7セルに =MIN(A1:A30)と書いてください。
B10セルに最大値と書いて、C7セルに =MAX(A1:A30)と書いてください。

2変量の相関

Sheet3に切り替えて例1.6のデータをA1セルから貼り付けてください。 散布図を描きましょう。
B2セルの上でマウスの左ボタンを押して、押したままC21セルまでマウスを移動させて左ボタンを離します。
そして画面上の「挿入」から「散布図」の「散布図(マーカーのみ)」を選びます。

すると図のような散布図が得られます。マウスを合わせるとそれが何番目のデータで、x,yの値が何であるか表示されます。

次に回帰直線をExcelに書いてもらいましょう。データ点のどれかにマウスを合わせて右ボタンを押して、表示されるメニューから「近似曲線の追加」を選びます。

「近似または回帰の種類」は「線形近似」を選び、また式も見たいので、「グラフに数式を表示する」にチェックをつけて、閉じるをクリックすると、回帰直線とその式が表示されます。

さてこの係数0.4757や定数10.383はどうやって求めましたか? データを, 直線をとおくと、から計算したyの値は、 これと実際のyの値との差 を2乗して正の値にしてから足した を最小にするのでしたね。a,bに関して2次関数で非負ですから必ず最小値を持つので、a,bで偏微分してそれぞれ0とおけばa,bに関する2元連立1次方程式になるのでそれをa,bについて解くことで


と求めることが出来ます。但しはそれぞれの平均、つまり
です。

ソルバー

もっと複雑な問題を考える時は
のように陽に書くことが出来ません。Excelを使えばこのような場合も計算できます。

座高の推定

y=ax+bのaとbを、Excelに直接計算させます。そのためにまずaやbの値を書く場所を用意しておきますのでA23セルに「a」、A24セルに「b」と書いてB23セルにaの値、B24セルにbの値を書くことにします。
空っぽだと数字にならないので何か適切な値を書いておきます。全く見当がつかないので、真横の線を書くことにしてaは傾きなので0、bは座高の大体の平均84にしておきます。
このaとbを用いて、y=ax+bという式を用いて身長から座高を推定しますので、D1セルに「座高の推定値」、D2セルに身長とa,bから推定した1番目の生徒の座高の式を書きます。y=ax+bなので「=B23*B2+B24」ですが、D3~D21にコピーしますからa,bを示すB23, B24が変わらないように「=B$23*B2+B$24」と書いておいて、それをコピーします。

当たり前ですが、真横の線で推定したので全て84です。

推定の様子をグラフに書いてみましょう。まず身長、座高、座高の推定値のデータを選択して散布図を描きます。

推定値の方は直線にしたいので推定値の点を右クリックして「データ系列の書式設定」を選びます。

「線の色」は「線(単色)」、「マーカーの種類」は「なし」を選んで「閉じる」をクリックします。

するとグラフがこのようになりますので、B23, B24セルの数字を変化させて直線が点に近付くように調整してみてください。

a=0.5, b=7だとこんな感じです。

あてはまりの良さの評価

見た目で評価したのでは不正確ですので、数値的に評価しましょう。
推定値がどれくらいずれているか計算するために、E1セルに「推定誤差」と書いて、E2セルに推定値と実際の座高の差「=D2-C2」を書いて、その式をE21までコピーします。

誤差はプラスにもマイナスにもなるので、そのまま合計、平均を求めると打ち消しあってしまいます。だから二乗してから足し算します。
F1セルに「誤差の二乗」と書いて、F2セルに誤差を二乗した「=E2^2」と書いてF21セルまでコピーします。最後にF22に、その20個の誤差の二乗を合計する式「=SUM(F2:F21)」を書きます。

このF22の値が誤差平方和で、この値が小さいほどあてはまりが良いことになります。この値を小さくするようにa,bの値を調整します。

ソルバーの利用

a,bの値を自分で調整していては大変ですし不正確ですから、Excelに調整させましょう。「データ」を選んで右端の「ソルバー」をクリックします。

どのセルをどうしたいのか(最大にする、最小にする)、そのためにどのセルの値を変化させるのか、を尋ねられますので、今回は誤差平方和であるF22を最小にするためにB23からB24までのセルを変化させると入力して「実行」をクリックします。

すると最小にする値を求めてくれます。

学内の銀杏が色づき始めました。