笛田薫Blog: 研究

ラベル研究の投稿を表示しています。すべての投稿を表示

2013-04-01

2011-06-20

Android用GPSロガーアプリ

GPSログの要約

アンドロイドでGPSのログを記録するソフトを探してみました。

nmeaで保存するならSmart Trackerしか見つかりませんでした。
追記:SmartTrackerというソフトはいくつかあります。Perious Jangのものがnmeaで保存できます。

Asparaはログを画面に表示して、表示されている分は記録できますが、例えば画面を回転させたりするだけでも表示がクリアされてしまうので、ほんの短時間しか記録できません。
記録できるのはGPGSA, GPRMC, GPGGA, GPLOR, GPGSVでした。

nmeaにこだわらず、GPX, KMLでもよいのであれば、手軽で分かりやすいのはMy Tracks, 手間を惜しまず高機能の地図ソフトならLocus, その他OruxMaps, TurboGPS2, GPS Essentials, GPS Averagingなどがあります。

GPS toolboxは保存はせず経路を画面に表示するだけ
センサーロガーはGPSではなく加速度センサーだけでした。

その他検索で見つかったのは
ShareGPS, GPS over BT, BlueNMEA:これらはログを撮るのではなく、パソコンからGPSアンテナとして使われるためのソフトです。
Lefebure NTRIP Clientは逆に外部GPSを記録
「Bluetoothは、出力のGPS」:機械翻訳されていて何が書かれているのかわかりませんでした。

関係ないですが、
ASUS WebStorageの無料版が2GBの増えていました。
一方、ASUSのパソコンを買った人向けが「ASUS WebStorage」サービス内容変更のお知らせによると、容量無制限＋期間制限から容量3GB＋無期限に変更になっていました。これだと無料版の2GBと大差ないですね。

いつもわかりづらいメモリの速度の表記
DDR3-1333 = PC3-10600
DDR3-1066 = PC3-8500

2011-01-11

Excel VBA

次のプログラムを実行するとMsgBoxには何が表示されるでしょうか？

Sub test()
Dim x As String, y As String
x = 1
y = 2
MsgBox ((x + y) * 2 - (x * 2 + y * 2))
End Sub

2(x+y)から括弧を外した2x+2yを引くので0になるように思えますが、なりません。
今日の午後悩んだ問題のポイントだけを取り出すと上記のプログラムになります。実際にはもっともっと複雑な演算の中に紛れていたので見つけるのに半日かかりました。

google chrome安定版8.0.552.237
http://dl.google.com/chrome/install/552.237/chrome_installer.exe

2010-09-29

応用経済時系列研究会「ソブリン・リスクと日本の格付け」

応用経済時系列研究会チュートリアルセミナー
「ソブリン・リスクと日本の格付け」

サブプライム問題、リーマンショックにより引き起こされた金融危機が一息ついた2009年末、ギリシャの財政問題を契機に、それまでは無リスク債券として扱われてきたソブリンのリスクが意識され始めた。今回のチュートリアルセミナーでは「ソブリン・リスクと日本の格付け」と題して2人の講師に講演をお願いした。

最初の講演は、日興コーディアル証券の阿竹敬之氏に「ソブリン・リスク問題と金融市場の動向」というタイトルで昨年末から意識され始めたソブリン・リスクの解説と、その問題の金融市場への影響の分析、そして財政が悪い日本国債が何故買われているのか、に関して講演して頂いた。

2009年末から、それまでは無リスク債券として扱われてきた各国の国債のリスクが意識され始め、PIIGS(ポルトガル、イタリア、アイルランド、ギリシア、スペイン)問題と呼ばれている。この問題はこの5か国固有の問題ではなく、背景として、サブプライム問題に端を発した金融危機がある。この危機を乗り切るために先進国はどこも大幅な財政出動をしており、財政状況は悪化しており、PIIGSはその中でも特に弱い国々として問題になっている。また、PIIGS問題のために他の先進国の金融機関に問題が生じた場合に、これまでの金融危機を乗り切るために財政状況が悪化している先進国に、さらなる救済余力が残っているか？という疑問も生じている。特にフランス、ドイツの金融機関にギリシャ向け与信が多く、イギリスはこれまでに自国のGDPを上回る資産規模の銀行を救済しており、財政が厳しくなっている。
これらの国と比べて対GDP比での財政債務が大きい日本の金利が何故このように低く、為替も円高になっているのか？金利が低い一番の理由として、安心して貸し出せる資金需要がないのに預金は集まるので国債以外に投資先がないことが挙げられる。年齢別人口構成からみても、退職者が退職金を預金することが今後数年間続く。但し団塊の世代が年金受給を始めると運用資産の取り崩しが始まり、国債の市中消化が困難になる可能性がある。

二番目の講演はスタンダード＆プアーズソブリン格付け部門ディレクターの小川隆平氏に「日本・アジア地域の経済動向とソブリン格付け」という演題で講演して頂いた。
私は、この講演を聞くまでは「ユーロ紙幣を一国の決定だけでは発行出来ないユーロ諸国を例外とすれば、自国通貨建て国債がデフォルトすることはあり得ない」と思っていた。中央銀行に紙幣を発行させれば必ず償還できるので、ソブリン格付けとはどんな意味があるのだろうか？と疑問を持っていたのだが、この講演で最初にソブリン格付けについてご説明いただいたことでソブリンのリスクが理解できた。民間企業が発行した社債と異なり国債の場合には、返済が可能であっても、政治判断によりデフォルトすることがある、ということが、この分野に関して不勉強な私にとって一番の驚きであった。支払い能力があっても、デフォルトを選んだ方が得なのでデフォルトした国も実際に存在する。一般に、外貨建て国債のほうがデフォルトしやすい。それは単に返済のための外貨を調達できないからだけではなく、外国人保有率が高いのでデフォルトした場合の自国民の損失が小さいことも理由の一つである。このような政治的要素がソブリンリスクの一つの特徴である。ロシアは自国建て国債もデフォルトしたことがあり、この事例では外国人保有率が５０％を超えていた。
また、格付けでは中長期的なファンダメンタルズを見て、借りたお金を契約通りに返す確率を評価しており、それ以外の広い意味でのカントリーリスクは考慮していないとのことである。

アジア地域の経済動向とソブリン格付けはおおむね問題ない。アジア通貨危機を教訓に、自国通貨建てで、長期で借りていたことと、2008年までの景気が良い時に資産を積み上げていたからである。しかし先進国の需要が減退したので、輸出依存度が高い国の影響は大きかった。
国別の問題点を以下に列挙する。
香港、シンガポール：輸出依存度が高く、世界景気の変動の影響を受けやすい。好景気の時はよいが、輸出が１０％下がるとGDPが２０％下がる構造となっている。
中国：成長率は高いが、成長の質に問題があり、今の水準の高成長は長くは続けられない。しかしながら、2012年の指導者交代まで経済成長を続けなければならず、ソフトランディングすら出来ない。
インド:ヨーロッパに対するGDP依存度が高い。但しドイツ、フランスなどコアになる国への依存が大半で、PIIGSへの依存は小さい。純債務残高が多いが、国債は殆ど自国通貨発行であり名目GDP成長率が約15%と高いので、債務は年率10%増えても対GDP比では減っている。
タイ：定量的には格付けはもっと高くてもよいが、政権がコロコロ変わるので中長期的なプロジェクトが出来ない。インフラ、教育など、数年後に後悔しても急には出来ないため、中長期的なプロジェクトが出来ないことは格付けにはマイナスである。
ベトナム：国内問題に対処するためにブレーキをかけているときにリーマンショックの影響を受けた。

日本国債の格付けに関して、長所としては、他国の外貨準備に使われるほど強い通貨を持ち、国内で資金を調達できるので外貨建て国債を出す必要がないこと、対外純債権国であること、そして金融システムも安定していることが挙げられる。一方短所としては総理大臣がほぼ1年毎に６回も変わり、構造問題に手がつけられていないことがある。また総債務残高がGDP比190%に加えて財投国債もGDP比15%あるので財政の柔軟性が落ちている。純債務残高はGDP比110%（純債務＝総債務－総資産）だが、この資産の中身が分からず、本当に使えるお金ベースで考えると純債務はもっと多いのかもしれないという懸念がある。インドの例のように、名目GDPが高成長であれば対GDP比での債務は減るのだが、過去18年間トータルで名目GDPゼロ成長である。新興国だけでなくアメリカ、ドイツも成長しているにも関わらず。香港、シンガポールと異なりGDP輸出依存度16%と低く、公共投資依存体質となっている。
では景気が良くなれば財政問題は解消するのであろうか？景気が良くなれば資金需要も増え金利も上昇するので、税収増との競争になってしまう。
国債の消化に関しては
・景気が悪いので国債残高が増える
・景気が悪いので資金需要が少なく、低金利で国債を発行できる
という、奇妙な均衡状態にあるため、ここ1,2年では問題ないが、歪がたまり続けることに違いはなく、何かのトリガーで問題になる可能性がある。
例えば地方債の格付けにおいて、地方債を国が保証しているとは考えていないが、国は何らかの助けを出す必要があり、地方債のデフォルトが国債デフォルトのトリガーを引くかもしれない。

講演後の質疑では、国債の安全性に対するマーケットの評価としてCDSプライスが注目されているが、どこまで参考になるかとの質問があった。CDSプライスもあくまでマーケットの需給で決まるので、ヘッジ需要が少なければ格付けと比べて安くなることもあるとのことであった。

2009-11-13

応用経済時系列研究会「ブラック・スワンとどう向き合うか？」

2009年度応用経済時系列研究会/東京リスクマネジャー懇談会
ジョイントパネルディスカッション
『ブラック・スワンとどう向き合うか？』
～金融危機後のリスク管理～
に参加してきました。

個人的に気になった点。(括弧内は私自身の注)

背景

金融工学により、一つのリスク資産を元にして、ハイリスク・ハイリターンな証券からローリスク・ローリターンな証券まで様々な金融商品を作ることが出来るようになった。
商品のバリエーションが増えれば需要も増える。
(元となったリスク資産を見て「もう少しリスクが高くてもいいから、もっとリターンが高い金融商品が欲しい」という人の希望に合わせることが出来ます)
流動化が進み、マーケットが拡大した。
(決して一部の扇動的な解説本(not 解説書)にあるような「金融工学によってリスクが霧散して無くなった」と偽ったから売れたわけではありません)
信用創造が進んだ
リスクテイクが増大した

金融工学の(使われ方としての)問題点

主観を客観的に見せかけることが出来る。: 例:主観的に弾いたオプション価格からブラックショールズモデルでインプライドボラティリティを計算しておいて、「現在ボラティリティがこれくらいだから、このオプションの現在の価格なら売り(とか買い)」のように、いかにも客観的根拠があるかのように言える。
(去年の卒論でも、ブラックショールズ式を一通り勉強して、さあ計算してみようという段階になって、さてボラティリティとして何を使いましょう？と迷ったことがあります。特に去年10月から株価の変動が大きくなっているので、ヒストリカルボラティリティを計算するために、どれくらい前から現在までのデータを使うかによって、算出されるボラティリティが全然違いました。
「とりあえず250営業日(約1年)が使われるそうだから、それで計算してみたら」とは言ったものの、明日になれば「直近250営業日」の範囲から、変動の小さかった1年前のデータが一日分消えて変動の大きな最近のデータが入るので、今日明日何も無くてもヒストリカルボラティリティは上がることになります。まるで個人向けの株価チャート解説「あと何日の間に株価がxx円を超えられないと25日移動平均線がxx円まで下がってきて株価の頭を抑えて云々」のように、数日後の指標の推移が今現在までの数値だけでほぼ決まっていることを連想しました)

VaRの歴史と(使われ方としての)問題点

元々、現在のポジションのリスクを、大雑把で良いから数量的に把握するために使われ始めた。
現在のような厳密なリスク評価のために開発されたのではない。
(理論の一つの応用としてVaRの推定を考えたことがあります。
確かに1%VaR以上の損失が発生した頻度は1000営業日中10日で抑えられたのですが、その10日の損の中には1%VaRの2倍以上の損もあって、果たしてこれでリスク管理と言えるのだろうかと疑問に思ったことがあります)
役員には基本的な正規分布ですら説明できないので「この方法での損失は、過去これくらいでした」というヒストリカルな説明しか出来ない(こともある？)
VaRはヒストリカルデータに基づいて計算する。
つまりバックミラーを見ながら運転するようなものであって、前方を探知するレーダーではない。
バックミラーも運転には必要だが、それを見るだけでの運転は危険。
道が狭くなる、路面が悪くなるとスピードを落とすのは当たり前。VaRを過度に信頼して、それ以外の情報に注意しなくなるのは危険。

現場での、勝率の重要性

例えば自分の計算では、100分の1の確率で200万円になり、100分の99の確率で無価値になるオプションがあったとします。自分の計算では、このオプションの期待値は2万円なのですが、市場では、多くの人が「200万円になる確率は200分の1しかない」と考えていて1万円で売買されていたとしましょう。
もし自分の計算が正しければ、理論的にはこのオプションを1万円で買うことは正しいです。期待値の半額で買えますし、損をしても1万円です。
ところがもし私が金融機関のトレーダーならば、この取引はすべきではありません。まず、大数の法則が働くほど、同様の取引が出来るとは限りません。100分の99の確率でこのオプションは無価値になりますので、数回の取引では購入したオプションの全てが無価値になる、つまり損を繰り返す確率は高いです。200万円になる確率が、皆が思っている倍であったとしても、それが実現する前に、繰り返し損をした無能者としてクビになります。
これがブラックスワンの著者タレプのように自分のファンドなら、100回150回と買い続けることで200万を得る確率は高いですが、雇われトレーダーではそこまで待って貰えません。
雇われトレーダーにとっては、待ってもらえる間に利益を得るために、それなりに高い勝率が必要となります。

数値によるリスク制限ではなく人としてのリスクマネージャの存在意義

Scapegoatとして。問題が起こったときに責任を押し付ける役目として。
業績評価としてはプットのショートみたいなもの。何かの問題が生じたときに一気に大きなマイナスになる（プットが欲しい人にとっては、売り手が居ないと困る）
リスクマネージャにとってのリスク管理は、常にアップデートされた履歴書を持ち歩くこと(笑)
As a Firefighterとして。問題が発生する前からリスク要因を見つめているので、対策する人としても適任。

ロスカットと仮説検定の類似性

ロスカットルール: 損失がある程度大きくなったら、その取引を行う基となった考え方が間違っていると判断して、取引を終了し(最初に買ったのなら売る、ショートしたなら買い戻す)、損失を確定することでそれ以上の損の拡大を防ぐ。
仮説検定: ある仮説が正しいならば発生する確率が低く(例えば5%未満)、その仮説が正しくないならば発生する確率が高いことは実際に発生したならば、もとの仮説が間違っていたと判断する(棄却する)。(もとの仮説は正しいけど確率5%未満のことが発生したと考えるのではなく)
背理法(これ以降、私の補足): ある仮説が正しいならば決して発生しないことが実際に発生したならば、もとの仮説が間違っている、と考えます。
「AならばB」＋「Bでない」＝「Aでない」
仮説検定と背理法の違い: 仮説検定には「もとの仮説は正しいのに、本当に運悪く確率5%未満のことが発生してしまい、正しい仮説を間違えて棄却する危険」が5%存在します。背理法にはその危険はありませんが、「ある仮説が正しいならば決して発生しないこと」という関係が存在する場合しか使えません。
仮説検定と背理法の注意点: 「(仮説検定で)仮説を棄却しなかった」「(背理法で)仮説を否定しなかった」ことは「仮説の正しさを証明した」のではなく、「棄却(否定)するに足る充分な証拠がなかった」に過ぎません。
「これまでに発見されたSwanは全て白かった」は「Swanは白い」の証拠になりません。(Swanの定義に「色は白い」が含まれてない場合)
個人的な驚き: ロスカットルールが有効であるのは、リスク資産の過去と将来の値動きに正の相関があり、損失が生じたポジションの今後の期待リターンが負であることが示された場合だけ、と思っていました。
「損失が生じたポジションの今後の期待リターンが負であること」を示すのではなく「損失が生じたポジションの今後の期待リターンが正である」ことを示せない限り、
・そのポジションが他の資産、他の場面と比較して大きなリターンをもたらすとは期待できず、
・そのポジションを立てた理由も否定されていて、
持ち続ける理由はない、と考えられます。

2008-12-16

Continuous Univariate Distributions

対数正規分布に関する式を手っ取り早く探すには
エクセルを用いた対数正規分布の計算
数理ファイナンス[MathematicalFinance]
細かく見れば間違っている部分もあるのですが、手軽に利用できる形で公開してくれていることがありがたいです。

2008-10-28

ArcGIS

悪戦苦闘しているのでメモ
Ver9.0だと、XPにIE7を入れるとツールボックスが動きません。
Athlon64以降のCPUの場合、boot.iniの /NoExecute=OptIn(またはOptOut)の部分を /NoExecute=AlwaysOff にしなければインストール出来ません。
てくてくダイアリーでも悪戦苦闘なさっています。
インストール | ArcGISやAutoCADの使い方とも参考にしました。

2008-10-09

故障時期予測

予測と聞くと気になるのでメモ
PHM 2008
故障を事前に察知する研究の国際会議「PHM 2008」前日レポート
愛犬がノートPCに粗相をしても慌てずに済む技術を目指す
はんだ付けの寿命とコンデンサの故障時期を予測

2008-06-21

ハフモデルによる商圏分析

本稿では、消費者の買い物出向率をハフモデルを用いて分析する。
ハフモデルとはHuff (1963)により提案された「消費者が、各商業集積へ買い物出向する確率は、商業集積の売場面積の規模に比例し、そこに到達する時間距離のべき乗に反比例する」というモデルであり、新規出店による集客及び他店舗への影響の推定に用いられる。今回は数年おきに調査された「岡山県民の生活行動圏」データを用い、市町村を集計単位とした。分析の結果、ハフモデルにおける距離の指数、すなわち購買地選択において距離をどの程度重視するかというパラメータに関しては、食料品などの最寄品は距離を重視、レジャーなどは距離を軽視するという常識的な結果だけでなく、最近は距離を重視する傾向があることが分かった。また同一市町村間の移動に関しても最近は時間距離が増加していると見做しての購買地選択を行っていることが分かった。さらに、通産省修正ハフモデルにおいては距離の指数として2が指定されているが、仮説検定の結果この値を用いることは棄却された。

ハフモデルについて詳しくはRetail Trade Area Analysis Using the Huff Model - Articlesをご覧ください。

2008-04-25

イスラム金融

イスラム金融の概要
S&P/TOPIX150シャリア指数、構成銘柄リスト
東証 : 株価指数ラインナップ
S&P 及び（株）東京証券取引所、イスラム投資家向けの日本株指数を算出開始
Dow Jones Indexes

2007-12-04

ゲーム論的確率論と数理ファイナンス

無リスク金利で運用する場合、単利より複利の方が増えるのですが、リスク資産へ投資する場合、一般的に評価に使われる期待値、つまり相加平均よりも複利に相当する相乗平均の方が小さく、さらにレバレッジをかけてリターンのばらつきが大きくなると相加平均と相乗平均のの差が大きくなりますのでリターンが小さくなることがあります。

例えば、ある年の運用成績が+12.5%、翌年が-10%だったとき、複利計算では1.125*0.9=1.0125で+1.25%ですが、では儲かるからとレバレッジをかけてみると、
2倍のレバレッジをかけていれば+25%と-20%で1.25*0.8=1で0%ですし、
3倍のレバレッジをかけていれば+37.5%と-30%で1.375*0.7=0.9499で-5%です。

そこで、リターンの分布に応じて、複利での運用成績を最大にするレバレッジを求めようという考え方がoptimal-fやKelly基準で、ゲーム論的確率論では最適解は次の同値な3つ問題として定められます。
・相乗平均の最大化
・リターンの対数の平均の最大化
・効用関数が対数関数である場合の効用の最大化
上記例では、1倍のレバレッジ、つまり+12.5%と-10%が最適です。

私が把握している注意すべき点は2つあります。

この方法で得られたレバレッジは言わば合理的な範囲での上限であり、
これよりレバレッジが低いとリターンも下がりリスクも下がりますが、
これよりレバレッジが高いとリターンも下がりリスクは上がります。
これが私が一番興味を持っている部分ですが、
実際の運用では将来のリターンの分布は未知であり過去のデータから推測する必要がありますし、
またギャンブルのように好きな回数だけ試行できるわけではありません。従って
- 過去のリターンと、リターンの確率分布との差
- リターンの確率分布と、将来に実際に得られるリターンの分布の差
を考慮する必要があります。
1.のようにレバレッジが高すぎる場合のほうが問題が大きいので、この差のために低めにすべきだと思いますが、具体的にどう計算してどれくらい小さくすれば良いのかということに興味があります。
数値的にはブートストラップで求められると思いますが、その場合の破産確率などを理論的に評価出来ればと思います。

運用以外での応用としては、対数効用関数を考えることで保険の合理性の話につながるかなと思います。一般的な期待値ですと加入者の損が保険会社の利益ですが、対数効用関数だと両者にとって利益になるということです。

2007-04-28

「複利効果」VS「相加平均≧相乗平均」

毎回一定の額を賭けるか、前回までの損益も含めて賭けるか、については、複利の面では前回までの損益も含めて賭けた方が有利ですが相加平均≧相乗平均の関係からは毎回一定の額を賭けた方が良いです。
100円を単純に2回賭けたとして

場合1:2回とも20%勝ったなら: 毎回一定額:最初賭けた100円が120円に増え、次も100円が120円に増え、プラス40円。
前回までの損益も賭ける:100円が120円に、120円が144円に増え、プラス44円。
この場合は複利が効くので前回までの損益も賭ける方が良いです。
場合2:1回は20%、もう一回は40%勝ったなら: 毎回一定額:最初賭けた100円が120円に増え、次は100円が140円に増え、プラス60円。
一回あたりの平均は、{(1+0.2)+(1+0.4)}/2=1.3、つまり30%の儲け。
前回までの損益も賭ける:100×(1+0.2)×(1+0.4)=168なのでプラス68円。
一回あたりの平均は、√{(1+0.2)×(1+0.4)}=1.296、つまり29.6%の儲け。
一回あたりに直すと前回までの損益も賭ける方が少し負けますが、複利効果のおかげで勝ちます。
場合3:1回は40%の勝ち、もう一回は10%の負けなら: 毎回一定額:最初賭けた100円が140円に増え、次は100円が90円に減り、プラス30円。
一回あたりの平均は、{(1+0.4)+(1-0.1)}/2=1.15、つまり15%の儲け。
前回までの損益も賭ける:100×(1+0.4)×(1-0.1)=126なのでプラス26円。
一回あたりの平均は、√{(1+0.4)×(1-0.1)}=1.122、つまり12.2%の儲け。
一回あたりに直すと前回までの損益も賭ける方の負け方が大きいので、複利効果を使っても毎回一定額に追いつきません。
場合4:1回は40%の勝ち、もう一回は30%の負けなら: 毎回一定額:最初賭けた100円が140円に増え、次は100円が70円に減り、プラス10円。
一回あたりの平均は、{(1+0.4)+(1-0.3)}/2=1.05、つまり5%の儲け。
前回までの損益も賭ける:100×(1+0.4)×(1-0.3)=98なのでマイナス2円。
一回あたりの平均は、√{(1+0.4)×(1-0.3)}=0.99、つまり1%の損。

つまり、毎回勝てるのなら前回までの損益も賭けて複利効果を活かした方が良いですが、負けることも考えると、相加平均≧相乗平均の関係によって毎回一定額賭けた方が良いです。
まとめると

まず期待リターンは正であることが絶対条件。上の4つの場合すべて、1回目と2回目の確率が五分五分なら期待リターンは正です。
毎回一定額、つまり所持金の等分割投資で期待リターンに近い実現リターン(正のリターン)を得る確率を高める。
そうやって正のリターンを得る確率を高めて(場合1,2のように)から、複利を活かすために前回までの損益も含めて賭ける。

のが良いと思われます。
少なくとも複利を活かそうと前回までの損益も賭けて、場合4のように損するのは避けたいです。
この場合、単純に掛け金を半分にすれば、1回は20%の勝ち、もう一回は15%の負けなので前回までの損益も賭ける事にしても100×(1+0.2)×(1-0.15)=102、つまりプラス2円となり先ほどのようにマイナスにはなりません。
すなわち、場合4で前回までの損益も賭けるのは、折角期待リターンが正なのに賭けすぎのために実現リターンがマイナスになることを表しています。

2007-04-26

目的関数

先日のOptimal-fに関して、別の何かを意図して書いたのですか、との質問がありました。
が、残念ながら別の意図はありません。ただ、そう見えた理由は、

目的が定まっていれば数学的に最適解を導くことが出来る。
しかし、どれを目的とするかの選択は人それぞれであり、数学的に唯一解が存在するわけではない。

ということが、Optimal-fに限らず多くの場面で共通することだからなのか、と思いました。

さてKelly基準の問題点の続きです。10回の賭けでは、4勝6敗も珍しくありません。100回賭けるのなら40勝60敗、あるいはそれ以上負ける確率は低いのですが、Kelly基準では「10回の賭けでは、4勝6敗のことも警戒すべき」ということが反映されません。

10回賭けて10連敗、あるいは1勝9敗は確率的に1%くらいしかないので諦めるとしても、せめて2勝8敗くらいは想定しておくべきだと思います。ところが2勝8敗ではどんな賭け方をしても損します。つまり、10回しか賭けられないならこの賭けはやるべきではありません。
これが100回賭けるとなるとぐっと楽になって、37勝以下の確率が0.6%ですので、38勝62敗程度を想定しておけば充分です。
(1-f)^62*(1+2f)^38を最大にするfは約0.07、つまり100回賭けるなら毎回所持金の7%を賭けておけば、少々運が悪くても充分儲かります。
さらに1000回賭けるとなると、462勝以下の確率が0.8%ですので、463勝537敗を想定して19.5%を賭ければ良いということになりますが、そんなことをすると所持金が4,248,545,514,478,450倍になってしまい、それはそれで現実的ではありません(笑)

このように、賭ける回数が少ない場合は、運悪く負けが込む事を考えてKelly基準より賭ける割合を下げる必要があり、下げる度合いは賭ける回数の少なさに依ります。あるいは、上記計算例では1%の確率を運が無いとして諦めることにしましたが、5%を諦めることにすればもう少し沢山、とは言ってもKelly基準の25%よりは少ないですが、を賭ける事が出来ます。
Kelly基準とは、自分の幸運はアテにしないとしても、自分には不運は起こらないことをアテにしているという意味で非常に心許ない基準です。

2007-04-14

Optimal-f

勝率5割、勝てば掛け金に加えてその2倍が戻ってくる、一方負けると掛け金没収というゲームを考えます。例えば100円持っているときに全額賭けると、勝てば所持金は300円になり、負けると0円になります。

さて、所持金のうちどれくらい賭ければよいでしょうか?所持金に対する掛け金の割合をfとして(0≦f≦1)、fを求めましょう。

解1: f賭けたときに戻ってくる金額の期待値は、3f/2+0/2=1.5f。期待値で考えると有利な賭けなので全額賭ける。つまりf=1。
確かに賭けるたびに期待値は1.5倍になります。勝った時に所持金3倍、勝つ確率1/2ですから。しかし、例えば10回賭けた後の所持金の確率分布が
3¹⁰=59049倍になる確率は1/2¹⁰=1/1024、その他の場合は所持金なし。期待値は1.5¹⁰
となります。折角有利な賭けなのに、大半の場合所持金なし、というのは勿体無いです。
解2: f賭けると、勝った時の所持金は1+2f倍に、負けたときの所持金は1-f倍になります。それぞれ確率1/2ですので、2回賭けて一回勝ち、一回負けになった場合を考えると所持金は(1+2f)(1-f)倍になりますから、これが最大になるfを求めるとf=1/4となります。このように、発生確率と同じ比率で事象が起きた場合に所持金が最大になるfが狭義のOptimal-f、あるいはKelly基準です。
たった2回では2連勝、2連敗になる確率も高いですが、例えば100回なら50勝50敗から大きく外れる確率は小さいです。50勝50敗の場合は(1+2f)⁵⁰(1-f)⁵⁰={(1+2f)(1-f)}⁵⁰の中括弧の中を最大にする、というのがKelly基準の考え方です。
解3: Kelly基準は一般に賭けすぎと言われます。それは、回数が少ない場合は、勝ち数、負け数の比率が発生確率と大きく異なることも珍しくなく、特に負けが多くなったときの損が大きくなるからです。
よって、連続して賭けた時の所持金の確率分布を求め、その期待値だけを見たのでは解1と同じになりますので、期待値より下にぶれた値、例えば期待値－1×標準偏差が最大になるfを採用する、と考えます。
期待値は賭ける回数のべき乗で、標準偏差は賭ける回数の平方根のべき乗で増えますから、賭ける回数が少ない場合は標準偏差を引いてもなお大きな値になるためにはfを小さくする必要があり、賭ける回数に応じた最適なfを見つけることが出来ます。
但し実際には畳み込みの計算が大変なので、様々なfに対してモンテカルロ・シミュレーションを行ってfを探すことになります。

このように、最適なfの値を探すのは容易ではないのですが、もしも賭けを平行して同時にいくつも出来るのならば、fを探すことなく解1の期待値1.5倍を得ることが出来ます。
100の賭けが平行して行われているとしましょう。100円の所持金を1円ずつ100個の賭けに投じるのです。するとおそらく50前後は勝って3円に、残りは負けて0円になりますので、所持金は高い確率で150円前後になります。勝った3円をそのままもう一度賭けようとすると50しか賭けが出来ませんので、負けたところにも再配分して、2円を賭けるものと、1円を賭けるもの、あわせて今回も100賭けます。これを繰り返すことで、解1と同様の期待値を得ながら、0円になる確率を大幅に引き下げることが出来ます。当然ながら59049倍になる確率も殆どゼロですが。

これも実際には100もの賭けを同時に行うことは出来ないので、10円ずつ10の賭けを行うことにすると、今度は150円以外にも120円とか180円になる確率もそれなりに高くなります。ここで解2や解3の方法で最適なfを決めるのですが、元々充分に分割してかけていた場合はf=1が最適になることが多いです。

結局のところ、Optimal-fの考え方は、fの値を求めることそのものよりも、

有利な賭けだからといって必ずしもf=1が良いとは限らない。最適なfはもっと小さい場合がある。
賭けを分散することにより、期待値に近い結果を得ることが出来る。

ことを教えてくれるという意味で有益だと思います。

2007-02-20

グーグルのL・ペイジ氏：「科学者はもっと自分の研究の宣伝活動を」

http://japan.cnet.com/news/media/story/0,2000056023,20343305,00.htm

2006-12-26

2地点の緯度、経度から距離を求める

球面三角法とその角度
これらを使って2地点の緯度、経度から間の角度を求めることが出来ます。
但し、地球は完全な球ではなく楕円球なので補正が必要になります。

間の角度をラジアンで求めたら、それに地球の半径をかけて距離を求めることが出来ます。

手っ取り早く求めるには
http://www2.neweb.ne.jp/wd/nobuaki/New_Homepage/okinawa703.htm
http://oshiete.eibi.co.jp/kotaeru.php3?q=249931
http://www1.ths.titech.ac.jp/club/sci_club/astronomy/ISSP/Cal/HENKAN.html
あたりが参考になりそう。

2006-12-05

商圏分析

岡山県の平成16年度商業統計調査確報
第３表　小売業　市町村別　売場面積規模別事業所数・従事者数・年間商品販売額・売場面積
ここにExcel形式で置いてある。
データは
(財)統計情報研究開発センター(Sinfonica)から入手。

昨日は来年度のゼミ生が、現在のゼミを見学。
希望は地理データ、数理統計。一人は就活で欠席。

夜は並列計算の使い方。
Cross Validationやbootstrapのように、互いに依存関係の無い計算を多数回繰り返すときに、それぞれの計算機に分けて計算させて、最後に集計させるようにすれば良い。

2006-12-03

インターネット・マーケティング

来年のゼミ生の中に、マーケティングに興味があるという学生さんが居たので、参考になるかも。
Googleアドセンス情報日本語非公式版のインターネット・マーケティングのおすすめ資料
THE Google Adsense

2006-12-02

論文の戻し

某誌に投稿していた某論文がone “Accept after minor revision” and two “Reconsider after major revision”で戻ってきました。reviseせねば。

登録: 投稿 (Atom)