髭アーカイブの大桟橋を聴いて気持ちを落ち着ける。日付が変わってすぐに寝る。涼しいのでベッドで。

朝方相変わらず気分が優れなくて寝たり起きたりを繰り返す。洗濯物をセットして干す作業がてら起き上がったのが 9:10 とか。

ワイドショーを傍目に朝飯。おにぎりは普通のサイズでいいかもしれない。食欲がとにかくない。 服が乾くのを待ちながら座って休む。何もかも面倒くさい。

10:25 服を着て外出。とりあえず福祉事務所に確認したいことがあるので移動する。 区役所はトイレも水もあって居心地が良い。とにかく窓口で担当職員の面会を申し出る。 すると本日は一日中職務外出しているとのことで、私の質問に回答できない状態だとのこと。諦めて後にする。

11:05 向島の部屋に戻る。今日やろうとしていたことが白紙になったので呆然とするやら気が楽になるやら。 PC 作業を少しやる。テザリングを覚えたのでここで Twitter を見られる。いや、携帯電話で見ればいいのだが操作が難しいから。

スカイツリータウンの書店で雑誌チェックをしたあと、横川コミュニティー会館図書室へ移動。朝刊と教科書を読む。 四ツ目通りに出たらちょうどバスが走り去っていくという間の悪さ。徒歩で錦糸町へ移動。

14:20 西友錦糸町店。153 円。

  • 枝豆パン
  • 牛乳パン

例のエクセルシオールカフェ前の植え込みで立ち食い。いつもだったらこのあとはハローワーク行きなのだが。 アルカキット錦糸町に入り、くまざわ書店で時間を潰す。北野武名義の理系ヤクザという小説が明らかによく出来ていて驚いた。

ヤマダ電機経由でタイトー F ステーションオリナス錦糸町店に移動。月曜の夕方にしては混雑している。 MJ がなかなか空かないのでビートマニアを 2 ゲームやってしまう。 しかも、そのあとの MJ も出来が悪くて粘ってしまう。気が沈んでいてもビデオゲームはなぜか遊べるのだ。

【SCORE】
合計SCORE:-165.3

【最終段位】
四人打ち段位:鬼神 幻球:5

【8/24の最新8試合の履歴】
1st|--*---*-
2nd|----*---
3rd|-*------
4th|*--*-*-*
old         new

【順位】
1位回数:2(16.67%)
2位回数:3(25.00%)
3位回数:1(8.33%)
4位回数:6(50.00%)
平均順位:2.92

プレイ局数:57局

【打ち筋】
アガリ率:12.28%(7/57)
平均アガリ翻:3.43翻
平均アガリ巡目:10.29巡
振込み率:19.30%(11/57)

【8/24の最高役】
最高役のデータがありません。最高役は、跳満以上のアガリが対象となります。

20:20 カスミオリナス錦糸町店。205 円。チャーシュー炒飯。これなら食欲がなくても食える。

20:45 ビッグエー墨田業平店。159 円。

  • シュークリーム
  • 大きなおむすび梅おかか

比較的涼しい道を歩いて向島の部屋に戻る。シャワーを浴びて 21:10 晩飯とする。 PC 作業。今日は数学ノートができるか。

22:20 ノート終わり。やはり理論がないとただの計算問題になる。受験生ではないのだから。

22:45 テザリング終わり。携帯電話に某社からのメッセージが届いている。 そうか、電話番号がわかっていればこういう形式の伝言も来るのか。 髭アーカイブを聴きながら麻雀の練習をして寝る。

Math Notes

薩摩順吉著『確率・統計』検定のあたり。


相関なしの検定。フィッティングを施した $x, y$ についての標本が二次元正規分布に従っている母集団から無作為抽出したものと考えられるとき、 標本相関係数をもとにして母集団の母相関係数についての推定・検定を行うことができる。

このトピックは結論しか書いていないので、証明を示さないといけない。


${\rho_{xy} = 0}$ のときには $X, Y$ が独立に一次元正規分布に従うことになるので、 ${\rho_{xy} = 0}$ の二次元正規分布に従う母集団からサイズ $n$ の標本 ${(x_1, y_1), \dotsc, (x_n, y_n)}$ を無作為に抽出したときに、標本相関係数 $C_{xy}$ は確率密度が

\[f(C_{xy}) = \frac{1}{\sqrt{\pi}}\cdot\frac{\varGamma((n - 1) / 2)}{\varGamma((n - 2) / 2)}(1 - C_{xy}{}^2)^{(n - 4) / 2}\]

の分布に従う。そして

\[T \coloneqq \sqrt{\frac{(n - 2)C_{xy}{}^2}{1 - C_{xy}{}^2}}\]

とおくと、これは自由度 ${n - 2}$ の $t$ 分布に従う。

これを使うときは、帰無仮説 $H_0$ 「${\rho_{xy} = 0}$」とおき、検定の結果棄却して $X$ と $Y$ の間に相関があると主張したい。


${\rho_{xy} \ne 0}$ のときにはこのような厳密なことは言えない。 しかし ${n \gg 1}$ のときには

\[Z \coloneqq \tanh^{-1}C_{xy} = \frac{1}{2}\log\frac{1 + C_{xy}}{1 - C_{xy}}\]

とおくと、近似的に ${N\left(\tanh^{-1}\rho_{xy},:\dfrac{1}{n - 3}\right)}$ に従う。 その結果

\[\xi \coloneqq \tanh^{-1}\rho_{xy} = \frac{1}{2}\log\frac{1 + \rho_{xy}}{1 - \rho_{xy}}\]

とおくと、

\[T \coloneqq \sqrt{n - 3}(Z - \xi)\]

は $N(0, 1)$ に従う。


例題:ある大学で学生を $20$ 名無作為に抽出し、座高と身長を測定した。 その結果、標本相関係数は $0.45$ であった。母集団を学生全体とする。 座高と身長の間に相関があるか。危険率 $5\%$ と $1\%$ で検定しろ。

解:上で述べたように $H_0$ を「${\rho_{xy} = 0}$」とおき、両側検定をする。

>>> from math import sqrt
>>> n, Cxy = 20, 0.45
>>> T = sqrt((n - 2) * Cxy**2 / (1 - Cxy**2)); T
2.137880472655219
>>> from scipy.stats import t
>>> t(n - 2).isf(0.05 / 2)
2.10092204024096
>>> t(n - 2).isf(0.01 / 2)
2.8784404727135864

${T = 2.1378… \gt 2.100…}$ であるから、危険率 $5\%$ では棄却域にある。 ゆえに $H_0$ は棄却され、$\rho_{xy} = 0$ であるとは言えない。相関がある。 $\Box$

${T = 2.1378… \lt 2.878…}$ であるから、危険率 $1\%$ では採択域にある。 ゆえに $H_0$ は棄却されず、$\rho_{xy} = 0$ でないとは言えない。 $\blacksquare$


例題:学生 $100$ 名を無作為に抽出し、体重と胸囲を測定した。 標本相関係数は $0.87$ であった。母相関係数を信頼水準 $95\%$ で推定しろ。

解:上で述べた公式により ${Z = \dfrac{1}{2}\log\dfrac{1 + C_{xy}}{1 - C_{xy} } }$ は ${N(\tanh^{-1}\rho_{xy}, 1/(n - 3))}$ に従う。

${T \coloneqq \sqrt{n - 3}(Z - \xi)}$ は ${N(0, 1)}$ に従う。

>>> n, Cxy = 100, 0.87
>>> from math import log
>>> Z = log((1 + Cxy) / (1 - Cxy))/2; Z
1.333079629696525
>>> from scipy.stats import norm
>>> lo, hi = norm.interval(0.95); lo, hi
(-1.959963984540054, 1.959963984540054)

$T = \sqrt{97}(Z - \xi)$ がこの区間に入るというので

\[Z - \frac{Hi}{\sqrt{97}} \lt \xi \lt Z - \frac{Lo}{\sqrt{97}}.\]
>>> Z - lo / sqrt(97)
1.5320838212468002 # Out[15]
>>> Z - hi / sqrt(97)
1.13407543814625 # Out[16]

${\tanh^{-1}\rho_{xy} = \xi}$ であるから:

>>> from numpy import tanh
>>> tanh(Out[16])
0.8124094689717217
>>> tanh(Out[15])
0.9107805163437511

ゆえに ${0.812… \lt \rho_{xy} \lt 0.9107…}\quad\blacksquare$


以上