背景のきれいな某アニメ番組が今日は校内のシーンしかないようなので寝る。 ベッドに横になるが、朝方明らかに空気が熱くなっているので床に移行。 腰の骨盤がゴツゴツして痛いが暑いよりはましだ。

9:30 に起床。朝飯は納豆とおにぎり。スッキリなどを視聴する。 区役所経由で言問橋バス停へ。八広へ向かう。八広公園で水浴び。ワイシャツをしばらく脱ぐ。

八広図書館に到着し、新聞を読んでからワイシャツを着直す。 11:50 着卓。メールなし。いつものようにダラダラしていると、あやしいファイルのコレクションを忘れる。

14:05 ビッグエー墨田八広店。145 円。

  • ハムマヨパン
  • コッペパンジャム&マーガリン

店を出たらバス停の前に人が待っているので、食うのを後回しにしてバスを待つ。すぐに来る。 押上駅前直前ですごい渋滞が発生していて難儀する。バス内もわりと混んでいる。

柳島児童遊園を経由して横川コミュニティー会館図書室ビルの前の影でおやつ休憩。 図書室では教科書を読むが、きのうの日記見出しのように相変わらず $\chi^2$ 検定?の導出がわからない。 公式だけ頭に叩き込んで計算問題を解けるようになればいいというのは絶対に避けたい。

諦めて横川三丁目バス停に移動。というか、バス停に着く前にバスが着いた。いいタイミングだ。 終点の錦糸町駅前まで移動し、ハローワーク墨田へ。ほとんど時間がない。 お盆でも求人が増えていることを確認して離脱。

西日の錦糸町を徒歩で移動してオリナスへ。

タイトー F ステーションオリナス錦糸町店で 6 クレ遊ぶ。 ビートマニアは STANDARD をプレイして、たまった未プレイレベル 10 の曲にクリアランプを点灯しておく。

MJ プロ卓東風戦。裏で幻球乱舞をやっているが金のかかる半荘戦なのでパス。 とにかく着順分布をましにしたい。

【SCORE】
合計SCORE:-19.7

【最終段位】
四人打ち段位:鬼神 幻球:8

【8/14の最新8試合の履歴】
1st|*-------
2nd|----*-**
3rd|-***----
4th|-----*--
old         new

【順位】
1位回数:2(18.18%)
2位回数:3(27.27%)
3位回数:4(36.36%)
4位回数:2(18.18%)
平均順位:2.55

プレイ局数:50局

【打ち筋】
アガリ率:20.00%(10/50)
平均アガリ翻:3.40翻
平均アガリ巡目:11.50巡
振込み率:4.00%(2/50)

【8/14の最高役】
最高役のデータがありません。最高役は、跳満以上のアガリが対象となります。

19:40 カスミオリナス錦糸町店。300 円。彩りチキン南蛮弁。 もう少し待てばさらに値下げしてくれるが。

20:10 ビッグエー墨田業平店。227 円。

  • シュークリーム
  • ふっくらおむすびツナ
  • 大きなおむすびツナマヨ

ダラダラ歩いて向島の部屋に戻る。向島に来ると暑いのはたぶん道路が東西に伸びていて西日の当たる時間が長いからだと思う。 日が沈んでからもほんとうに暑い。シャワーを浴びて晩飯にする。

多項分布の極限ノートをやっているうちに心配になってくる。そもそも $X$ の分母が合っていない気がする。 $p_iN$ か $N$ かで話が違ってくる。今晩も保留だ。

地獄。レベル 82 に到達。

Math Notes

今日のは陳述しか理解していない。


多項分布の極限。昨日の記号を用いる。 母集団から無作為抽出したサイズ $N$ の標本の観測度数 $x_i$ の確率分布 $f(x_1, \dotsc, x_n)$ は多項分布の理論により次で与えられる:

\[f(x_1, \dotsc, x_n) = \frac{N!}{x_1! \dotsm x_n!}p_1^{x_1}\dotsm p_n^{x_n}.\]

命題:$N$ が十分大きいとき、この確率分布から

\[X \coloneqq \sum_{i = 1}^n \frac{(x_i - p_iN)^2}{p_i N}\]

をとると、この確率変数は自由度 $n - 1$ の $\chi^2$ 分布に従う。


これの証明が埋められなくて困っている。アウトラインは次のようなものだ:

\[t_i \coloneqq \frac{x_i - p_iN}{\sqrt{N} }\]

とおく。つまり $X = t_1^2/p_1 + \dotsb + t_n^2/p_n.$ $N$ が十分大きいときに $t_1, \dotsc, t_n$ の従う確率分布 $g(t_1, \dotsc, t_n)$ は次のようになる:

\[\begin{aligned} g(t_1, \dotsc, t_n) &= \frac{1}{(2\pi)^{(n - 1)/2} }\cdot \frac{1}{(p_1 \dotsm p_n)^{1/2} } \exp\!\left(-\frac{1}{2}\sum_{i = 1}^n\frac{t_i^2}{p_i}\right)\\ &= \sqrt{2\pi}\prod_{i = 1}^n N(0, p_i; t_i). \end{aligned}\]

このことを示す方法がまずわからない。数学的帰納法を採用したいのでまず $n = 2$ のときから示すのだろう。 自由度の主張から $2$ が帰納法のベースとなる。

$n = 2:$

\[\begin{aligned} f(x_1, x_2) &= \frac{N!}{x_1! x_2!}p_1^{x_1} p_2^{x_2}\\ &= \frac{N!}{x_1!(1 - x_1)!}p_1^{x_1}(1 - p_1)^{N - x_1}. \end{aligned}\]

これは二項分布 $\operatorname{Bin}(N, p_1)$ の確率密度関数である。 $N$ が十分大きいときは

\[t_1 \coloneqq \frac{x_1 - p_1N}{\sqrt{p_1(1 - p_1)N} }\]

は正規分布 $N(0, 1)$ で近似できる。$N$ の記号がカブっている。

\[\begin{aligned} g(t_1) = f(x_1) &\approx \frac{1}{\sqrt{2\pi} }\exp\left(-\frac{t_1^2}{2}\right). \end{aligned}\]

$N(0, 1)$ に従う $t_1; T_1$ を自乗した確率変数 $z; Z$ は $\chi^2$ 分布の節の冒頭で見たように

\[T_1(z) = \frac{1}{\sqrt{2\pi}}z^{-1/2}\mathrm{e}^{-z/2}\]

つまり自由度 $1$ の $\chi^2$ 分布の確率密度関数となる。

この確率分布は正規分布の積の形をしているので、$\chi^2$ 分布の節の冒頭と同様にして

\[\sum_{i = 1}^n\frac{t_i^2}{p_i} = \sum_{i = 1}^n \frac{(x_i - p_iN)^2}{p_i N} = X\]

が自由度 $n - 1$ の $\chi^2$ 分布に従うことが示される。 自由度が $1$ 小さいのは $x_1 + \dotsm + x_n = N$ という制約による。


実用的には $p_iN \ge 5$ のときにこの近似が使える。


以上。