ベイズ統計始めました
思い切ってベイズ統計の勉強を始めてみた。
IT関連に携わっているのでよくこんなことを耳にする。
- 結局この新しい機能っていいの?悪いの?
- それとこれどっちの方がいいのかな?
そんなときよくやるのがユーザーの動き(例えばそのボタンをクリックしてくれたのか、とか)を見て、その平均値や割合を比較するというものだ。
まぁ自分もそういったことをずっとやってきていたわけだが、途中からある疑問が頭をよぎるようになった。それは、
この平均値ってどれくらい差があれば本当に差があるって言えるのか...?
ということ。
例えば、一日あたり1,000人訪れてくれるサイトで一人あたりの売上が10,000円 / 日だったとしよう。それが「10,100円に増えました!」って言われても「それ誤差じゃね?」ってなるけど、「20,000円に増えました!」って言われると増えた気がする。じゃあ12,000円だとどうなのってなるし、最終的にはどこまで増えれば増えたって上司に言えばいいの?ってなる。(やっぱ誤差でしたってなると最終的にボコされるのは自分だしそれは嫌だ)
その時簡単に勉強したのが有意差とかp値とかが出てくるまぁ普通の統計学。(推計統計学って言うらしい。知らんけど。)それもそれで個人的には使えたのだが、人に説明するのが難しい。
よく「有意差5%」なんて言葉が出てくるのだが、これって正確には5%の確率で外しているって意味ではないんだよね。(確か)まぁ結果的には同じことなんだろうけど実際はそうではないらしい。
でもベイズ統計ではそれが可能みたい。つまりベイズ統計を使って解釈すれば「xx%の確率でこっちの方がいい」とかそういう説明が可能になるみたいなのだ。というわけでベイズ統計の勉強を始めてみた。