run test - 連検定
- 数列の並び方の無作為規則性=無規則性・偶然性の検証を行う検定法
- 2値データを用いて検定する
- 2値以外のデータは、基準値未満と以上とで2値に変換
- 基準値には中央値が用いられることが多い
- 無作為であれば、理論的には中央値以上の値Aも、中央値未満の値Bも1/2の確率でサンプリングされるはず。
- AもBも連続しすぎるのも、入れ替わりすぎるのもおかしい。
- よって、AやBが連続する程度に着目することで、無作為性を検証する。
具体的な手法
Section titled “具体的な手法”- AまたはBの一続きのまとまりを連(run)といい、その連に含まれる記号の個数を連の長さと言う。
- A・Bが連続しすぎると、連の長さが長くなり、連の数が少なくなる。
- 逆に入れ替わりすぎると連の長さが短くなり、連の数が多くなる。
- よって、「AやBが連続する程度」は、連の数によって捉えることができる。
帰無仮説 : 「AとBの並び方は無作為である」 対立仮説 : 「AとBの並び方は無作為ではない」
記号の数を , Aの数を, Bの数を, 連の数をとする。
例 : 以下の場合、, , となる。
AAA BB AA BBB AAAAA BBB A B AA帰無仮説のもとでnが十分に大きい場合、は平均値, 分散の正規分布に従う。 したがって、確率変数を用いて検定を行うことができる。
帰無仮説「AとBの並び方は無作為である」に対して、検定を行い、その結果が有意でなかったとする。すなわち、帰無仮説「AとBの並び方は無作為である」が正しい時に誤って棄却してします確率が低かった (p値が有意水準よりも小さかった) とする。この場合、立てた帰無仮説は棄却されず、無作為であったと言うことができる。