ウィキペディアによると仮説検定は、 統計学的仮説検定や検定法とも呼ばれており、 想定される仮説を挙げて、統計学的観点から正しいか否かを判断する手法だそうです。 インターネットでこの仮説検定を調べて、 この場で説明しようと思いましたが、かなり難しい作業であるという結論に至りました。
なんとなくわかったような気になるのが次の例です。
すべてのカラスが黒いことを証明するのは、事実上不可能であるが、 すべてのカラスが黒くないことを証明するのは、1匹の黒くないカラスを見つければよい。
このように、仮説を証明することは難しくても、仮説の否定形は容易に証明できることがあります。 また、世界中で捕獲されたカラスに黒以外のカラスはいないといった形で、 統計学的に正しいと考えられる場合もあります。
つまり、仮説を検証可能な仮説に置き換えて、正しくない仮説を検証しながら排除し、 正しい仮説を絞り込んで導き出す方法のようです。 ただ、言葉で説明してもわかりにくいので1つ例を取り上げてみます。
今、異常が発生するクライアント/サーバ型のシステムがあったとします。 原因として、クライアント、ネットワーク、サーバの欠陥が考えられます。
仮説1:特定のクライアントに欠陥がある
①検証可能な仮説:特定のクライアントの欠陥があれば、他のクライアントで異常は発生しない
仮説2:ネットワークに欠陥がある
②検証可能な仮説:ネットワークに欠陥があれば、他のクライアント/サーバ型のプログラムでも異常が発生する
仮説3:サーバに欠陥がある
③検証可能な仮説:サーバに欠陥がないならば、一定の条件を満たすクライアントでしか異常が発生しない
仮に複数のクライアントで異常が発生した場合、①の仮説は否定され、結果的に仮説1は正しくないことになります。
また、他のクライアント/サーバ型のプログラムが正常に作動した場合、 統計学的観点から②を否定することができ、結果として仮説2は正しくないことになります。
もし、③を証明することができなければ、仮説3が正しくないと主張することはできず、 仮説3は恐らく正しいと結論付けることができます。 以下は、サービスオペレーションの記述です。
この手法は、経験に基づく推測に基づいて考えられる根本原因のリストを作り、 各仮説の真偽を判断するために使用することができる。 経験に基づく推測は、 問題の可変要素または潜在的な根本原因の間の関係に関連していることがある。 インシデントから集めた情報および他の運用情報を使用して、 調査対象のインシデントの根底にある潜在的な原因のリストをブレインストーミングするためにチームが作られる。 次に、それぞれの原因は検定可能な記述または仮説へと変換され、 1人または複数のサポート・スタッフに割り当てられる。 次に、割り当てられた記述ごとに必要に応じて追加のデータが集められ、 各仮説を受け入れるか却下するために適切な分析が実行される。 (サービスオペレーション P100)
次回は、2013/12/25の予定です。