Python学習チャンネル by PyQ

Pythonのオンライン学習プラットフォームPyQのオフィシャルブログです

仮説検定のパートのとりやめについて

こんにちは。PyQチームのtsutomuです。

2019年8月28日より、「Python統計分析」ランクの「仮説検定」のパートを取りやめます。 2019年8月28日のリリースでコースから削除され、クエスト本体は、翌リリースまで保持された後削除されます。

f:id:nana_yu:20190826120951p:plain

本記事では、「Python統計分析」ランクの「仮説検定」のパートのとりやめの理由についてご説明します。

仮説検定は独特な手法のため、好ましくないと考える人もいます。

私はクエストを作成したことで、仮説検定の理解が深まり少し好きになりました。しかし、よくよく考えると、仮説検定は以下の理由により好ましくない手法であると考えるようになりました。好ましくない手法を紹介するのはPyQの利用者にとっても良くないので、パートをとりやめることにしました。

仮説検定の好ましくない理由

  • バイアスがかかりやすく、正しく利用するのが難しい
  • 片側検定という正しくない手順*1が使われている。

これらの理由を順番にご説明します。しかし、難しい概念を含んでいるため、理解できなくても問題はありません。 仮説検定が対象にする命題は、確定的に言えず確率的にしか言えないことが多いです。そのため、たいていの場合は正しい結論でも、多少は間違った結論になることを許容するという方法をとります。 具体的には、以下の手順になります。

仮説検定の手順

  1. 有意水準αを決めます。有意水準は間違ってもしょうがないとみなす確率で、5%や1%がよく使われます。
  2. 主張したい内容を対立仮説とします。ここでは分散が既知の正規分布に従う確率変数Xの「平均μが0でない」とします。
  3. 対立仮説の否定を帰無仮説とします。分布の未知のパラメーターは、μだけなので、ここでは「μ=0」になります。
  4. 帰無仮説を仮定します。そうすると、確率変数Xの分布(確率密度関数)が決まります。ここで、分布の中で面積がαになる領域を予め決めます。この領域が棄却域になります(値を観測する前に決めないといけません)。

上記を踏まえて、「観測値が棄却域に入った」ならば、「分布が正しくない」または「分布は正しいが、有意水準の確率で棄却域に入った」ことが言えます。

  1. 仮説検定では、有意水準の確率で間違っても良いとするので、「観測値が棄却域に入った」ならば、「分布が正しくない」とし、帰無仮説を棄却します。
  2. 帰無仮説を棄却した場合は、対立仮説を採用します。
  3. 「観測値が棄却域に入らない」場合は、帰無仮説も対立仮説もどちらも採用しません。

仮説検定に「バイアスがかかりやすく、正しく利用するのが難しい」具体例

仮説検定の手順に沿って、仮説検定が「バイアスがかかりやすく、正しく利用するのが難しい」例を紹介します。

前項最後の「帰無仮説も対立仮説もどちらも採用しない」にあたる例を説明します。

犯人探しで仮説検定を使うことは少ないでしょうが、例として以下を考えます。

帰無仮説を「あなたが、宝石を盗んだ」とします。少し変ですが棄却域を「盗まれた時刻にアリバイがある」としましょう。

アリバイがあれば、対立仮説「あなたは、宝石を盗んでない」が言えます。では、アリバイがない場合は、どうなるでしょうか?

アリバイがなくても、「盗んだ」か「盗んでない」かはどちらも言えません(状況証拠にはなりますが)。 仮説検定でも、棄却域に入らない場合は、何も主張できません。

仮説検定では、利用すると決めたら、手順にしたがって必ずその結論(「何も主張できない」を含む)を述べないといけません

たとえば、帰無仮説(「あなたが、宝石を盗んだ」)が真実だとしましょう。

有意水準5%で検討したあなたは、95%は「何も主張できません」。 しかし、「何も主張できない」ことを結論としにくいあなたは、その95%を「検討しなかった」ことにしたとします。

そうすると、5%は真実ではない対立仮説(「あなたは、宝石を盗んでない」)を主張できます。 しかし、主張しているのは5%ですから、「主張した回数を分母とする」と、100%の割合で真実ではないことを主張しています。

これは有意水準を1にしているのと同じです。「主張できなかったから、仮説検定をやめよう」というのは、強力な誘惑になります。

このような理由で、仮説検定は「バイアスがかかりやすく、正しく利用するのが難しい」です。

片側検定について

棄却域は、面積がαで、かつ、事前に決めさえすれば、どこでも構いません。そして対立仮説は、帰無仮説の否定でなければいけません。 すなわち、両側検定であれ片側検定であれ「同じ面積で、値を観測する前に棄却域を決めている」のであれば、どちらも使えます。しかし、同じ帰無仮説であれば、棄却域にかかわわらず対立仮説も同じにしなければいけません。

多くの片側検定の説明では、棄却域を変えることで対立仮説を変えていますが、正しい手法とは言えません*2

まとめ

以上の理由から、PyQのクエスト一覧より該当パートを削除いたします。 該当パートを学習していたみなさまにはご不便をおかけいたしますが、何卒ご理解ください。

今後とも、PyQではより良く・正しいコンテンツを提供する為日々問題改善を行ってまいります。

参考サイト

*1:個人の意見です

*2:個人の意見です

Copyright ©2017-2018 BeProud Inc. All rights reserved.