はじめに
G検定では、AIや機械学習に限らず、統計学の基礎知識も問われることが多い。
特に「有意性」や「検定」に関する用語は、試験の頻出トピックの一つだ。
今回は、統計的有意性の判断に関する過去問を取り上げ、「P値」というキーワードについて詳しく解説していく。
問題:統計的有意性に用いられる指標は?
以下の文章を読み、(●)に最もよく当てはまる選択肢を選べ。
統計的有意性を判断する際に用いられる有意確率を(●)値という。
選択肢
- W
- T
- P
- F
正解は「P」
なぜ「P」が正解なのか?
統計的な仮説検定では、「観測されたデータが、偶然により得られたものであるかどうか」を判断する必要がある。
このときの基準となるのが「P値(p-value)」と呼ばれる指標だ。
P値とは、「帰無仮説が正しいと仮定したときに、実際に得られた統計量以上の結果が得られる確率」を意味する。
簡単に言えば、「偶然起こった可能性」を数値で示したもので、値が小さいほど偶然とは考えにくいことを意味する。
例えば、P値が0.01であれば、「帰無仮説のもとで、今回のようなデータが出る確率は1%」となる。
他の選択肢が間違いである理由
それでは、他の選択肢がなぜ誤りなのかを確認しておこう。
| 選択肢 | 解説 |
|---|---|
| W | 「W検定」という統計手法も存在するが、有意確率の名称ではない。選択肢としては不適切。 |
| T | t検定の「T」と勘違いされやすいが、t値は統計量の一つであり、有意確率の名称には該当しない。 |
| F | 分散分析で使われるF検定の「F」だが、これも検定統計量の一つ。P値とは異なる。 |
つまり、P値のみが「有意確率」として用いられる正しい用語である。
P値の目安と判断基準
実際の統計解析では、次のような基準でP値を評価するのが一般的だ。
| P値の範囲 | 解釈 |
|---|---|
| 0.05以上 | 有意差なし(帰無仮説は棄却できない) |
| 0.01~0.05未満 | 有意(帰無仮説を棄却できる可能性あり) |
| 0.01未満 | 非常に有意(偶然によるものと考えにくい) |
ただし、P値の絶対値にこだわりすぎるのではなく、実験設計やサンプル数、仮説の妥当性と合わせて評価することが大切だ。
G検定で問われる統計的知識の重要性
AIや機械学習のモデル評価においても、統計の理解は欠かせない。
たとえば、次のような場面でP値の考え方が応用される。
- A/Bテストの効果検証
- モデル改善による精度向上の有意性評価
- 医療分野における新薬の有効性判定
G検定では、こうした現場で使われる統計的概念を正しく理解しているかが試される。
まとめ
統計的有意性を判断する上で中心的な役割を果たす「P値」は、G検定でも頻出のキーワードだ。
単なる暗記ではなく、「なぜその値が重要なのか」「他の選択肢とどう違うのか」まで理解することが合格への近道となる。
✅ 統計的有意性を示すのは「P値(p-value)」
✅ 他の選択肢(T, F, W)は統計量や検定名であり、有意確率の呼称とは異なる
✅ 現場でもP値はA/Bテストや施策の効果判定に活用される
G検定を突破するために、P値の定義と意味をしっかり押さえておこう。


コメント