はじめに
AI技術が社会のあらゆる場面に浸透する中で、G検定の重要性も高まっている。特に、機械学習の評価指標は毎年のように出題されており、「混同行列」の理解は欠かせない。
今回は、実際のG検定過去問をベースに、「混同行列とは何か」「どう活用されるのか」を丁寧に整理していく。
問題を見てみよう
以下の文章を読み、(●)に最もよく当てはまる選択肢を選べ。
機械学習の分類問題でモデルの予想結果を評価する際に(●)行列を用いる。
選択肢
- 対角
- 転置
- 混同
- 逆
正解は「3. 混同」
混同行列とは?
混同行列(Confusion Matrix)とは、分類モデルの予測結果を実際の正解データと照合し、どれだけ正確に分類できているかを分析するための表である。
典型的な2値分類(二値分類)では、以下のような4つの分類に分かれる。
| 実際はポジティブ | 実際はネガティブ | |
|---|---|---|
| 予測がポジティブ | 真陽性(TP) | 偽陽性(FP) |
| 予測がネガティブ | 偽陰性(FN) | 真陰性(TN) |
これを「混同行列」と呼ぶ。
なぜ「混同行列」が正解なのか?
選択肢の中から「混同行列」が正解となる理由を、他の選択肢と比較しながら整理しよう。
| 選択肢 | 説明 | なぜ間違いか? |
|---|---|---|
| 対角 | 対角行列とは、対角線上にしか要素が存在しない特殊な行列 | 機械学習の分類評価には使わない |
| 転置 | 行と列を入れ替えた行列 | 評価に関係はない |
| 混同 | 実際と予測を比較する評価手法 | ✅ 正解。分類性能の分析に用いる |
| 逆 | 元の行列を打ち消すような性質を持つ行列 | 評価指標とは無関係 |
混同行列は、予測が正しかったのか、間違っていたのか、そしてその「間違い方」まで把握できるため、実務でも非常に役立つ。
混同行列から何が分かるのか?
混同行列からは、以下のような評価指標を算出できる。
- 正解率(Accuracy):全体に対して正しく分類できた割合
Accuracy = (TP + TN) / (TP + FP + FN + TN) -
適合率(Precision):ポジティブと予測した中で、本当にポジティブだった割合
Precision = TP / (TP + FP) -
再現率(Recall):実際にポジティブなデータの中で、正しくポジティブと予測できた割合
Recall = TP / (TP + FN) -
F値(F1 Score):適合率と再現率の調和平均
F1 = 2 * (Precision * Recall) / (Precision + Recall)
これらの指標は、モデルの性能をバランスよく評価するために必要不可欠だ。
混同行列が活躍する場面
1. 医療診断モデルの評価
がん検出モデルなどでは、偽陰性(FN)が命に関わるため、再現率を重視する必要がある。混同行列により、どのような誤りが多いかを視覚的に確認できる。
2. スパムメールの分類
スパムメールを「迷惑」として誤分類しても問題は少ないが、正常なメールをスパムと判断してしまう偽陽性(FP)は業務に支障をきたす。混同行列でその頻度を把握することで、モデルの改善が可能になる。
3. クレジットカードの不正利用検知
誤検出のコストが高いため、バランスの取れた評価が求められる。混同行列は、モデルの調整やしきい値の最適化に役立つ。
Pythonで混同行列を出力してみる
以下は、Pythonでscikit-learnを使って混同行列を生成する例。
from sklearn.metrics import confusion_matrix
y_true = [1, 0, 1, 1, 0, 1, 0]
y_pred = [1, 0, 1, 0, 0, 1, 1]
cm = confusion_matrix(y_true, y_pred)
print(cm)
出力例:
[[2 1]
[1 3]]
この結果から、
- 真陰性(TN): 2
- 偽陽性(FP): 1
- 偽陰性(FN): 1
- 真陽性(TP): 3
と読み取れる。
まとめ
G検定では、混同行列に関する問題が繰り返し出題されており、その仕組みと活用法の理解は必須といえる。
✅ 混同行列は、分類モデルの評価に使われる重要なツール
✅ 予測結果の「正解・誤り」の傾向を視覚的に把握できる
✅ 医療、金融、マーケティングなど、応用範囲が広い
G検定に合格するためには、用語の暗記にとどまらず、「なぜそれが使われるのか」まで踏み込んだ理解が求められる。
混同行列を確実に押さえ、得点源に変えていこう。


コメント