混同行列とは?分類モデル評価のカギを握る理由とは【G検定対策】

G検定対策

はじめに

AI技術が社会のあらゆる場面に浸透する中で、G検定の重要性も高まっている。特に、機械学習の評価指標は毎年のように出題されており、「混同行列」の理解は欠かせない。

今回は、実際のG検定過去問をベースに、「混同行列とは何か」「どう活用されるのか」を丁寧に整理していく。


スポンサーリンク
スポンサーリンク

問題を見てみよう

以下の文章を読み、(●)に最もよく当てはまる選択肢を選べ。

機械学習の分類問題でモデルの予想結果を評価する際に(●)行列を用いる。

選択肢

  1. 対角
  2. 転置
  3. 混同

正解は「3. 混同


混同行列とは?

混同行列(Confusion Matrix)とは、分類モデルの予測結果を実際の正解データと照合し、どれだけ正確に分類できているかを分析するための表である。

典型的な2値分類(二値分類)では、以下のような4つの分類に分かれる。

実際はポジティブ 実際はネガティブ
予測がポジティブ 真陽性(TP) 偽陽性(FP)
予測がネガティブ 偽陰性(FN) 真陰性(TN)

これを「混同行列」と呼ぶ。


なぜ「混同行列」が正解なのか?

選択肢の中から「混同行列」が正解となる理由を、他の選択肢と比較しながら整理しよう。

選択肢 説明 なぜ間違いか?
対角 対角行列とは、対角線上にしか要素が存在しない特殊な行列 機械学習の分類評価には使わない
転置 行と列を入れ替えた行列 評価に関係はない
混同 実際と予測を比較する評価手法 ✅ 正解。分類性能の分析に用いる
元の行列を打ち消すような性質を持つ行列 評価指標とは無関係

混同行列は、予測が正しかったのか、間違っていたのか、そしてその「間違い方」まで把握できるため、実務でも非常に役立つ。


混同行列から何が分かるのか?

混同行列からは、以下のような評価指標を算出できる。

  • 正解率(Accuracy):全体に対して正しく分類できた割合
    Accuracy = (TP + TN) / (TP + FP + FN + TN)
  • 適合率(Precision):ポジティブと予測した中で、本当にポジティブだった割合
    Precision = TP / (TP + FP)

  • 再現率(Recall):実際にポジティブなデータの中で、正しくポジティブと予測できた割合
    Recall = TP / (TP + FN)

  • F値(F1 Score):適合率と再現率の調和平均
    F1 = 2 * (Precision * Recall) / (Precision + Recall)

これらの指標は、モデルの性能をバランスよく評価するために必要不可欠だ。


混同行列が活躍する場面

1. 医療診断モデルの評価

がん検出モデルなどでは、偽陰性(FN)が命に関わるため、再現率を重視する必要がある。混同行列により、どのような誤りが多いかを視覚的に確認できる。

2. スパムメールの分類

スパムメールを「迷惑」として誤分類しても問題は少ないが、正常なメールをスパムと判断してしまう偽陽性(FP)は業務に支障をきたす。混同行列でその頻度を把握することで、モデルの改善が可能になる。

3. クレジットカードの不正利用検知

誤検出のコストが高いため、バランスの取れた評価が求められる。混同行列は、モデルの調整やしきい値の最適化に役立つ。


Pythonで混同行列を出力してみる

以下は、Pythonでscikit-learnを使って混同行列を生成する例。

from sklearn.metrics import confusion_matrix
y_true = [1, 0, 1, 1, 0, 1, 0]
y_pred = [1, 0, 1, 0, 0, 1, 1]

cm = confusion_matrix(y_true, y_pred)
print(cm)

出力例:

[[2 1]
 [1 3]]

この結果から、

  • 真陰性(TN): 2
  • 偽陽性(FP): 1
  • 偽陰性(FN): 1
  • 真陽性(TP): 3
    と読み取れる。

まとめ

G検定では、混同行列に関する問題が繰り返し出題されており、その仕組みと活用法の理解は必須といえる。

✅ 混同行列は、分類モデルの評価に使われる重要なツール
✅ 予測結果の「正解・誤り」の傾向を視覚的に把握できる
✅ 医療、金融、マーケティングなど、応用範囲が広い

G検定に合格するためには、用語の暗記にとどまらず、「なぜそれが使われるのか」まで踏み込んだ理解が求められる。
混同行列を確実に押さえ、得点源に変えていこう。

コメント