はじめに

AI技術が社会のあらゆる場面に浸透する中で、G検定の重要性も高まっている。特に、機械学習の評価指標は毎年のように出題されており、「混同行列」の理解は欠かせない。

今回は、実際のG検定過去問をベースに、「混同行列とは何か」「どう活用されるのか」を丁寧に整理していく。

Contents

問題を見てみよう
混同行列とは？
なぜ「混同行列」が正解なのか？
混同行列から何が分かるのか？
混同行列が活躍する場面
Pythonで混同行列を出力してみる

問題を見てみよう

以下の文章を読み、(●)に最もよく当てはまる選択肢を選べ。

機械学習の分類問題でモデルの予想結果を評価する際に(●)行列を用いる。

選択肢

対角
転置
混同
逆

正解は「3. 混同」

混同行列とは？

混同行列（Confusion Matrix）とは、分類モデルの予測結果を実際の正解データと照合し、どれだけ正確に分類できているかを分析するための表である。

典型的な2値分類（二値分類）では、以下のような4つの分類に分かれる。

	実際はポジティブ	実際はネガティブ
予測がポジティブ	真陽性（TP）	偽陽性（FP）
予測がネガティブ	偽陰性（FN）	真陰性（TN）

これを「混同行列」と呼ぶ。

なぜ「混同行列」が正解なのか？

選択肢の中から「混同行列」が正解となる理由を、他の選択肢と比較しながら整理しよう。

選択肢	説明	なぜ間違いか？
対角	対角行列とは、対角線上にしか要素が存在しない特殊な行列	機械学習の分類評価には使わない
転置	行と列を入れ替えた行列	評価に関係はない
混同	実際と予測を比較する評価手法	✅ 正解。分類性能の分析に用いる
逆	元の行列を打ち消すような性質を持つ行列	評価指標とは無関係

混同行列は、予測が正しかったのか、間違っていたのか、そしてその「間違い方」まで把握できるため、実務でも非常に役立つ。

混同行列から何が分かるのか？

混同行列からは、以下のような評価指標を算出できる。

正解率（Accuracy）：全体に対して正しく分類できた割合
Accuracy = (TP + TN) / (TP + FP + FN + TN)
適合率（Precision）：ポジティブと予測した中で、本当にポジティブだった割合
Precision = TP / (TP + FP)
再現率（Recall）：実際にポジティブなデータの中で、正しくポジティブと予測できた割合
Recall = TP / (TP + FN)
F値（F1 Score）：適合率と再現率の調和平均
F1 = 2 * (Precision * Recall) / (Precision + Recall)

これらの指標は、モデルの性能をバランスよく評価するために必要不可欠だ。

混同行列が活躍する場面

1. 医療診断モデルの評価

がん検出モデルなどでは、偽陰性（FN）が命に関わるため、再現率を重視する必要がある。混同行列により、どのような誤りが多いかを視覚的に確認できる。

2. スパムメールの分類

スパムメールを「迷惑」として誤分類しても問題は少ないが、正常なメールをスパムと判断してしまう偽陽性（FP）は業務に支障をきたす。混同行列でその頻度を把握することで、モデルの改善が可能になる。

3. クレジットカードの不正利用検知

誤検出のコストが高いため、バランスの取れた評価が求められる。混同行列は、モデルの調整やしきい値の最適化に役立つ。

Pythonで混同行列を出力してみる

以下は、Pythonでscikit-learnを使って混同行列を生成する例。

from sklearn.metrics import confusion_matrix
y_true = [1, 0, 1, 1, 0, 1, 0]
y_pred = [1, 0, 1, 0, 0, 1, 1]

cm = confusion_matrix(y_true, y_pred)
print(cm)

出力例：

[[2 1]
 [1 3]]

この結果から、

真陰性（TN）: 2
偽陽性（FP）: 1
偽陰性（FN）: 1
真陽性（TP）: 3
と読み取れる。

まとめ

G検定では、混同行列に関する問題が繰り返し出題されており、その仕組みと活用法の理解は必須といえる。

✅ 混同行列は、分類モデルの評価に使われる重要なツール
✅ 予測結果の「正解・誤り」の傾向を視覚的に把握できる
✅ 医療、金融、マーケティングなど、応用範囲が広い

G検定に合格するためには、用語の暗記にとどまらず、「なぜそれが使われるのか」まで踏み込んだ理解が求められる。
混同行列を確実に押さえ、得点源に変えていこう。

混同行列とは？分類モデル評価のカギを握る理由とは【G検定対策】