はじめに

G検定では、機械学習や統計に関する基本知識が幅広く問われる。
その中でも「モデル選択」に関する知識は、データサイエンスの現場でも応用がきく重要トピックだ。

今回は、過去問を題材に「統計モデルの良さを評価する指標」について詳しく解説する。
単なる暗記ではなく、なぜその選択肢が正解なのかを論理的に押さえていこう。

Contents

問題：G検定過去問より
赤池情報量規準（AIC）とは？
1. 例：
他の選択肢はなぜ誤りなのか？
実務におけるAICの活用シーン
1. 1. 回帰モデルの比較
2. 2. 時系列解析（ARIMAなど）
PythonでAICを確認する方法（statsmodels使用例）

問題：G検定過去問より

以下の文章を読み、(●)に最もよく当てはまる選択肢を選べ。

統計モデルの良さを評価するための指標の1つとして(●)がある。

選択肢

赤池情報量規準
ベイズ推定
ヒューリスティック法
極値理論

正解は「1. 赤池情報量規準」

赤池情報量規準（AIC）とは？

赤池情報量規準（Akaike Information Criterion：AIC）は、複数の統計モデルの中から「過学習を避けつつ予測性能が高いモデル」を選ぶための指標だ。

AICは、以下の数式で表される。

AIC = -2 × 対数尤度 + 2 × モデルのパラメータ数

ポイントは、「良いモデルとは、データにうまくフィットしつつ、複雑すぎないもの」という考え方に基づいている点にある。
つまり、フィットの良さ（尤度）とシンプルさ（パラメータ数）のバランスを見るわけだ。

例：

2つのモデルがあり、どちらもデータに対して精度の高い予測を行っているとしよう。
ただし、片方はパラメータが多く、もう片方はシンプルだった場合、AICはシンプルなモデルを優先する傾向がある。

他の選択肢はなぜ誤りなのか？

G検定では「正解を選ぶ力」だけでなく、「なぜ他が違うのか」を説明できる理解力も問われる。
以下にそれぞれの選択肢について整理した。

選択肢	概要	この問題に不適な理由
ベイズ推定	事前情報と観測データを組み合わせて確率を更新する手法	モデルの良し悪しではなく、推定方法に関する概念
ヒューリスティック法	完全な正解ではなく、経験則や近似で答えに近づく方法	評価指標ではなく、問題解決のためのアプローチ手法
極値理論	極端な現象（大雨、災害など）の確率分布を扱う理論	モデル全体の評価には関係が薄い統計分野の一部

こうしてみると、「モデルの良さを評価する指標」という設問の文脈に最も適しているのは、赤池情報量規準だけだと分かる。

実務におけるAICの活用シーン

G検定での出題が象徴するように、AICは現場でも活用される場面が多い。
以下にその一例を紹介しよう。

1. 回帰モデルの比較

売上予測などで複数の回帰モデルを作成した場合、AICを使えば「複雑すぎず、かつ予測力があるモデル」を選びやすくなる。

2. 時系列解析（ARIMAなど）

ARIMAモデルの構築では、自己回帰項や移動平均項の数を変えながらAICを比較し、最も良い構成を決定するのが一般的だ。

PythonでAICを確認する方法（statsmodels使用例）

実際にPythonでAICを求めるのは難しくない。
以下は、線形回帰モデルを構築し、そのAICを確認する簡単なコードだ。

import statsmodels.api as sm
import numpy as np

# ダミーデータ
X = np.random.rand(100, 2)
X = sm.add_constant(X)
y = X @ np.array([1, 2, 3]) + np.random.normal(0, 0.5, 100)

# 回帰モデルの作成と学習
model = sm.OLS(y, X).fit()

# AICの表示
print("AIC:", model.aic)

このように、AICは手軽に確認でき、モデル選択の根拠として有効に活用できる。

まとめ

G検定に出題された「統計モデルの良さを評価する指標」に関する問題は、単なる知識ではなく実務にも直結する重要トピックだ。

✅ AIC（赤池情報量規準）は、モデルの当てはまりとシンプルさのバランスを評価する指標
✅ 他の選択肢（ベイズ推定・ヒューリスティック法・極値理論）は、それぞれ用途が異なる
✅ 実務でも、回帰モデルやARIMAモデルなどでAICは広く使われている

G検定を目指すだけでなく、実際にモデルを使いこなしたい人にとって、AICの考え方は必須の知識といえる。
まずは基本を押さえ、実際に手を動かして使ってみることをおすすめしたい。

「赤池情報量規準（AIC）」とは？モデルの良さを数値で見極める方法を徹底解説【G検定対策】