はじめに
G検定では、機械学習や統計に関する基礎的な用語や概念がよく問われる。特に「回帰分析」や「モデルの評価」に関する設問は、得点源となる分野だ。中でも、「決定係数」は出題頻度が高く、理解の浅さがスコアに直結する。
今回は、G検定の過去問を題材に「決定係数」の意味とその選び方を解説する。
問題
以下の文章を読み、(●)に最もよく当てはまる選択肢を選べ。
回帰分析などで、データに対する推定された回帰式の当てはまりの良さを表す係数を(●)係数という。
選択肢
- 重み
- 微分
- 損失
- 決定
正解は「4. 決定」
「回帰分析の当てはまりの良さ」を表す指標として、最も基本的かつ代表的なのが「決定係数(R²)」という指標だ。
解説:決定係数とは何か?
決定係数(R²、アール・スクエア)は、回帰モデルがどれだけデータを説明できているかを数値で表す指標。0から1の範囲を取り、1に近いほどモデルの予測が実際のデータとよく一致していることを示す。
例えば、以下のようなケースを考えよう。
- R² = 0.95
→ 回帰モデルが、データの95%を説明している - R² = 0.30
→ 回帰モデルの説明力が弱く、データの70%は説明できていない
このように、R²が高ければ高いほど「当てはまりが良い」と判断できる。
他の選択肢はなぜ誤りか?
各選択肢の意味と「決定係数」との違いを見てみよう。
| 選択肢 | 説明 | 誤りの理由 |
|---|---|---|
| 重み | モデルの各入力特徴にかかる係数。重回帰分析やニューラルネットワークの学習に使われる。 | 「当てはまりの良さ」ではなく、「入力の影響度」を表すもの |
| 微分 | 数学的な変化率。最適化アルゴリズム(勾配降下法など)で利用される。 | モデルの性能ではなく、学習の仕組みに関連する概念 |
| 損失 | モデルの予測と実際の値との差を数値化したもの。例:平均二乗誤差(MSE) | 説明力ではなく、誤差やズレの大きさを示す指標 |
| 決定 | 回帰モデルの当てはまりの良さを示す。決定係数(R²)が該当。 | 唯一、問題文の意味に適合している選択肢 |
実務における「決定係数」の使われ方
決定係数は、単なる試験対策にとどまらず、現場でモデルを評価するときの基本的な指標としても広く用いられている。
1. 売上予測モデルの精度検証
例えば、小売業における売上予測モデルでは、決定係数が高ければ高いほど、過去の売上パターンを正確に再現できていると判断できる。
2. 気温と電力使用量の関係分析
気温を説明変数とし、電力消費量を目的変数とする回帰モデルを作成したとする。このとき、R²が0.85程度なら、「気温が電力使用量の85%を説明している」という解釈が可能になる。
まとめ
G検定では、用語をただ暗記するだけではなく、背景や活用例まで理解しているかが問われる。
✅ 回帰式の当てはまりの良さを評価するには「決定係数(R²)」を使う
✅ 他の選択肢(重み・微分・損失)は、モデル構築や学習プロセスの概念であり、性能評価には適さない
✅ 実務においても、モデルの有効性を簡潔に示すための指標として活用されている
G検定合格を目指すなら、「なぜその選択肢が正解か」だけでなく、「なぜ他が不正解か」にも目を向けよう。そこに、本質的な理解がある。


コメント