はじめに
G検定では機械学習や深層学習の基本概念が繰り返し問われる。
中でも、「分類」と「回帰」の違いを正しく理解していない受験者は意外に多い。
今回は実際の過去問を題材に、「回帰問題とは何か?」「どのような選択肢が正しいのか?」を丁寧に紐解いていく。
回帰問題とは何か?
まず、回帰(regression)の定義を整理しよう。
回帰問題とは、連続的な数値データを予測することを目的とする機械学習のタスクである。
入力データに対して、売上や温度、価格、身長などの「数値」を出力するのが特徴だ。
例えば以下のようなケースがある。
- 過去の天気データから明日の気温を予測する
- 広告費と売上データから今月の売上額を予測する
- 不動産の立地や築年数から物件価格を予測する
いずれも「数値」が目的変数(予測したい結果)になっている。
問題その1
実際のG検定で出題された問題を見てみよう。
以下の文章を読み、(●)に最もよく当てはまる選択肢を選べ。
回帰問題は入力データから(●)の予測を行う問題である。
選択肢
- 原因
- 確率
- 数値
- 最適解
正解は「3. 数値」
なぜ「数値」が正解なのか?
ここで重要なのは、回帰問題の出力が「連続値」であるという点だ。
「分類問題」がカテゴリ(例:良い/悪い、スパム/非スパムなど)を出力するのに対し、
「回帰問題」は温度・金額・体重・年齢などの数値的な結果を導く。
この違いが、両者の本質的な区別点となる。
他の選択肢はなぜ不正解なのか?
G検定では、単に正解を選ぶだけでなく、「なぜ他の選択肢が間違いなのか」を説明できることが重要である。
以下に各選択肢の意味と不適切な理由を整理した。
| 選択肢 | 説明 | 不適切な理由 |
|---|---|---|
| 原因 | ある結果が起きる理由や要因を指す。因果関係の話。 | 回帰問題は「結果」を予測する問題であり、「原因」を直接求めるものではない。 |
| 確率 | 事象が起こる可能性を数値化したもの。 | 確率は分類問題やベイズ統計に使われる概念であり、回帰問題では確率を予測対象としない。 |
| 最適解 | 最も望ましい解や答え。数理最適化の用語。 | 回帰は特定の条件に対する「予測値」を出すものであり、必ずしも「最適解」を導くわけではない。 |
回帰問題の応用例
ここで、回帰問題がどのように実務で使われているかを見てみよう。
1. 売上予測
企業では過去の売上データと市場要因を使って、次月の売上額を予測する。
これは典型的な回帰分析の事例である。
2. 不動産価格の予測
間取り・築年数・駅からの距離などを入力にして、物件の推定価格を出す。
多くの不動産ポータルサイトで使われている手法だ。
3. 医療分野における数値予測
血液検査データから肝機能の数値を予測したり、リスクスコアを算出したりする。
数値を扱う点で回帰問題として分類される。
まとめ
G検定では、基本的な用語の意味を正しく理解する力が問われる。
今回の問題に関して言えば、次の点をしっかり押さえておこう。
✅ 回帰問題は「数値」を予測するタスクである
✅ 分類問題との違いを理解することが重要
✅ 問題文のキーワード「予測」に注目して選択肢を吟味する
✅ 他の選択肢がなぜ誤りかを説明できるようにしておく
G検定合格を目指すうえで、「回帰」と「分類」の違いは何度も問われる基本中の基本だ。
必ず理解して、自信を持って解答できるようにしておこう。


コメント