回帰問題とは何を予測するもの?分類問題との違いをやさしく解説【G検定対策】

G検定対策

はじめに

G検定では機械学習や深層学習の基本概念が繰り返し問われる。
中でも、「分類」と「回帰」の違いを正しく理解していない受験者は意外に多い。

今回は実際の過去問を題材に、「回帰問題とは何か?」「どのような選択肢が正しいのか?」を丁寧に紐解いていく。


スポンサーリンク
スポンサーリンク

回帰問題とは何か?

まず、回帰(regression)の定義を整理しよう。

回帰問題とは、連続的な数値データを予測することを目的とする機械学習のタスクである。
入力データに対して、売上や温度、価格、身長などの「数値」を出力するのが特徴だ。

例えば以下のようなケースがある。

  • 過去の天気データから明日の気温を予測する
  • 広告費と売上データから今月の売上額を予測する
  • 不動産の立地や築年数から物件価格を予測する

いずれも「数値」が目的変数(予測したい結果)になっている。


問題その1

実際のG検定で出題された問題を見てみよう。

以下の文章を読み、(●)に最もよく当てはまる選択肢を選べ。
回帰問題は入力データから(●)の予測を行う問題である。

選択肢

  1. 原因
  2. 確率
  3. 数値
  4. 最適解

正解は「3. 数値


なぜ「数値」が正解なのか?

ここで重要なのは、回帰問題の出力が「連続値」であるという点だ。

分類問題」がカテゴリ(例:良い/悪い、スパム/非スパムなど)を出力するのに対し、
回帰問題」は温度・金額・体重・年齢などの数値的な結果を導く。
この違いが、両者の本質的な区別点となる。


他の選択肢はなぜ不正解なのか?

G検定では、単に正解を選ぶだけでなく、「なぜ他の選択肢が間違いなのか」を説明できることが重要である。
以下に各選択肢の意味と不適切な理由を整理した。

選択肢 説明 不適切な理由
原因 ある結果が起きる理由や要因を指す。因果関係の話。 回帰問題は「結果」を予測する問題であり、「原因」を直接求めるものではない。
確率 事象が起こる可能性を数値化したもの。 確率は分類問題やベイズ統計に使われる概念であり、回帰問題では確率を予測対象としない。
最適解 最も望ましい解や答え。数理最適化の用語。 回帰は特定の条件に対する「予測値」を出すものであり、必ずしも「最適解」を導くわけではない。

回帰問題の応用例

ここで、回帰問題がどのように実務で使われているかを見てみよう。

1. 売上予測

企業では過去の売上データと市場要因を使って、次月の売上額を予測する。
これは典型的な回帰分析の事例である。

2. 不動産価格の予測

間取り・築年数・駅からの距離などを入力にして、物件の推定価格を出す。
多くの不動産ポータルサイトで使われている手法だ。

3. 医療分野における数値予測

血液検査データから肝機能の数値を予測したり、リスクスコアを算出したりする。
数値を扱う点で回帰問題として分類される。


まとめ

G検定では、基本的な用語の意味を正しく理解する力が問われる。
今回の問題に関して言えば、次の点をしっかり押さえておこう。

✅ 回帰問題は「数値」を予測するタスクである
✅ 分類問題との違いを理解することが重要
✅ 問題文のキーワード「予測」に注目して選択肢を吟味する
✅ 他の選択肢がなぜ誤りかを説明できるようにしておく

G検定合格を目指すうえで、「回帰」と「分類」の違いは何度も問われる基本中の基本だ。
必ず理解して、自信を持って解答できるようにしておこう。

コメント