ロジスティック回帰はどんな問題に使える?分類手法の基本をG検定過去問から解説【G検定対策】

G検定対策

はじめに

G検定では、機械学習の代表的な手法に関する基礎的理解が頻繁に問われる。特に「ロジスティック回帰」は、分類問題を解く上で基本ともいえる手法の一つだ。

本記事では、G検定の過去問を通して「ロジスティック回帰がどのような問題に適しているのか」を具体的に解説する。機械学習初心者にありがちな混同や誤解も整理しながら、正しい知識の定着を目指していく。


スポンサーリンク
スポンサーリンク

実際のG検定過去問

ロジスティック回帰分析を用いる事例として、最も適切な選択肢を選べ。

選択肢

  1. がんの発症率を分析する
  2. 体重と身長との関係を分析する
  3. コンビニエンスストアの来店者数と売り上げの関係を分析する
  4. 人気の旅行先を分析する

正解は「1. がんの発症率を分析する


なぜ「がんの発症率を分析する」が正解なのか?

ロジスティック回帰は、**目的変数がカテゴリ(特に2値)**のときに用いられる手法である。
たとえば、「がんを発症したか? Yes / No」のように、結果が2つの状態に分類される場合に非常に有効だ。

用途 目的変数の型 適用手法の例
がん発症の有無 2値(Yes/No) ロジスティック回帰
身長・体重の関係 数値(連続値) 線形回帰
来店者数と売上の関係 数値(連続値) 回帰分析
人気の旅行先 カテゴリ(多値) 決定木 / 多クラス分類

ロジスティック回帰は確率を出力し、その確率に基づいて「発症した」「発症していない」といった分類を行う。
したがって、**「がんの発症率を分析する」**という問題には最も適している。


なぜ他の選択肢は誤りなのか?

G検定では、正解を覚えるだけでなく、なぜ他の選択肢が誤りなのかも理解しておくと知識が定着しやすい。

体重と身長との関係を分析する

これは連続値と連続値の関係を調べる問題であり、ロジスティック回帰の対象ではない。
線形回帰相関分析が適している。

コンビニエンスストアの来店者数と売り上げの関係を分析する

こちらも数値同士の関係性を見る問題であり、分類ではなく回帰問題となる。
ロジスティック回帰ではなく、回帰モデル(線形回帰や多項式回帰など)が使われる場面だ。

人気の旅行先を分析する

旅行先は複数の選択肢がある多クラス分類の問題となる。
ロジスティック回帰でも「多項ロジスティック回帰」という拡張で対応可能ではあるが、一般的なロジスティック回帰(2値分類)を指す問題においては適さない。


ロジスティック回帰の具体的な活用シーン

G検定の対策としてだけでなく、実務においてもロジスティック回帰は広く使われている。以下のようなシチュエーションが代表例だ。

1. 医療分野でのリスク予測

がん、糖尿病、心疾患などの発症リスクを年齢・性別・生活習慣などのデータをもとに予測する。
結果が「発症するか、しないか」という2クラス分類になるため、ロジスティック回帰が有効となる。

2. 顧客の離脱予測

顧客が「解約するか、しないか」を予測するマーケティング領域でも、ロジスティック回帰は定番。
変数として年齢、利用頻度、過去のサポート対応数などを入力することで、解約リスクを確率で出すことが可能になる。


Pythonでのロジスティック回帰実装(Scikit-learn)

from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.datasets import make_classification

# ダミーデータ生成
X, y = make_classification(n_samples=100, n_features=4, n_classes=2, random_state=42)

# データ分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# モデル作成と学習
model = LogisticRegression()
model.fit(X_train, y_train)

# 予測
predictions = model.predict(X_test)

このように、LogisticRegression()を使えば簡単に分類モデルを構築できる。


まとめ

G検定で出題される「ロジスティック回帰分析を用いる事例」では、分類タスクかどうかを見極めることが重要となる。

✅ ロジスティック回帰は 2値分類 に強い
✅ 回帰や多クラス分類と混同しないよう注意
✅ 実務でも医療・マーケティング分野で広く使われている

G検定対策としてはもちろん、AIエンジニアを目指す人にとっても基本知識となるため、しっかり理解しておこう。次回以降も他の過去問に触れながら、実践的な知識を深めていく予定だ。

コメント