はじめに

G検定では、ディープラーニングに関連する基礎知識が幅広く問われる。特にCNN（畳み込みニューラルネットワーク）に関連した問題は、画像認識の理解とともに出題頻度が高い。

本記事では、G検定で出題された「マックスプーリング（Max Pooling）」に関する過去問を紹介しつつ、その正答と理由、そして他の選択肢の誤りについても詳しく解説していく。

Contents

マックスプーリングとは何か？

マックスプーリングは、CNNで使われる**プーリング（Pooling）**の一種だ。
特徴マップ（Feature Map）の情報を圧縮する際に用いられ、局所的な領域ごとに最大値を抽出することで、特徴の要約と計算コストの削減を行う。

たとえば、以下のような2次元配列があったとする：

[ [1, 3],
  [2, 4] ]

この領域にマックスプーリングを適用すると、「4」が出力される。理由は単純で、カーネルが走査する範囲内で最大の値を取り出すからだ。

G検定の過去問を振り返ってみよう。

ディープラーニングのプーリングの種類の1つであるマックスプーリングの説明として、最も適切な選択肢を選べ。

正解は「1. 適用したカーネル内の最大値を出力する」

マックスプーリングの動作は非常に直感的だ。カーネル（小さい領域）を画像や特徴マップ上に滑らせながら、その範囲内で最も大きな数値を拾い出す。

これにより、以下のようなメリットが得られる：

このように、マックスプーリングの核となる動作は「最大値を取る」ことであり、選択肢1が最も的確にその内容を表している。

G検定では、「正解を選ぶ」だけでなく、「なぜ他が間違っているのか」まで理解することが得点につながる。以下、それぞれの誤りを整理する。

選択肢	内容	誤りの理由
2. 平均値の中から最大値を出力する	意味が不明確で、処理内容が曖昧	平均と最大は別の指標であり、両方を同時に使うような定義は存在しない
3. 値に重みを乗じ出力する	重み付き平均のような処理を示唆	これは「加重平均プーリング」や「畳み込み演算」に近く、マックスプーリングとは別物
4. 一定値を超えた値のみを出力する	閾値処理のイメージに近い	これはReLUなどの活性化関数に近く、プーリングの定義とは異なる

マックスプーリングは、画像認識タスクだけでなく、音声やテキストといった他の分野にも応用されている。

CNNによって抽出された特徴を、マックスプーリングで圧縮しながら抽出することで、ノイズに強い分類が可能になる。

時系列データのなかで最も大きな音のピークを拾うなど、特徴の強調に利用される。

単語の埋め込みベクトルを時系列で処理したあと、マックスプーリングを使って文全体の代表ベクトルを作成するケースもある。

マックスプーリングは、ディープラーニングにおける基本的な操作の1つであり、G検定でも確実に問われるポイントだ。

✅ 正解は「適用したカーネル内の最大値を出力する」
✅ 他の選択肢は「平均」や「重み」などの要素が含まれており、マックスプーリングとは異なる処理を意味する
✅ 実務でも画像・音声・テキストなど幅広い分野で応用されている

G検定の対策においては、単に「正解を覚える」だけでなく、「なぜ他が違うのか」まで丁寧に理解しておくことが合格への近道となる。