プーリング回数の求め方とは?ストライド・パディングの違いも解説【G検定対策】

G検定対策

はじめに

G検定では、機械学習だけでなく、画像処理の基礎知識も頻繁に問われる。
特に畳み込みニューラルネットワーク(CNN)に関する設問では、「プーリング処理」の理解が不可欠だ。

今回は、G検定の過去問から「ストライド」「パディング」「プーリング」といった画像処理の基礎を問う問題を取り上げる。
問題文をもとに、図を交えてステップバイステップで解説する。


スポンサーリンク
スポンサーリンク

問題:プーリング適用回数を求めよ

6×6ピクセルの画像に、ストライド幅2で2×2ピクセルのプーリングをパディングなしで適用した場合、プーリングの適用回数として、最も適切な選択肢を選べ。

選択肢

  1. 4
  2. 9
  3. 3
  4. 6

問題の構造を理解する

この問題では、「2×2のプーリングウィンドウ」を「ストライド2」で適用するという指定がある。
まずは基本用語を確認しよう。

用語 意味
プーリング 特徴マップを圧縮し、情報を要約する処理(最大値や平均値を取る)
ストライド ウィンドウをどれだけの幅でスライドさせるか(ステップ幅)
パディングなし 画像の端に余白を追加しない。つまり、完全に収まる場所でのみ適用される

手順で考える:プーリングの適用回数

まず、元画像は以下のような6×6のピクセルで構成されている。

● ● ● ● ● ●  
● ● ● ● ● ●  
● ● ● ● ● ●  
● ● ● ● ● ●  
● ● ● ● ● ●  
● ● ● ● ● ●  

この画像に対して、2×2のプーリングウィンドウをストライド2で適用する。
具体的には、以下の条件でスライドしていく。

  • 横方向:2ピクセルずつ動かす
  • 縦方向:2ピクセルずつ動かす
  • パディングなし:画像の端に不完全にかかる領域は無視される

横方向の適用範囲

  • 6ピクセルを幅2のステップで進むと、
    (6 - 2) / 2 + 1 = 3 回分の適用が可能

縦方向も同様に

  • 同じく (6 - 2) / 2 + 1 = 3 回分の適用が可能

全体のプーリング適用数

  • 横3 × 縦3 = 9回

正解は「9」

選択肢の中で最も適切なのは:

2. 9

この計算は画像処理の初歩的な理解に基づくものであり、CNNの仕組みを学ぶ際にも頻出するポイントだ。


よくある誤解と注意点

「パディングあり」と勘違いしやすい

パディングあり(zero-paddingなど)であれば、適用範囲が広がる可能性がある。
しかし、今回の問題は「パディングなし」が前提。そのため、端のピクセルには無理に適用しない。

ストライド幅1との違い

ストライドが1の場合、かなり多くの位置にプーリングウィンドウが適用されるが、ストライドが大きくなるほど適用回数は減る。
ストライド2ではスキップが発生するため、画像の要素の「要約度合い」が高くなる。


G検定に向けて押さえるべきポイント

ポイント 内容
プーリングのサイズ 2×2や3×3などがよく出題される
ストライド幅 1または2が多く、計算ミスしやすい
パディングの有無 問題文に明記されるので読み落としに注意
出力サイズの計算式 (入力サイズ - フィルタサイズ) / ストライド + 1

まとめ

G検定の画像処理問題では、理論だけでなく具体的なサイズ計算が問われることが多い。
今回のように、「プーリング」「ストライド」「パディング」それぞれの定義を明確にし、
公式を使って一つひとつ計算する練習を積んでおくと、本番での得点源になる。

✅ プーリングの計算式を押さえる
✅ 画像サイズの変化を紙に書いてイメージする
✅ 「パディングなし」の場合、端は無視される点を意識する

次回は、畳み込み処理(Convolution)に関する出題を解説予定。
G検定の合格を目指す読者は、毎回の問題を通じて少しずつ理解を深めていこう。

コメント