はじめに
G検定では、機械学習だけでなく、画像処理の基礎知識も頻繁に問われる。
特に畳み込みニューラルネットワーク(CNN)に関する設問では、「プーリング処理」の理解が不可欠だ。
今回は、G検定の過去問から「ストライド」「パディング」「プーリング」といった画像処理の基礎を問う問題を取り上げる。
問題文をもとに、図を交えてステップバイステップで解説する。
問題:プーリング適用回数を求めよ
6×6ピクセルの画像に、ストライド幅2で2×2ピクセルのプーリングをパディングなしで適用した場合、プーリングの適用回数として、最も適切な選択肢を選べ。
選択肢
- 4
- 9
- 3
- 6
問題の構造を理解する
この問題では、「2×2のプーリングウィンドウ」を「ストライド2」で適用するという指定がある。
まずは基本用語を確認しよう。
| 用語 | 意味 |
|---|---|
| プーリング | 特徴マップを圧縮し、情報を要約する処理(最大値や平均値を取る) |
| ストライド | ウィンドウをどれだけの幅でスライドさせるか(ステップ幅) |
| パディングなし | 画像の端に余白を追加しない。つまり、完全に収まる場所でのみ適用される |
手順で考える:プーリングの適用回数
まず、元画像は以下のような6×6のピクセルで構成されている。
● ● ● ● ● ●
● ● ● ● ● ●
● ● ● ● ● ●
● ● ● ● ● ●
● ● ● ● ● ●
● ● ● ● ● ●
この画像に対して、2×2のプーリングウィンドウをストライド2で適用する。
具体的には、以下の条件でスライドしていく。
- 横方向:2ピクセルずつ動かす
- 縦方向:2ピクセルずつ動かす
- パディングなし:画像の端に不完全にかかる領域は無視される
横方向の適用範囲
- 6ピクセルを幅2のステップで進むと、
→(6 - 2) / 2 + 1 = 3回分の適用が可能
縦方向も同様に
- 同じく
(6 - 2) / 2 + 1 = 3回分の適用が可能
全体のプーリング適用数
- 横3 × 縦3 = 9回
正解は「9」
選択肢の中で最も適切なのは:
✅ 2. 9
この計算は画像処理の初歩的な理解に基づくものであり、CNNの仕組みを学ぶ際にも頻出するポイントだ。
よくある誤解と注意点
「パディングあり」と勘違いしやすい
パディングあり(zero-paddingなど)であれば、適用範囲が広がる可能性がある。
しかし、今回の問題は「パディングなし」が前提。そのため、端のピクセルには無理に適用しない。
ストライド幅1との違い
ストライドが1の場合、かなり多くの位置にプーリングウィンドウが適用されるが、ストライドが大きくなるほど適用回数は減る。
ストライド2ではスキップが発生するため、画像の要素の「要約度合い」が高くなる。
G検定に向けて押さえるべきポイント
| ポイント | 内容 |
|---|---|
| プーリングのサイズ | 2×2や3×3などがよく出題される |
| ストライド幅 | 1または2が多く、計算ミスしやすい |
| パディングの有無 | 問題文に明記されるので読み落としに注意 |
| 出力サイズの計算式 | (入力サイズ - フィルタサイズ) / ストライド + 1 |
まとめ
G検定の画像処理問題では、理論だけでなく具体的なサイズ計算が問われることが多い。
今回のように、「プーリング」「ストライド」「パディング」それぞれの定義を明確にし、
公式を使って一つひとつ計算する練習を積んでおくと、本番での得点源になる。
✅ プーリングの計算式を押さえる
✅ 画像サイズの変化を紙に書いてイメージする
✅ 「パディングなし」の場合、端は無視される点を意識する
次回は、畳み込み処理(Convolution)に関する出題を解説予定。
G検定の合格を目指す読者は、毎回の問題を通じて少しずつ理解を深めていこう。


コメント