はじめに
G検定では、AIに関する幅広い知識が問われるが、その中でも実務に直結するトピックの一つが「データサイエンティストのスキルセット」だ。
この領域では、一般社団法人データサイエンス協会が定義するスキルの体系が出題されることが多い。
今回は、過去問をもとに、「どのスキルが該当しないか?」というタイプの問題を取り上げ、出題の意図や背景知識をわかりやすく解説していく。
問題文
データサイエンス協会では、データサイエンティストに求められるスキルセットを定義している。最も不適切な選択肢を選べ。
選択肢
- データクレンジング力
- データエンジニアリング力
- データサイエンス力
- ビジネス力
正解は 「1. データクレンジング力」
意外に思われるかもしれないが、「データクレンジング力」という表現は、データサイエンス協会のスキル定義には登場しない。
もちろん、実務ではデータの前処理(=クレンジング)は非常に重要だが、「公式なスキルセット」かと問われれば違う。
では、正しいスキルセットとはどのようなものか、以下に整理する。
データサイエンス協会が定義する3つのスキル軸
データサイエンス協会は、データサイエンティストに必要なスキルを以下の3軸で定義している。
| スキル軸 | 内容 |
|---|---|
| データサイエンス力 | 統計学、機械学習、AIなどの知識や分析能力。モデル構築やアルゴリズム設計が含まれる。 |
| データエンジニアリング力 | データの収集・蓄積・加工・運用を含むエンジニアリング全般。インフラ設計やSQL運用も対象。 |
| ビジネス力 | 分析結果をビジネス課題に結び付ける力。仮説構築、意思決定支援、プレゼンテーション能力など。 |
この3つのスキルは、円環的に連携しており、どれか一つでも欠けると実務で機能しない。
一方、「データクレンジング力」は、データエンジニアリングの一部に含まれる処理であり、独立したスキル軸とはみなされない。
他の選択肢の正当性
| 選択肢 | 妥当性 | 解説 |
|---|---|---|
| データサイエンス力 | 妥当 | AI・統計・アルゴリズムなどの中核スキルであり、データサイエンティストの屋台骨とも言える。 |
| データエンジニアリング力 | 妥当 | データ基盤を支える役割。実務ではこの力なしに分析は成り立たない。 |
| ビジネス力 | 妥当 | 分析を価値につなげる力。モデルの精度よりもビジネスインパクトが求められる場面も多い。 |
このように、「データクレンジング力」は他のスキル軸の一部には該当するが、独立したスキルセットではない点がポイントとなる。
実務視点で見る「データクレンジング力」
とはいえ、「データクレンジング力」が不要という話ではない。
実務ではむしろ、最も時間を割く工程といっても過言ではない。
- 欠損値の処理
- 外れ値の検出
- データ形式の統一
- ノイズ除去
これらの前処理作業は、モデルの精度や安定性に直結する。
しかしながら、協会の定義においては、それをスキルの「名前」として独立させていないだけという話だ。
試験対策のポイント
このタイプの問題では、「言葉の正確性」が問われる。
似ているが公式でない言葉を見抜けるかどうかがカギとなる。
対策のヒント:
- 公式文書(例:スキル定義書)を一度は目を通しておく
- 「っぽいけど存在しない」言葉に注意(例:「AI力」「データ理解力」など)
また、「不適切な選択肢を選べ」という設問形式にも注意が必要。
正解が「間違っているもの」という逆の発想を求められるため、落ち着いて読解することが大切だ。
まとめ
G検定では、単なる知識の暗記ではなく、「言葉の定義」や「適切さの判断力」が試される。
✅ データサイエンス協会が定義するスキルセットは「データサイエンス力」「データエンジニアリング力」「ビジネス力」の3つ
✅ 「データクレンジング力」は実務では重要だが、協会の定義には含まれない
✅ 試験では「似ているけれど違う言葉」を見抜く力が問われる
知識を覚えるだけでなく、言葉の「正確さ」や「公式性」に敏感になることが、合格への近道となる。


コメント