はじめに
2025年8月、OpenAIが新モデル「GPT-5」を発表した。
「ポケットの中の博士号」と称されるこのモデルは、専門家レベルの知識と推論力を兼ね備えたとされている。だが、SNSを中心に広がるユーザーの声は一枚岩ではない。
「本当に進化したのか?」──そんな疑問が、静かに、しかし確実に広がっている。
この記事では、GPT-5の技術的な特徴とユーザー評価のギャップに焦点を当て、その「当惑」と「はじけ具合」を読み解いていく。
GPT-5の性能──数字が語る進化の証
GPT-5は、汎用性と高度な推論力を融合させたモデルとして登場した。
ベンチマークテストでは、過去のモデルを圧倒する結果が並ぶ。
- 数学分野では、高校レベルの問題に対しツールなしで94.6%、ツール使用時には100%の正答率を記録。
- コーディング能力も飛躍的に向上し、SWE-benchで74.9%という驚異的なスコアを叩き出した。
- 専門的推論においては、大学院レベルの質問に88.4%の正答率を示している。
さらに、事実に基づかない回答(いわゆる「ハルシネーション」)の発生率は、GPT-4o比で約45%、o3モデル比では約80%も削減されたという。
曖昧な質問に対しては、即答を避け、追加質問を返すことで意図を探る姿勢も見られる。これは、単なる応答機械から「思考するエージェント」への進化を示唆している。
それでも広がる違和感──ユーザーの声に耳を傾ける
技術的な進化が明らかである一方、ユーザーの体感は必ずしも一致していない。
SNSでは「#keep4o」というタグが拡散され、旧モデルへの回帰を望む声も少なくない。
- 「回答が不自然になった」「誤答が増えた」といった指摘が相次ぎ、ハルシネーションの完全な解決には至っていないようだ。
- モデル選択の自由度も低下。GPT-5では「標準版」と「Thinking版」の2種類に簡素化され、ユーザーが細かく制御する余地が失われた。
- ベンチマーク上の進化に対し、実際の対話体験では「進化を感じにくい」「むしろ質が落ちた」との声もある。
このギャップは、技術と体験の間に横たわる深い溝を象徴している。
まとめ
GPT-5は、技術的には間違いなく新時代の扉を開いた。
専門的なタスク処理能力、推論力、安全性──そのすべてが過去を凌駕している。
しかし、ユーザーの満足度は別の話だ。
操作性の変化、回答品質への不満、そして期待とのズレ。これらが複雑に絡み合い、「絶賛と酷評の嵐」を巻き起こしている。
今後のアップデートが、このギャップを埋める鍵となるだろう。
GPT-5は、進化の象徴であると同時に、AIとの共生における新たな問いを投げかけている。
- GPT-5に不満続出…謎回答が逆に増えた? 実はプロンプトより効く「超重要な使い方」(ビジネス+IT) – Yahoo!ニュース
- ChatGPT-5レビュー:速くて賢い…でも自由は減った?【生成AI】|Alpaka
- 「GPT-5」の評判低調で旧モデル復活を望む声 ChatGPTの独走状態に変化も? | インターネット | 東洋経済オンライン
コメント