📝 エグゼクティブサマリー
GPT 5 (GPT-5.2)は、OpenAIが2025年末に展開を開始したAI業界のデファクトスタンダードモデルです。
GPQAベンチマークで92.4%という驚異的な推論スコアを記録し、400kトークンのAPIコンテキストウィンドウを誇ります。
圧倒的なエコシステムとツール連携を強みとしますが、ユーザーからは「以前のモデル(GPT-4o)より使いにくくなった」「検閲が厳しすぎる」といった厳しい声も上がっており、性能とユーザビリティのギャップに苦しんでいます。
💰 料金体系の詳細
サブスクリプションプラン
| プラン | 料金 | 主な特徴 |
|---|---|---|
| Free | $0 | GPT-5.2 (制限あり), Web検索 |
| GPT Go | $8/月 | GPT-5.2 Instant, 広告なし |
| GPT Plus | $20/月 | GPT-5.2 Thinking, 優先アクセス |
API料金 (GPT-5.2)
- Input: $1.75 / 1M tokens (Cached: $0.175)
- Output: $14.00 / 1M tokens
- Reasoning: Outputトークンとして加算課金
🎯 主要ベンチマーク結果
| ベンチマーク | スコア | 評価 |
|---|---|---|
| GPQA Diamond | 92.4% | 世界最高峰 |
| SWE-bench | 80.0% | 実用レベル |
| Math (AIME) | 100.0% | 完全正答 |
| Humanity's Last Exam | 26.5% | Geminiに劣る |
✅ 長所と短所
👍 長所
- 広大なエコシステムと連携ツール
- GPQA 92.4%の圧倒的な推論能力
- 400kトークンのAPIコンテキスト
👎 短所
- 過去モデル(GPT-4o)と比較した劣化報告
- コーディング時の怠慢さ(Lazy)と拒否
- Thinking Modelの厳しい使用制限
💭 Reddit ユーザー評価
ポジティブな意見 TOP4
「推論タスクに関しては依然として最強。複雑な指示を一度で理解するのはGPT-5だけだ」
— r/ChatGPT ユーザー
「Prism Workspaceが研究用途に便利すぎる。これだけで$20払う価値がある」
— r/OpenAI ユーザー
「多言語対応が劇的に向上している。日本語のニュアンスもほぼ完璧に捉える」
— X (Twitter) ユーザー
「APIの400kコンテキストは神。本一冊まるごと入れて質問できる」
— r/LocalLLaMA ユーザー
ネガティブな意見 TOP3
「明らかにGPT-4oより馬鹿になっている。単純なコード修正すら拒否することが増えた」
— r/ChatGPT ユーザー
「"私はAI言語モデルです"という説教が多すぎる。検閲が厳しすぎて創作活動に使えない」
— r/OpenAI ユーザー
「Plusユーザーなのに制限がかかるのが早すぎる。Geminiに乗り換えた」
— r/ChatGPT ユーザー
🎯 推奨使用例
最適な用途 TOP3
- 複雑な論理推論・学術研究 - 論文解析、実験データの相関分析
- 大規模システムの設計・アーキテクチャ - 400kコンテキストを活かした全体設計
- 多言語翻訳とニュアンス理解 - 高精度な異文化コミュニケーション
推奨しない用途 TOP3
- 制約のないクリエイティブライティング - 検閲によりストーリーが破綻しやすい
- 単純な高速チャット - GoプランやGemini Flashの方が安くて速い
- 完全自律型エージェント - ツール使用の柔軟性でClaudeに劣る場合がある
📊 結論と総合評価
総合評価: ⭐⭐⭐⭐ (4.2/5.0)
GPT 5 (GPT-5.2)は、依然としてAI界の「王者」ですが、その地位はかつてほど盤石ではありません。
推論能力と知識量は世界最高峰ですが、過剰な安全性調整による使い勝手の低下が目立ちます。
ビジネスや学術研究には必須のツールですが、趣味や創作活動にはGeminiやClaudeの方が適している選択肢となるでしょう。
🔮 今後の展望
2026年後半には、さらに推論コストを下げた「GPT-5.5」や、動画生成機能「Sora」との完全統合が噂されています。ユーザーの不満を受けて、検閲強度の調整が行われるかどうかが注目点です。