Anthropic、最上位AIモデル「Claude Opus 4.6」発表——GPT-5.2を上回る性能で100万トークン対応
コーディング能力が大幅強化、複数ベンチマークで業界トップのスコアを記録
AnthropicがAIモデルの最上位版「Claude Opus 4.6」を発表した。コーディングスキルが大幅に強化され、より慎重な計画立案、長時間のエージェントタスクの持続、大規模コードベースでの信頼性向上、そして自分のミスを見つけるコードレビューやデバッグ能力が改善されている。しかも、Opusクラスとしては初めて100万トークンのコンテキストウィンドウをベータ版として搭載。これ、かなりすごい……!
性能面では業界トップクラスの成績を叩き出していて、エージェントコーディング評価の「Terminal-Bench 2.0」で最高スコアを獲得、複雑な推論テスト「Humanity’s Last Exam」でも全ての最先端モデルをリード。注目すべきは、経済的に価値のある知識労働タスクの評価「GDPval-AA」で、OpenAIのGPT-5.2を約144 Eloポイント上回ったこと。ちなみに、これはOpus 4.6がGPT-5.2より約70%の確率で高いスコアを獲得することを意味するらしい。
API側では「adaptive thinking」(状況に応じて深い推論を使うか判断)や4段階の「effort」コントロール、長時間タスク用の「context compaction」などの新機能を追加。製品面では、Claude Codeで複数のエージェントがチームとして協力する「agent teams」機能や、ExcelとPowerPointの統合強化も実現している。価格は据え置きで、100万トークンあたり入力$5/出力$25。今日からclaude.aiとAPIで利用可能とのこと。
コメント(0件)