【Cursor最新】Cursor Composer 2.5が登場!次世代モデル(Opus 4.7/GPT-5.5)に匹敵する「安さと賢さ」の秘密

Cursor composer2.5登場記事のサムネイル。

こんにちは!AIコードエディタCursorの進化が止まりません。

2026年5月、最新のアップデート「Composer 2.5」が発表されました。

「何が変わったの?」「次世代モデルと比べてどうなの?」と気になっている方に向けて、公式ブログの内容をどこよりも分かりやすく、噛み砕いて解説します。

公式ブログはこちらから:Composer 2.5 の紹介 · Cursor


目次

1. 結論:Composer 2.5を一言で言うと?

今回のアップデートのポイントは

最高峰(Maxモデル)の知能を、圧倒的な低コストとスピードで実現した」ことにあります。

ポイント
  • 知能の飛躍: 複雑な指示への対応力が劇的に向上
  • 学習の革新: 従来の25倍のデータ量と、ミスを即座に正す独自訓練
  • 圧倒的コスパ: 現在の最強モデル(Claude Opus 4.7 Max等)と同等の力を1/10のコストで提供
Tomoya

前回のモデルと変わらぬコストで提供されているのはありがたいですね

私がさらに驚いているのは、前回の発表(Composer2)からわずか2か月しかたっていない事です!

これは、AIの時代の流れがさらに加速しつつあるのかなと感じさせられます。

前回のブログ内容はこちら:Composer 2 のご紹介 · Cursor


2. なぜそんなに賢くなったのか?「3つの秘密」

「単にモデルを新しくしただけ」ではありません。Cursorチームは独自の「特訓」をAIに施したようです。

① 従来の25倍!「合成データ」による猛特訓

AIに「実務に近い問題」を大量に解かせました。

特にユニークなのが「機能削除(Feature Deletion)」という手法。

既存のコードからあえて特定の機能を消し、「元通りに直せ」という難問を大量に解かせることで、コードの深い依存関係を理解させています。

「合成データの活用」は、強化学習でOpenAIやAnthropicも活用している方法みたいですが、「機能削除」といったコーディングに特化した問題作成手法はCursor独自の学習方法だと思います。

現状と答えを繋ぎ合わせる問題を大量に解かせる事で一貫性を持ったシステムの開発やモデル自身が考えて作成する能力が向上していくように仕向けていると推測できます。

② 「テキストフィードバック」によるピンポイント矯正

これまでは「結果が正解か」だけで判断していましたが、今回は「この指示の出し方はダメ」「このツール呼び出しは無駄」といった具体的なヒント(テキスト)を与えて再学習させています。

基本的な考え方は、モデルがより適切にふるまえたはずの軌跡上の箇所に直接フィードバックを与えることです。

改善点のヒントを与える事で本来なら「エラー」や「Not Found」で返される所を代替手段を見つけられるようになり粘り強く動作できるようになり幅広い選択肢を持ったプログラマーに強化されているのが特徴的に感じました。

③ 100万基のH100相当!圧倒的な計算資源

SpaceXAIと協力し、巨大スパコン「Colossus 2」を使用。従来の2倍以上の計算量を投入し、「より深く、長く考え抜く力」を身につけさせています。

こちらもOpenAIやAnthropicも行っているように数や規模で強くする方法です。地道だがこれが結局一番強いのかもしれません。これがあってこその効率や手法が活きてくるのだと思えます。


3. 次世代モデル(Opus 4.7 / GPT-5.5)との比較

驚くべきは、最新のモデルと比較したデータです。

折れ線グラフとスコア表示で、Composer2.5/2、Opus4.7 max/xhigh/high/medium/low、GPT-5.5 xhigj/high/medium/low、の性能が縦にスコアと横にコストで比較されている。
画像は、Cursor Composer2.5と他のモデルの性能スコアを比較したインフォグラフィックです。

引用:Cursor公式ブログ

  • 知能スコア(縦軸): オレンジ色のComposer 2.5は、Opus 4.7 maxGPT5.5 xhighに肉薄するスコア。
  • コスト(横軸): Opus 4.7 maxが1タスク$11以上かかるのに対し、、Composer2.5はわずか1程度のコストパフォーマンス。

可視化されるととてもわかりやすいですね。

まさに、コーディングするなら「安くて賢い」を体現しているのだと感じます。

Terminal_Bench 2.0、SWB-Bench Multilingual、CursorBench v3.1を指標にComposer2.5、Opus 4.7、GPT-5.5、Composer2のデータが並んだ表。
画像には、複数のモデルとベンチマークの性能データが表形式で表示されています。

引用:Cursor公式ブログ

説明
  • Terminal-Bench 2.0(ターミナル操作)
    • ここでは GPT-5.5 (82.7%) が圧倒的ですが、Composer 2.5 (69.3%) は Opus 4.7 (69.4%) と全く同等の性能を維持しています。
  • SWE-Bench(実務的なソフトウェア開発)
    • Composer 2.5 (79.8%) は、なんと GPT-5.5 (77.8%) を上回っています。Opus 4.7 (80.5%) ともほぼ互角です。
    • 実務レベルのコード作成能力では、他社の最新モデル級の力があると言えます。
  • CursorBench v3.1(高難易度タスク)
    • Composer 2.5 (63.2%) は、Opus 4.7 xhigh (61.6%) や GPT-5.5 medium (59.2%) よりも明確に高い数値を出しています。
    • 最高峰の Opus 4.7 max (64.8%) に肉薄する性能です。

もちろん独自モデルで運用しているのでこれくらいの安さを提供できているのだと思いますが、コーディング系モデルでは、驚異的な賢さと使いやすさだと思います。


4. 専門用語をサクッと解説:裏側で支える技術

記事を深掘りしたい方向けに、エンジニアの間で話題の技術用語も整理しておきます。

  • Dual Mesh HSDP: 膨大な数のGPUが渋滞せずに連携するネットワーク技術。
  • Sharded Muon: 巨大なAIを、メモリを節約しながら超高速で学習させる最新の「計算エンジン」。
  • FSDP (Fully Sharded Data Parallel):完全シャード・データ並列
  • HSDP (Hybrid Sharded Data Parallel):ハイブリッド・シャード・データ並列

これらのおかげで、私たちは「爆速なのに超賢い」という魔法のような体験ができるのです。


5. 【独自検証】Composer 2.5の実力を試してみた

1:課題の提示

今回は、「SaaS製品のようなオシャレな価格表(Pricing Table)」を作成します。

あえて、「見た目がバラバラで、ボタンも動かない最低限のHTMLコード」を準備し、そこからどこまで「今どきの洗練されたデザイン」に自力で昇華できるかを試します。

  • 課題: 質素なリスト形式のデータを、ユーザーが「これなら買いたい!」と思うプロ級のデザインに修正せよ。
  • 難易度: 2.5で強化された「過去の学習データから正解を導き出す力(推論)」を試すため、あえて具体的なデザイン指示は伏せます。
デモ用の簡易HTML価格表。
デモ用の簡易HTML価格表。

2:プロンプトの統一

公平を期すため、Composer 2と2.5の両方に全く同じ指示(プロンプト)を入力します。

「この中身がバラバラなHTMLファイルを、モダンで高級感のある価格表(3カラム)にリデザインしてください。

月払いと年払いを切り替えるスイッチ機能も追加し、アニメーションも滑らかに実装してください。
他にも訴求力を高める工夫を駆使して自分だけの価格表を作成してください。」

Cursor AI AgentのComposer2.5と2に入力したプロンプト。統一したプロンプトを入力した模様。
Composer2.5と2に入力したプロンプト。統一したプロンプトを入力した模様。

3:比較の項目

以下の3つのポイントで「2」と「2.5」の差を判定します。

  1. デザインの「こなれ感」: 言わなくても「いい感じ」の余白、フォント、色使いができているか。
  2. スイッチ機能の完成度: 「月払い/年払い」の切り替えが、バグなくスムーズに動くか。
  3. 指示の読み取り深さ: 「モダンで高級感」という抽象的な表現をどこまでコードに落とし込めるか。

4:検証結果

【旧】Composer 2 の結果

Composer2でリデザインされた価格表
  • 見た目: 細かいポイントが一般的に感じる(テキストの位置やボタンの切り替わり)。
  • 挙動: 切り替えスイッチやアニメーションは大差なく良好だと思う。
  • 印象: 細かく詳細を表示している感じ。

【新】Composer 2.5 の結果

Composer2.5でリデザインされた価格表。
  • 見た目: 
    • タイトルのグラデーションはカッコイイ。
    • 1スクロールで価格カラム全体が見える。
    • 背景の方眼目もオシャレ。
  • 挙動:料金の表示が年単位でも月々の表示で上級者を感じる。
  • 印象: シンプルさや「アイコン」まで気が利いている。

まとめ

  • 色はどちらも「黒とゴールド」が高級感のイメージのようです。
  • スイッチ機能は、大差なく動作はスムーズで違和感がないように感じました。
  • 今回は、デザインのこなれ感で、少し変化があったように感じます。
  • Composer2.5の方が全体的にプロっぽいデザイン構成になっているかなと思いました。

正直、細かい点での変化なので、そう大差はないのでプロンプトの作成機能の活用によって修正や向上は可能だと思います。

読者の方はどうゆう印象を持たれましたか?見比べてみてください。


6. まとめ:Cursorは「最強の専門家」へ

Composer 2.5は、汎用的なAIではなく、「世界で最もプログラミングに特化したAI」を目指して作られました。

今回のCursorのブログから見えてきたことは、「ただ単純にスパコンで強化するのではなく効率的に且つ費用対効果も考えて独自モデルを強化している」という印象を持ちました。

大規模なモデル(Composer2.5)をスパコンで一括で強化するのではなく、スパコンの複数のGPUをどう分担して「超高速」かつ「メモリ効率良く」学習させるのかを知る事が出来たと思います。

規模が大きく変わってもそれをうまく使う」気持ちは忘れないでおきたい教訓になりました。

これからは「AIに簡単なコードを書いてもらう」だけでなく、「プロジェクト全体の構造をAIと一緒に考え、一気に作り上げる」ことが当たり前になります。まだ触っていない方は、ぜひ今日からその「思考の深さ」を体感してみてください!

現在(2026/5/19)、Cursorを契約すると初月50%offのキャンペーンを行っています。Composerに興味を持った方は以下のリンクから登録してください。Cursorでは見たことないので今だけかもしれません。[PR]

※Composer 2.5 では、初週(5/19~5/25)の使用量が 2 倍になるようです。

使用量について簡単に:より時間をかけて、より深く考え抜いてから答えを出すリソースを増やしている状態。

Cursor関連記事についても投稿しています。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

始めまして。このブログを運営するTomoyaです。
未経験個人開発者。AI×個人開発(Vibe Cording)で学習して参入してくれる人が増えて広がっていくと良いなと思って始めました。

実際に作成→デプロイ(公開)→運営を行ってそれについての問題や疑問を記録していきます。
また行っていく上で内容(セキュリティ・制限など)にもこだわっていきたいなと思っています。

コメント

コメントする

目次