要約 / ポイント
驚異的な速度、困惑させるベンチマーク
Googleは、その卓越した速度、つまり毎秒278トークンを達成する際立った特徴を持つGemini 3.5 Flashを宣伝しています。この驚異的な速度により、FlashはGPT-5.5やOpus 4.7といった競合他社を大きくリードし、Haikuやその他のオープンソースのOpenAI製品のようなモデルさえもはるかに凌駕しています。生の出力が優先される場合、Flashが群を抜いています。
内部的には、Google自身のベンチマークは、Flashのコーディングスキルがトップクラスのモデルと一致することを示唆しています。同社のデータによると、SW Bench ProとTerminal BenchではGPT-5.5に数パーセントしか遅れをとっていません。Terminal BenchではOpus 4.7を約10%上回るとも報じられていますが、SW Bench ProではOpus 4.7が優位に立っています。
しかし、Artificial Analysisによる独立した分析は、矛盾する現実を明らかにしています。第三者による評価は、Googleの楽観的な主張に重大な疑念を投げかけ、Flashの重要な分野における真の能力について、あまり好意的でない評価を提供しています。
Artificial Analysisの独立したコーディングインデックスにおいて、Flashは平凡な45点を記録しました。これは、Kimi K2.6のような手強いライバルだけでなく、驚くべきことにGoogle自身の古いGemini 3.1 Proモデルよりも低い位置にあります。Flashのコーディング知能におけるパフォーマンスは、その印象的な速度にもかかわらず、Googleが宣伝する「フロンティアパフォーマンス」を満たしておらず、重大な弱点であるように見えます。
Googleが言及しなかった1,500ドルの価格
Googleのマーケティングは、Gemini 3.5 Flashを驚くほど安価であると宣伝しており、100万入力トークンあたりわずか1.50ドルと価格設定されています。書面上では、これはFlashを予算に優しい選択肢として位置づけ、Opus 4.7やGPT-5.5のようなライバルを凌駕しているように見えます。しかし、この魅力的な主張は、実際のテストでは劇的に崩壊し、Googleが宣伝するのとは著しく異なるコスト構造を明らかにしています。
Artificial Analysisによる独立した分析は、真の運用費用を明らかにしました。Flashで標準的な知能ベンチマークを実行するのに、驚くべき1,552ドルがかかりました。この数字は、前身であるGemini 3 Flashよりも5.5倍高く、Gemini 3.1 Proよりも75%高価です。決定的に、Flashは、GPT-5.5がコーディングにおいてFlashを大幅に上回るような高度な推論タスクに使用された場合、GPT-5.5のようなさらに高性能なモデルよりもコストがかかることが判明しました。
この法外なコストの根本的な理由は、モデルの極端なトークン消費行動にあります。エージェント評価中、Gemini 3.5 Flashはタスクあたり平均49ターンを記録しました。この指標は、テストされたすべてのモデルの中で最も高いものの1つであり、入力トークンの積極的な消費を示しています。このような高いトークン消費率は最終的な請求額を押し上げ、初期のトークンあたりの価格設定を欺瞞的なものにし、その認識された価値を無効にしています。
GoogleのCodexクローン、Antigravityをご紹介
GoogleはFlashを発表しただけでなく、新しいスタンドアロンのコーディングエージェントアプリであるAntigravity 2.0もリリースしました。このアプリケーションは、CodexやCursorのような既存の強力なツールとの驚くべき類似性で開発者をすぐに魅了します。以前のIDEとしての姿から離れ、Antigravity 2.0は現在、AI会話やコーディングプロジェクトを管理するための使い慣れたインターフェースを提供する専用アプリケーションとして機能しています。
初期のテストでは、Antigravity 2.0 がシンプルなUIに焦点を当てたタスクに優れていることが明らかになりました。基本的なカフェのウェブサイトを作成するよう指示された際、エージェントは視覚的に魅力的で機能的なデザインを生成し、直接比較では Opus 4.7 をも上回りました。これは、Flash の基盤となる機能が、一般的なカードやグラデーションスタイルに特徴づけられるわずかな「AIらしさ」はあるものの、クリーンでモダンなユーザーインターフェースの生成に特に長けていることを示唆しています。
しかし、個人財務ダッシュボードのようなより複雑なフルスタックアプリケーションに取り組む際、エージェントのパフォーマンスは大きく異なります。Antigravity 2.0 は動作するアプリケーションをはるかに高速に生成することに成功しましたが、そのUIはしばしば一般的で、競合他社の出力に見られるような洗練された磨きが欠けていました。これは、複雑なアーキテクチャ設計を処理する能力と、迅速な表層的な美的生成能力との間に格差があることを示しています。
Gemini CLIは終了。次は何が来るのか?
破壊的な動きとして、Googleは6月18日にオープンソースの Gemini CLI をシャットダウンすると発表しました。この措置により、開発者はGoで開発された新しいクローズドソースの Antigravity CLI への移行を余儀なくされます。この突然の変更は、コミュニティが貢献するオープンソースの取り組みから、Google独自のプロプライエタリなエコシステムへと移行する明確な戦略的転換を示しています。
最終的に、Gemini 3.5 Flash はニッチな製品として登場します。毎秒278トークンという驚異的な速度は、生の処理能力と高度なエージェント機能を優先する人々にとって最高の選択肢となります。しかし、Artificial Analysis のコーディングインデックスでわずか45点(Kimi K2.6 や Gemini 3.1 Pro をも下回る)という弱いコーディング性能と、法外に高い運用コストが相まって、一般的な開発には不向きな位置づけとなっています。Artificial Analysis は、インテリジェンスインデックスの実行に1,552ドルかかると試算しており、これは Gemini 3 Flash の5.5倍という驚くべき金額であり、高度な推論を要するコーディングタスクでは GPT 5.5 をも上回ります。
このリリースは、Googleにとって潜在的な戦略的転換を示唆しています。同社は、ハイエンドの開発者市場とその最先端のAIツールを軽視しているように見えます。代わりに、Googleは、その強大なAIリソースを、Search、Workspace、Androidを含む膨大な数のマスマーケット向け消費者製品にこれらの進歩をシームレスに統合することに集中しているようで、専門的な開発者への採用よりも、より広範なユーザーへの影響を目指しています。
よくある質問
Gemini 3.5 Flashとは何ですか?
Gemini 3.5 Flash は、Googleの最新AIモデルで、速度と効率のために設計されています。100万トークンのコンテキストウィンドウとマルチモーダル機能を備えていますが、その実世界でのパフォーマンスとコストについては議論の対象となっています。
Gemini 3.5 Flash は GPT-5.5 や Opus 4.7 よりも優れていますか?
タスクによります。Flash は両者よりも大幅に高速です。しかし、サードパーティのベンチマークでは、そのコーディング能力は弱く、エージェントワークフローには強いものの、全体的な品質では Opus 4.7 のようなモデルに対して明確な勝者ではありません。
Gemini 3.5 Flash は実際にはなぜ高価なのですか?
トークンあたりの価格は低いにもかかわらず、このモデルは「トークンを大量に消費する」と評されています。タスクを完了するために多数の入力トークンとターンを使用するため、複雑なジョブでは、その価格設定が示唆するよりもはるかに高い実世界でのコストがかかります。
Antigravity 2.0とは何ですか?
Antigravity 2.0 は、Googleの新しいスタンドアロンAIコーディングエージェントで、以前のIDEバージョンに代わるものです。Codex や Cursor のような他のツールと同様に機能し、AI支援ソフトウェア開発のためのインターフェースを提供します。