Gemini 3.5 Flash Bewertung: Schneller, aber teurer als Sie denken

Q: Die Gemini CLI ist tot. Was kommt als Nächstes?

In einem disruptiven Schritt kündigte Google an, die Open-Source Gemini CLI am 18. Juni einzustellen. Diese Maßnahme zwingt Entwickler, auf die neue, Closed-Source Antigravity CLI umzusteigen, die in Go entwickelt wurde. Die abrupte Änderung signalisiert eine klare strategische Verschiebung, weg von gemeinschaftlich beigesteuerten Open-Source-Initiativen hin zu Googles proprietärem Ökosystem.

Zusammenfassung / Kernpunkte

Google behauptet, Gemini 3.5 Flash liefere erstklassige KI-Leistung mit unglaublicher Geschwindigkeit zu geringeren Kosten.
Doch Daten von Drittanbietern enthüllen eine schockierende Wahrheit über seine realen Kosten und Programmierfähigkeiten.

Rasante Geschwindigkeit, verblüffende Benchmarks

Google preist Gemini 3.5 Flash für seine außergewöhnliche Geschwindigkeit, ein herausragendes Merkmal mit 278 Tokens pro Sekunde. Diese bemerkenswerte Geschwindigkeit positioniert Flash deutlich vor Konkurrenten wie GPT-5.5 und Opus 4.7 und übertrifft sogar Modelle wie Haiku und andere Open-Source-Angebote von OpenAI massiv. Wenn roher Output Priorität hat, ist Flash führend.

Intern deuten Googles eigene Benchmarks darauf hin, dass die Programmierfähigkeiten von Flash mit denen von Top-Modellen übereinstimmen. Die Daten des Unternehmens zeigen eine Leistung, die auf SW Bench Pro und Terminal Bench nur wenige Prozentpunkte hinter GPT-5.5 liegt. Es übertrifft Berichten zufolge sogar Opus 4.7 auf Terminal Bench um etwa 10 %, obwohl Opus 4.7 auf SW Bench Pro einen Vorteil erzielt.

Doch eine unabhängige Analyse von Artificial Analysis enthüllt eine widersprüchliche Realität. Bewertungen von Drittanbietern lassen erhebliche Zweifel an Googles optimistischen Behauptungen aufkommen und liefern eine weniger schmeichelhafte Einschätzung der wahren Fähigkeiten von Flash in kritischen Bereichen.

Auf dem unabhängigen Programmierindex von Artificial Analysis erzielt Flash eine mittelmäßige Punktzahl von 45. Dies platziert es nicht nur hinter beeindruckenden Rivalen wie Kimi K2.6, sondern überraschenderweise auch hinter Googles eigenem älteren Modell Gemini 3.1 Pro. Die Leistung von Flash in der Programmierintelligenz scheint eine erhebliche Schwäche zu sein und erfüllt nicht die von Google beworbene "frontier performance", trotz seiner beeindruckenden Geschwindigkeit.

Das Preisschild von 1.500 $, das Google nicht erwähnte

Googles Marketing preist Gemini 3.5 Flash als bemerkenswert günstig an, mit einem Preis von nur 1,50 $ pro Million Input-Tokens. Auf dem Papier positioniert dies Flash als eine budgetfreundliche Option, die scheinbar Konkurrenten wie Opus 4.7 und GPT-5.5 unterbietet. Diese verlockende Behauptung zerfällt jedoch dramatisch unter realen Tests und offenbart eine deutlich andere Kostenstruktur, als Google bewirbt.

Eine unabhängige Analyse von Artificial Analysis enthüllte die wahren Betriebskosten. Die Durchführung des Standard-Intelligenz-Benchmarks mit Flash kostete unglaubliche 1.552 $. Dieser Betrag stellt einen 5,5-fach höheren Aufwand dar als sein Vorgänger, Gemini 3 Flash, und ist 75 % teurer als Gemini 3.1 Pro. Entscheidend ist, dass Flash sich als teurer erwies als sogar leistungsstärkere Modelle wie GPT-5.5, wenn es für Aufgaben mit hohem Denkvermögen eingesetzt wurde, wo GPT-5.5 Flash beim Programmieren deutlich übertrifft.

Der zugrunde liegende Grund für diese exorbitanten Kosten liegt im extremen Token-hungrigen Verhalten des Modells. Bei agentischen Evaluierungen erreichte Gemini 3.5 Flash durchschnittlich 49 Züge pro Aufgabe. Dieser Wert ist einer der höchsten, die bei allen getesteten Modellen verzeichnet wurden, was auf einen aggressiven Verbrauch von Input-Tokens hindeutet. Eine so hohe Token-Verbrauchsrate treibt die Endrechnung in die Höhe, wodurch die anfängliche Preisgestaltung pro Token irreführend wird und ihr wahrgenommener Wert zunichte gemacht wird.

Lernen Sie Antigravity kennen, Googles Codex-Klon

Google hat nicht nur Flash enthüllt; es hat auch Antigravity 2.0 eingeführt, eine neue eigenständige Coding-Agent-App. Diese Anwendung fällt Entwicklern sofort durch ihre unheimliche Ähnlichkeit mit bestehenden Größen wie Codex und Cursor auf. Weg von seiner früheren Inkarnation als IDE, fungiert Antigravity 2.0 nun als dedizierte Anwendung, die eine vertraute Oberfläche zur Verwaltung von KI-Konversationen und Coding-Projekten bietet.

Erste Tests zeigen, dass Antigravity 2.0 bei einfacheren, UI-fokussierten Aufgaben hervorragend abschneidet. Als der Agent aufgefordert wurde, eine einfache Café-Website zu erstellen, produzierte er ein visuell ansprechendes und funktionales Design und übertraf sogar Opus 4.7 in einem direkten Vergleich. Dies deutet darauf hin, dass die zugrunde liegenden Fähigkeiten von Flash besonders gut darin sind, saubere, moderne Benutzeroberflächen zu generieren, wenn auch mit einem leichten „KI-Gefühl“, das durch gängige Karten- und Farbverlaufsstile gekennzeichnet ist.

Die Leistung des Agenten weicht jedoch erheblich ab, wenn es um komplexere Full-Stack-Anwendungen wie ein persönliches Finanz-Dashboard geht. Während Antigravity 2.0 viel schneller eine funktionierende Anwendung generierte, wirkte die Benutzeroberfläche oft generisch und es fehlte der ausgefeilte Schliff, der bei den Ausgaben der Konkurrenz zu sehen war. Dies deutet auf eine Diskrepanz in seiner Fähigkeit hin, komplexe architektonische Designs im Vergleich zur schnellen, oberflächlichen ästhetischen Generierung zu handhaben.

Die Gemini CLI ist tot. Was kommt als Nächstes?

In einem disruptiven Schritt kündigte Google an, die Open-Source Gemini CLI am 18. Juni einzustellen. Diese Maßnahme zwingt Entwickler, auf die neue, Closed-Source Antigravity CLI umzusteigen, die in Go entwickelt wurde. Die abrupte Änderung signalisiert eine klare strategische Verschiebung, weg von gemeinschaftlich beigesteuerten Open-Source-Initiativen hin zu Googles proprietärem Ökosystem.

Enjoying this? Get one like it in your inbox each morning.

one email a day · unsubscribe in two clicks · no third-party tracking

Letztendlich erweist sich Gemini 3.5 Flash als Nischenangebot. Seine rasante Geschwindigkeit von 278 Tokens pro Sekunde macht es zur ersten Wahl für diejenigen, die rohen Durchsatz und fortschrittliche agentische Fähigkeiten priorisieren. Seine schwache Code-Leistung, die lediglich 45 Punkte auf dem Coding-Index von Artificial Analysis erreichte (unter Kimi K2.6 und sogar Gemini 3.1 Pro), gepaart mit prohibitiv hohen Betriebskosten, positioniert es jedoch schlecht für die allgemeine Entwicklung. Artificial Analysis stellte fest, dass der Betrieb des Intelligenzindex 1.552 US-Dollar kostete, ein erstaunliches 5,5-faches mehr als Gemini 3 Flash und sogar GPT 5.5 für anspruchsvolle Codierungsaufgaben übertraf.

Diese Veröffentlichung deutet auf eine mögliche strategische Neuausrichtung für Google hin. Das Unternehmen scheint den High-End-Entwicklermarkt und seine hochmodernen KI-Tools weniger zu betonen. Stattdessen scheint Google seine beeindruckenden KI-Ressourcen darauf zu konzentrieren, diese Fortschritte nahtlos in seine breite Palette von Massenmarkt-Konsumprodukten, einschließlich Search, Workspace und Android, zu integrieren, um eine breitere Benutzerwirkung anstelle einer spezialisierten Entwickleradoption zu erzielen.

Häufig gestellte Fragen

Was ist Gemini 3.5 Flash?

Gemini 3.5 Flash ist Googles neuestes KI-Modell, das auf Geschwindigkeit und Effizienz ausgelegt ist. Es verfügt über ein Kontextfenster von 1 Million Tokens und multimodale Fähigkeiten, aber seine reale Leistung und Kosten sind Gegenstand von Debatten.

Ist Gemini 3.5 Flash besser als GPT-5.5 oder Opus 4.7?

Es hängt von der Aufgabe ab. Flash ist deutlich schneller als beide. Allerdings zeigen Benchmarks von Drittanbietern, dass seine Codierungsfähigkeiten schwächer sind, und obwohl es in agentischen Workflows stark ist, ist es kein klarer Gewinner gegenüber Modellen wie Opus 4.7 in der Gesamtqualität.

Warum ist Gemini 3.5 Flash in der Praxis teuer?

Trotz eines niedrigen Preises pro Token wird das Modell als 'Token-hungrig' beschrieben. Es verwendet eine hohe Anzahl von Eingabetokens und Durchläufen, um Aufgaben zu erledigen, was zu deutlich höheren realen Kosten für komplexe Aufgaben führt, als seine Preisgestaltung vermuten lässt.

Was ist Antigravity 2.0?

Antigravity 2.0 ist Googles neuer eigenständiger KI-Codierungsagent, der die vorherige IDE-Version ersetzt. Er funktioniert ähnlich wie andere Tools wie Codex und Cursor und bietet eine Schnittstelle für KI-gestützte Softwareentwicklung.

Found this useful? Share it.

AI Reputation Report

What AI knows about you.

ChatGPT, Perplexity, Gemini, Claude & Grok are already answering questions in your category. Type your site, see who they name — you, or your competitor. Free preview.

Check my sitefree preview

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

Googles neue KI ist trügerisch schnell

Rasante Geschwindigkeit, verblüffende Benchmarks

Das Preisschild von 1.500 $, das Google nicht erwähnte

Lernen Sie Antigravity kennen, Googles Codex-Klon

Die Gemini CLI ist tot. Was kommt als Nächstes?

Häufig gestellte Fragen

Was ist Gemini 3.5 Flash?

Ist Gemini 3.5 Flash besser als GPT-5.5 oder Opus 4.7?

Warum ist Gemini 3.5 Flash in der Praxis teuer?

Was ist Antigravity 2.0?

What AI knows about you.

Als Nächstes lesen

TanStacks Full-Stack-Übernahme ist da

Treffen Sie Claude's Rivalen: 30x günstiger

Hat Claude seine Programmierfähigkeiten vorgetäuscht?

Bleiben Sie der KI voraus