Skip to content

Mercury 2 Bewertung

Mercury 2 ist ein auf Diffusion basierendes großes Sprachmodell, das von Inception Labs entwickelt wurde und es KI-Entwicklern ermöglicht, effiziente, multimodale KI-Workflows zu erstellen.

shipped 26. Feb. 2026updated 27. Mai 2026aifreemium
Mercury 2 - AI tool for mercury. Professional illustration showing core functionality and features.
1Verarbeitet über 1.000 Tokens pro Sekunde und erreicht über die Inception API eine Geschwindigkeit von 1.196,2 Tokens/Sekunde.
2Eingeführt im Februar 2026 mit einem Preismodell, das bei 0,38 USD pro 1 Million Tokens beginnt.
3Erreicht einen AIME 2025 Score von 91,1, wettbewerbsfähig mit führenden Modellen.

Stork Quadrant

Dead Man Walking· 7/100

An LLM can do most of what this tool's UI promises. No moat, no agent presence.

Mercury is a research-stage model architecture, not a defensible product. Diffusion LLMs are technically interesting but unproven at scale. OpenAI, Anthropic, and Google have vastly more compute, talent, and deployment data. By the time dLLMs mature, the incumbents will have already shipped their own versions. There is no moat here—only a bet on a different mathematical approach that larger labs are also exploring.

Claude Haiku 4.5, scored 2026-05-26

Defensibility · 0/100

  • Physical-world coupling
  • Regulatory moat
  • Network liquidity
  • Proprietary refreshing data
  • High-trust catastrophic workflows
  • Multi-party coordination
  • Brand / community / taste

An LLM alone could replace

  • Generate text outputs faster than autoregressive models
  • Process multimodal inputs (text, image, audio) and produce coherent responses
  • Fine-tune or adapt language model behavior for specific tasks
  • Serve inference at lower latency and cost than standard LLMs

Agent-Readiness · 15/100

  • Verified MCP
  • Listed on agent surfaces
  • Usage-based pricing
  • Headless agent auth
  • Public OpenAPI
  • Active changeloghttps://www.inceptionlabs.ai/blog (2026-05-12)
  • llms.txthttps://www.inceptionlabs.ai/llms.txt

How to defend

Become a research-to-product pipeline: publish benchmarks that prove dLLMs outperform on specific, measurable tasks (latency, accuracy, cost per token), then license the weights to inference providers (Together, Replicate, Hugging Face) rather than competing on distribution. Own the academic narrative first.

  • Ship an MCP server and list it on Stork — biggest single point gain (+25).
  • Get listed in the Anthropic MCP registry, Cursor, or Claude Desktop (+20).
  • Add a usage-based or per-call tier; per-seat-only pricing dies when agents replace seats (+15).
  • Expose API-key auth with a self-serve sandbox tier; remove sales-call gates (+15).
  • Publish an OpenAPI spec at /openapi.json or /.well-known/openapi (+10).

Ähnliche Tools

Alternativen vergleichen

Andere Tools, die Sie in Betracht ziehen könnten

2

Giselle

Shares tags: ai, image-generation, productivity

Besuchen
3

2-b.ai

Shares tags: ai, image-generation, writing

Besuchen
4

rivva

Shares tags: ai, image-generation, productivity

Besuchen
</>Embed "Featured on Stork" Badge
Badge previewBadge preview light
<a href="https://www.stork.ai/en/mercury-2" target="_blank" rel="noopener noreferrer"><img src="https://www.stork.ai/api/badge/mercury-2?style=dark" alt="Mercury 2 - Featured on Stork.ai" height="36" /></a>
[![Mercury 2 - Featured on Stork.ai](https://www.stork.ai/api/badge/mercury-2?style=dark)](https://www.stork.ai/en/mercury-2)

overview

Was ist Mercury 2?

Mercury 2 ist ein diffusionsbasiertes großes Sprachmodell (dLLM)-Werkzeug, das von Inception Labs entwickelt wurde und es KI-Entwicklern ermöglicht, ultraschnelles Denken in Produktions-KI-Workflows zu integrieren. Es ist für eine effiziente multimodale Aufgabenbewältigung konzipiert und beinhaltet eine eingebaute Fehlerkorrektur während des Token-Erzeugungsprozesses.

quick facts

Schnelle Fakten

AttributWert
EntwicklerInception Labs
PreisFreemium; $0,38 pro 1M Tokens
API VerfügbarJa
KonformitätAnforderungen des EU KI-Gesetzes
SicherheitSOC2
UnterstützungE-Mail, Chat, Dokumentation

features

Hauptmerkmale von Mercury 2

Mercury 2 verwendet eine Diffusionsarchitektur für die Generierung mehrerer Token, die eine hochgeschwindigkeits Textausgabe ermöglicht und dabei Qualitätskontrolle durch Fehlerkorrektur und anpassbare Denkstufen gewährleistet.

  • 1Diffusionsarchitektur für parallele Token-Generierung.
  • 2Fehlerkorrektur während der Verfeinerung mehrerer Tokens.
  • 3Einstellbare Denkstufen für unterschiedliche Ausgabe-Tiefen.
  • 4Unterstützt die Verarbeitung von langen Kontexten für komplexe Anfragen.
  • 5Native Werkzeugnutzung mit schema-angepasster JSON-Ausgabe.
  • 6Integrationskompatibilität mit der OpenAI-API.
  • 7Echtzeitanwendungen wie Sprachinteraktion.

use cases

Wer sollte Mercury 2 verwenden?

Mercury 2 ist auf verschiedene AI-Entwicklungsumgebungen zugeschnitten und kann insbesondere für Teams von Vorteil sein, die effiziente und leistungsstarke KI-Lösungen benötigen.

  • 1AI-Entwickler, die die Anwendungsleistung verbessern möchten.
  • 2Unternehmens-AI-Teams, die mehrstufige Arbeitsabläufe automatisieren.
  • 3Produktentwickler, die Echtzeit-Voice- und Codierungsfunktionen benötigen.
  • 4Organisationen, die sich auf schnelle Suche und Inhaltsgenerierung konzentrieren.

pricing

Mercury 2 Preise & Pläne

Mercury 2 arbeitet nach einem Freemium-Modell und bietet eine Mischung aus Eingabe- und Ausgabe-Preismodellen an. Die Kosten betragen 0,38 USD pro 1 Million Tokens, ohne dass derzeit detaillierte gestaffelte Pläne verfügbar sind.

  • 1Eingangspreis: 0,38 $ pro 1 Million Tokens.
  • 2Preise für Ausgabe: Stufen derzeit nicht spezifiziert.

competitors

Merkur 2 vs. Wettbewerber

Die einzigartige diffusionbasierte Architektur von Mercury 2 bietet im Vergleich zu traditionellen LLMs in verschiedenen Bereichen, einschließlich Geschwindigkeit und Kosten, klare Vorteile.

  • 1Merkur 2 vs. Claude 4.5 Haiku: Merkur 2 verarbeitet 10x mehr Tokens pro Sekunde im Vergleich zu Claudes 89 Tokens/Sekunde.
  • 2Merkur 2 gegen GPT-5.2 Mini: Merkur 2 bietet eine überlegene Latenz und Geschwindigkeit und erreicht gleichzeitig den AIME-Score von 91,1.
  • 3Mercury 2 vs. Gemini 2.0 Flash Lite: Mercury 2 bietet aufgrund seines Diffusionsmodells eine bessere Durchsatzrate im Vergleich zur autoregressiven Generierung von Gemini.
  • 4Mercury 2 vs. Codestral 2501: Mercury 2 erzielt schnellere Ausführungszeiten für latenzempfindliche Anwendungen, obwohl Codestral in bestimmten Programmier-Benchmarks führt.
  • 5Mercury 2 vs DeepSeek V2.5: Mercury 2 reduziert die durchschnittliche Latenzzeit deutlich im Vergleich zu DeepSeek's 2,07 Sekunden.

Häufig gestellte Fragen

+Was ist Mercury 2?

Mercury 2 ist ein diffusion-basiertes Large Language Model (dLLM)-Tool, das von Inception Labs entwickelt wurde und es KI-Entwicklern ermöglicht, ultra-schnelles Denken in Produktions-KI-Workflows zu implementieren. Es ist für eine effiziente multimodale Aufgabenerledigung konzipiert und integriert eine eingebaute Fehlerkorrektur während des Token-Generierungsprozesses.

+Ist Mercury 2 kostenlos?

Mercury 2 verwendet ein Freemium-Preismodell, das bei 0,38 USD pro 1 Million Tokens für Eingaben beginnt.

+Was sind die Hauptmerkmale von Mercury 2?

Wichtige Merkmale umfassen eine Diffusionsarchitektur für die parallele Token-Generierung, Fehlerkorrektur, einstellbare Denklevels, die Handhabung langer Kontexte, Integrationskompatibilität mit der OpenAI-API und Unterstützung für Echtzeit-Sprachanwendungen.

+Wer sollte Mercury 2 verwenden?

KI-Entwickler, KI-Teams in Unternehmen, Produktentwickler und Organisationen, die komplexe Workflows automatisieren, sollten in Erwägung ziehen, Mercury 2 aufgrund seiner Effizienz- und Leistungsvorteile zu nutzen.

+Wie schneidet Mercury 2 im Vergleich zu Alternativen ab?

Mercury 2 bietet erhebliche Geschwindigkeitsvorteile gegenüber traditionellen autoregressiven Modellen, während es gleichzeitig eine wettbewerbsfähige Qualität und niedrigere Betriebskosten gewährleistet.

For builders

This page is doing a job for someone else’s tool.

AI agents read it. Buyers find it. Backlinks accrue. Your tool can have one too — live in 24 hours, indexed by Claude, ChatGPT, and Perplexity, queryable via MCP.