Skip to content
KI-Werkzeug

SubQ Review

SubQ ist ein Large Language Model (LLM), das auf einer subquadratischen Sparse-Attention-Architektur basiert und für extreme Effizienz und Leistung bei Aufgaben mit sehr langem Kontext entwickelt wurde.

shipped 18. Juni 2026aifreemium
SubQ - AI tool for subq. Professional illustration showing core functionality and features.
1Verarbeitet bis zu 12 Millionen Tokens in einem einzigen Prompt und behebt damit die Einschränkungen traditioneller LLMs.
2Nutzt eine Subquadratic Sparse Attention (SSA)-Architektur und erreicht eine O(n)-Berechnungskomplexität.
3Zeigt 64,5-mal weniger Rechenleistung als Dense Attention und ist 56-mal schneller als FlashAttention-2 bei einem 1M-Token-Kontext.
4SubQ 1.1 Small wurde am 16. Juni 2026 von dem in Miami ansässigen Startup Subquadratic veröffentlicht, das 29 Millionen US-Dollar an Seed-Finanzierung erhalten hat.

SubQ at a Glance

Pricing
freemium
Key Features
Processes up to 12 million tokens in a single context window, with a future target of 100 million tokens by Q4. · Utilizes Subquadratic Sparse Attention (SSA) for linear scaling of compute with context length, achieving O(n) attention complexity. · Demonstrates up to nearly 1,000x attention compute reduction and runs 56x faster than FlashAttention-2 at 1M tokens.
Alternatives
DeepSeek-V3, Mamba (State Space Models), RWKV, LongGen

Ähnliche Tools

Alternativen vergleichen

Andere Tools, die Sie in Betracht ziehen könnten

1

DeepSeek-V3

DeepSeek-V3 utilizes a combination of Multi-head Latent Attention (MLA) and DeepSeek Sparse Attention (DSA) to optimize long-context processing and reduce KV-cache costs.

Besuchen
2

Mamba (State Space Models)

Mamba is a novel state-space model architecture that achieves linear scaling with sequence length, offering constant memory inference and strong performance on very long sequences without relying on traditional attention mechanisms.

Auf Stork ansehen
3

RWKV

RWKV is a recurrent neural network (RNN) architecture that combines the strengths of RNNs (linear scaling, constant memory) with the performance of Transformers, enabling efficient processing of extremely long sequences.

Besuchen
4

LongGen

LongGen improves both training and inference efficiency for long-context LLMs by integrating context length extension with a GPU-friendly KV cache reduction architecture, utilizing sparse attention patterns and a hybrid layer approach.

Besuchen

overview

Was ist SubQ?

SubQ ist ein Large Language Model (LLM)-Tool, das von Subquadratic entwickelt wurde und es Entwicklern, Unternehmensteams, Dateningenieuren, Forschern und Coding Agents ermöglicht, über Kontexte von mehreren Millionen Tokens hinweg zu argumentieren. Es nutzt eine subquadratische Sparse-Attention-Architektur für verbesserte Effizienz und Leistung bei Aufgaben mit sehr langem Kontext. SubQ wurde speziell entwickelt, um die quadratischen Skalierungsbeschränkungen von Standard-Transformer-Modellen zu überwinden, bei denen die Rechenanforderungen exponentiell mit der Kontextlänge steigen. Seine Subquadratic Sparse Attention (SSA)-Architektur stellt sicher, dass die Rechenleistung annähernd linear mit der Eingabelänge skaliert, wobei der Fokus auf den relevantesten Token-Beziehungen liegt. Dies ermöglicht SubQ, bis zu 12 Millionen Tokens in einem einzigen Prompt ohne signifikanten Qualitätsverlust zu verarbeiten, wodurch es für komplexe, langfristige AI-Agentenaufgaben und die Analyse mehrerer Dokumente geeignet ist.

quick facts

Kurzfakten

AttributWert
EntwicklerSubquadratic
GeschäftsmodellFreemium
PreisgestaltungFreemium
PlattformenAPI, Kommandozeile (SubQ Code)
API VerfügbarJa
IntegrationenClaude Code, Codex, Cursor (für Coding Agents)
Gegründet2026
HauptsitzMiami, USA
Finanzierung29 Millionen US-Dollar Seed-Finanzierung

features

Hauptmerkmale von SubQ

SubQ integriert mehrere technische Merkmale, die darauf ausgelegt sind, Leistung und Effizienz für die Langkontextverarbeitung in Large Language Models zu optimieren.

  • 1Subquadratische Sparse-Attention-Architektur (SSA) für effiziente Kontextverarbeitung.
  • 2Argumentation über mehrere Millionen Tokens hinweg, unterstützt Kontextfenster von bis zu 12 Millionen Tokens.
  • 3Lineare Kostenskalierung für den Kontext, reduziert den Rechenaufwand im Vergleich zu quadratischen Modellen.
  • 4Nahezu perfekte Langkontext-Retrieval, bewahrt die Genauigkeit über umfangreiche Eingaben hinweg.
  • 5Erreicht 64,5-mal weniger Rechenleistung als Dense-Attention-Mechanismen.
  • 6Arbeitet 56-mal schneller als FlashAttention-2 bei einer 1M-Token-Kontextlänge.
  • 7Unterstützt Streaming- und Tool-Nutzungsfunktionen über seine API.
  • 8Bietet OpenAI-kompatible API-Endpunkte für die Entwicklerintegration.
  • 9Beinhaltet die automatische Umleitung teurer Modell-Turns innerhalb seines SubQ Code-Produkts.
  • 10Bietet einen Ein-Zeilen-Installationsprozess für das SubQ Code-Produkt.

use cases

Wer sollte SubQ nutzen?

SubQ wurde für spezifische berufliche Personas und Unternehmensanwendungen entwickelt, die eine umfangreiche Kontextverarbeitung und hohe Effizienz erfordern.

  • 1**Software-Ingenieure:** Für die Analyse ganzer Codebasen, die Durchführung von Argumentationen auf Architekturebene, dateiübergreifendes Refactoring, Abhängigkeitsverfolgung und die Identifizierung von Sicherheitslücken.
  • 2**Finanzanalysten & Juristen:** Für Due Diligence, Argumentationen über Finanzberichte, Gewinnberichte, Verträge und komplexe Rechtsdokumente.
  • 3**Forscher & Dateningenieure:** Für die Analyse mehrerer Dokumente, das Einlesen tausender Seiten von behördlichen Einreichungen oder Krankenakten zur Korrelationsfindung und zur Unterstützung tiefer Forschungs-Workflows.
  • 4**Entwickler & Unternehmensteams:** Für den Aufbau langfristiger Agentenaufgaben, die Integration fortschrittlicher Langkontext-Argumentation in Anwendungen über API und die Verwaltung persistenter Agentenzustände.

pricing

SubQ Preise & Pläne

SubQ basiert auf einem Freemium-Geschäftsmodell. Obwohl spezifische gestaffelte Preisstrukturen und detaillierte Nutzungskosten nicht öffentlich bekannt gegeben werden, impliziert das Freemium-Modell typischerweise eine kostenlose Stufe mit begrenztem Zugang oder Funktionen, zusammen mit kostenpflichtigen Stufen, die erweiterte Funktionen, höhere Nutzungslimits oder erweiterten Support bieten. Subquadratic hat die Kosteneffizienz als Hauptvorteil hervorgehoben und behauptet, dass die Betriebskosten für Langkontextaufgaben im Vergleich zu Alternativen deutlich niedriger sind, wie zum Beispiel etwa 1/20 der Kosten von Claude Opus für vergleichbare Codierungsleistung.

  • 1Freemium: Spezifische Stufendetails und Preise werden nicht öffentlich bekannt gegeben.

competitors

SubQ vs. Wettbewerber

SubQ positioniert sich gegenüber führenden Large Language Models, indem es seine subquadratische Architektur und deutlich größere Kontextfenster-Fähigkeiten hervorhebt.

1
DeepSeek-V3

DeepSeek-V3 utilizes a combination of Multi-head Latent Attention (MLA) and DeepSeek Sparse Attention (DSA) to optimize long-context processing and reduce KV-cache costs.

DeepSeek-V3, like SubQ, focuses on efficient long-context handling through sparse attention mechanisms. While both aim for efficiency, there are discussions in the research community regarding whether DeepSeek's sparse attention implementation achieves a truly sub-quadratic complexity across all layers, a core claim of SubQ's architecture.

2

Mamba is a novel state-space model architecture that achieves linear scaling with sequence length, offering constant memory inference and strong performance on very long sequences without relying on traditional attention mechanisms.

Mamba provides a fundamentally different architectural approach to long-context efficiency compared to SubQ's sparse attention. Both aim for linear scaling and high performance on extended contexts, but Mamba achieves this through recurrent state updates rather than attention approximations.

3
RWKV

RWKV is a recurrent neural network (RNN) architecture that combines the strengths of RNNs (linear scaling, constant memory) with the performance of Transformers, enabling efficient processing of extremely long sequences.

Similar to SubQ, RWKV targets linear scaling for long-context tasks to improve efficiency and performance. However, RWKV achieves this through a recurrent design, contrasting with SubQ's sub-quadratic sparse attention, offering an alternative paradigm for efficient long-sequence modeling.

4
LongGen

LongGen improves both training and inference efficiency for long-context LLMs by integrating context length extension with a GPU-friendly KV cache reduction architecture, utilizing sparse attention patterns and a hybrid layer approach.

LongGen directly competes with SubQ in optimizing LLMs for long contexts and efficiency, employing sparse attention and architectural modifications to reduce computational overhead. While SubQ emphasizes a 'fully subquadratic' architecture, LongGen uses a hybrid approach with a mix of full and efficient attention layers.

Häufig gestellte Fragen

+Was ist SubQ?

SubQ ist ein Large Language Model (LLM)-Tool, das von Subquadratic entwickelt wurde und es Entwicklern, Unternehmensteams, Dateningenieuren, Forschern und Coding Agents ermöglicht, über Kontexte von mehreren Millionen Tokens hinweg zu argumentieren. Es nutzt eine subquadratische Sparse-Attention-Architektur für verbesserte Effizienz und Leistung bei Aufgaben mit sehr langem Kontext.

+Ist SubQ kostenlos?

SubQ basiert auf einem Freemium-Geschäftsmodell. Obwohl spezifische gestaffelte Preisstrukturen nicht öffentlich detailliert sind, beinhaltet dieses Modell typischerweise eine kostenlose Stufe mit begrenztem Zugang oder Funktionen, zusammen mit kostenpflichtigen Optionen für erweiterte Funktionen oder höhere Nutzung.

+Was sind die Hauptmerkmale von SubQ?

Zu den Hauptmerkmalen von SubQ gehören seine subquadratische Sparse-Attention-Architektur, die Unterstützung von bis zu 12 Millionen Tokens in einem einzigen Prompt, die lineare Kostenskalierung für den Kontext, die nahezu perfekte Langkontext-Retrieval, 64,5-mal weniger Rechenleistung als Dense Attention und eine 56-mal schnellere Verarbeitung als FlashAttention-2 bei einem 1M-Token-Kontext. Es bietet auch OpenAI-kompatible API-Endpunkte.

+Wer sollte SubQ nutzen?

SubQ ist primär für Software-Ingenieure, Finanzanalysten, Juristen, Forscher, Dateningenieure, Entwickler und Unternehmensteams gedacht, die eine fortgeschrittene Argumentation über extrem lange Dokumente, Codebasen oder historische Daten benötigen und für den Aufbau langfristiger KI-Agenten.

+Wie schneidet SubQ im Vergleich zu Alternativen ab?

SubQ unterscheidet sich von Wettbewerbern wie Anthropic Claude, Google Gemini, Qwen und DeepSeek-AI hauptsächlich durch sein beanspruchtes 12-Millionen-Token-Kontextfenster und seine vollständig subquadratische Sparse-Attention-Architektur (SSA), die überlegene Effizienz und Leistung für extrem lange Kontextaufgaben bietet und oft die Kontextfenstergrößen und Effizienzansprüche anderer führender Modelle übertrifft.

For builders

This page is doing a job for someone else’s tool.

AI agents read it. Buyers find it. Backlinks accrue. Your tool can have one too — live in 24 hours, indexed by Claude, ChatGPT, and Perplexity, queryable via MCP.