Skip to content
Herramienta de IA

Revisión de SubQ

SubQ es un Large Language Model (LLM) construido sobre una arquitectura de atención dispersa subcuadrática diseñada para una eficiencia y rendimiento extremos en tareas de contexto muy largo.

shipped 18 jun 2026aifreemium
SubQ - AI tool for subq. Professional illustration showing core functionality and features.
1Procesa hasta 12 millones de tokens en una sola instrucción, abordando las limitaciones de los LLM tradicionales.
2Utiliza una arquitectura Subquadratic Sparse Attention (SSA), logrando una complejidad computacional O(n).
3Demuestra 64.5 veces menos cómputo que la atención densa y es 56 veces más rápido que FlashAttention-2 en un contexto de 1M de tokens.
4SubQ 1.1 Small fue lanzado el 16 de junio de 2026 por la startup Subquadratic, con sede en Miami, que obtuvo $29 millones en financiación inicial.

SubQ at a Glance

Pricing
freemium
Key Features
Processes up to 12 million tokens in a single context window, with a future target of 100 million tokens by Q4. · Utilizes Subquadratic Sparse Attention (SSA) for linear scaling of compute with context length, achieving O(n) attention complexity. · Demonstrates up to nearly 1,000x attention compute reduction and runs 56x faster than FlashAttention-2 at 1M tokens.
Alternatives
DeepSeek-V3, Mamba (State Space Models), RWKV, LongGen

Herramientas similares

Comparar alternativas

Otras herramientas que podrías considerar

1

DeepSeek-V3

DeepSeek-V3 utilizes a combination of Multi-head Latent Attention (MLA) and DeepSeek Sparse Attention (DSA) to optimize long-context processing and reduce KV-cache costs.

Visitar
2

Mamba (State Space Models)

Mamba is a novel state-space model architecture that achieves linear scaling with sequence length, offering constant memory inference and strong performance on very long sequences without relying on traditional attention mechanisms.

Ver en Stork
3

RWKV

RWKV is a recurrent neural network (RNN) architecture that combines the strengths of RNNs (linear scaling, constant memory) with the performance of Transformers, enabling efficient processing of extremely long sequences.

Visitar
4

LongGen

LongGen improves both training and inference efficiency for long-context LLMs by integrating context length extension with a GPU-friendly KV cache reduction architecture, utilizing sparse attention patterns and a hybrid layer approach.

Visitar

overview

¿Qué es SubQ?

SubQ es una herramienta Large Language Model (LLM) desarrollada por Subquadratic que permite a desarrolladores, equipos empresariales, ingenieros de datos, investigadores y agentes de codificación razonar a través de contextos de millones de tokens. Utiliza una arquitectura de atención dispersa subcuadrática para una eficiencia y rendimiento mejorados en tareas de contexto muy largo. SubQ está específicamente diseñado para superar las limitaciones de escalado cuadrático de los modelos transformadores estándar, donde los requisitos de cómputo aumentan exponencialmente con la longitud del contexto. Su arquitectura Subquadratic Sparse Attention (SSA) asegura que el cómputo escala aproximadamente linealmente con la longitud de entrada, centrándose en las relaciones de tokens más relevantes. Esto permite a SubQ procesar hasta 12 millones de tokens en una sola instrucción sin una degradación significativa de la calidad, haciéndolo adecuado para tareas de agente de IA complejas y de largo horizonte y análisis de múltiples documentos.

quick facts

Datos Rápidos

AtributoValor
DesarrolladorSubquadratic
Modelo de NegocioFreemium
PreciosFreemium
PlataformasAPI, Línea de comandos (SubQ Code)
API Disponible
IntegracionesClaude Code, Codex, Cursor (para agentes de codificación)
Fundado2026
SedeMiami, EE. UU.
Financiación$29 millones de financiación inicial

features

Características Clave de SubQ

SubQ incorpora varias características técnicas diseñadas para optimizar el rendimiento y la eficiencia en el procesamiento de contexto largo en Large Language Models.

  • 1Arquitectura de atención dispersa subcuadrática (SSA) para un procesamiento eficiente del contexto.
  • 2Razonamiento de millones de tokens, soportando ventanas de contexto de hasta 12 millones de tokens.
  • 3Escalado lineal de costos para el contexto, reduciendo el gasto computacional en comparación con los modelos cuadráticos.
  • 4Recuperación de contexto largo casi perfecta, manteniendo la precisión en entradas extensas.
  • 5Logra 64.5 veces menos cómputo que los mecanismos de atención densa.
  • 6Opera 56 veces más rápido que FlashAttention-2 con una longitud de contexto de 1M de tokens.
  • 7Soporta capacidades de streaming y uso de herramientas a través de su API.
  • 8Proporciona puntos finales de API compatibles con OpenAI para la integración de desarrolladores.
  • 9Incluye redirección automática de turnos de modelo costosos dentro de su producto SubQ Code.
  • 10Ofrece un proceso de instalación de una sola línea para el producto SubQ Code.

use cases

¿Quién debería usar SubQ?

SubQ está diseñado para perfiles profesionales específicos y aplicaciones empresariales que requieren un procesamiento de contexto extenso y alta eficiencia.

  • 1**Ingenieros de Software:** Para analizar bases de código completas, realizar razonamiento a nivel de arquitectura, refactorización entre archivos, rastreo de dependencias e identificación de vulnerabilidades de seguridad.
  • 2**Analistas Financieros y Profesionales Legales:** Para la debida diligencia, razonamiento a través de informes financieros, informes de ganancias, contratos y documentos legales complejos.
  • 3**Investigadores e Ingenieros de Datos:** Para análisis de múltiples documentos, ingesta de miles de páginas de documentos regulatorios o registros médicos para encontrar correlaciones, y soporte de flujos de trabajo de investigación profunda.
  • 4**Desarrolladores y Equipos Empresariales:** Para construir tareas de agente de largo horizonte, integrar razonamiento avanzado de contexto largo en aplicaciones a través de API, y gestionar estados de agente persistentes.

pricing

Precios y Planes de SubQ

SubQ opera bajo un modelo de negocio freemium. Aunque las estructuras de precios por niveles específicas y los costos de uso detallados no se divulgan públicamente, el modelo freemium típicamente implica un nivel gratuito con acceso o características limitadas, junto con niveles de pago que ofrecen capacidades expandidas, límites de uso más altos o soporte avanzado. Subquadratic ha destacado la eficiencia de costos como un beneficio clave, afirmando costos operativos significativamente más bajos para tareas de contexto largo en comparación con alternativas, como aproximadamente 1/20 del costo de Claude Opus para un rendimiento de codificación comparable.

  • 1Freemium: Los detalles específicos de los niveles y los precios no se divulgan públicamente.

competitors

SubQ vs Competidores

SubQ se posiciona frente a los Large Language Models de vanguardia enfatizando su arquitectura subcuadrática y sus capacidades de ventana de contexto significativamente más grandes.

1
DeepSeek-V3

DeepSeek-V3 utilizes a combination of Multi-head Latent Attention (MLA) and DeepSeek Sparse Attention (DSA) to optimize long-context processing and reduce KV-cache costs.

DeepSeek-V3, like SubQ, focuses on efficient long-context handling through sparse attention mechanisms. While both aim for efficiency, there are discussions in the research community regarding whether DeepSeek's sparse attention implementation achieves a truly sub-quadratic complexity across all layers, a core claim of SubQ's architecture.

2

Mamba is a novel state-space model architecture that achieves linear scaling with sequence length, offering constant memory inference and strong performance on very long sequences without relying on traditional attention mechanisms.

Mamba provides a fundamentally different architectural approach to long-context efficiency compared to SubQ's sparse attention. Both aim for linear scaling and high performance on extended contexts, but Mamba achieves this through recurrent state updates rather than attention approximations.

3
RWKV

RWKV is a recurrent neural network (RNN) architecture that combines the strengths of RNNs (linear scaling, constant memory) with the performance of Transformers, enabling efficient processing of extremely long sequences.

Similar to SubQ, RWKV targets linear scaling for long-context tasks to improve efficiency and performance. However, RWKV achieves this through a recurrent design, contrasting with SubQ's sub-quadratic sparse attention, offering an alternative paradigm for efficient long-sequence modeling.

4
LongGen

LongGen improves both training and inference efficiency for long-context LLMs by integrating context length extension with a GPU-friendly KV cache reduction architecture, utilizing sparse attention patterns and a hybrid layer approach.

LongGen directly competes with SubQ in optimizing LLMs for long contexts and efficiency, employing sparse attention and architectural modifications to reduce computational overhead. While SubQ emphasizes a 'fully subquadratic' architecture, LongGen uses a hybrid approach with a mix of full and efficient attention layers.

Preguntas frecuentes

+¿Qué es SubQ?

SubQ es una herramienta Large Language Model (LLM) desarrollada por Subquadratic que permite a desarrolladores, equipos empresariales, ingenieros de datos, investigadores y agentes de codificación razonar a través de contextos de millones de tokens. Utiliza una arquitectura de atención dispersa subcuadrática para una eficiencia y rendimiento mejorados en tareas de contexto muy largo.

+¿Es SubQ gratuito?

SubQ opera bajo un modelo de negocio freemium. Aunque las estructuras de precios por niveles específicas no se detallan públicamente, este modelo típicamente incluye un nivel gratuito con acceso o características limitadas, junto con opciones de pago para capacidades expandidas o mayor uso.

+¿Cuáles son las principales características de SubQ?

Las características clave de SubQ incluyen su arquitectura de atención dispersa subcuadrática, soporte para hasta 12 millones de tokens en una sola instrucción, escalado lineal de costos para el contexto, recuperación de contexto largo casi perfecta, 64.5 veces menos cómputo que la atención densa, y un procesamiento 56 veces más rápido que FlashAttention-2 en un contexto de 1M de tokens. También ofrece puntos finales de API compatibles con OpenAI.

+¿Quién debería usar SubQ?

SubQ está destinado principalmente a ingenieros de software, analistas financieros, profesionales legales, investigadores, ingenieros de datos, desarrolladores y equipos empresariales que requieren un razonamiento avanzado a través de documentos extremadamente largos, bases de código o datos históricos, y para construir agentes de IA de largo horizonte.

+¿Cómo se compara SubQ con las alternativas?

SubQ se diferencia de competidores como Anthropic Claude, Google Gemini, Qwen y DeepSeek-AI principalmente a través de su ventana de contexto declarada de 12 millones de tokens y su arquitectura de atención dispersa totalmente subcuadrática (SSA), que ofrece una eficiencia y rendimiento superiores para tareas de contexto extremo largo, a menudo superando los tamaños de ventana de contexto y las afirmaciones de eficiencia de otros modelos de vanguardia.

For builders

This page is doing a job for someone else’s tool.

AI agents read it. Buyers find it. Backlinks accrue. Your tool can have one too — live in 24 hours, indexed by Claude, ChatGPT, and Perplexity, queryable via MCP.