Skip to content
AIツール

SubQ レビュー

SubQは、非常に長いコンテキストタスクにおいて極限の効率とパフォーマンスを実現するために設計された、劣二次疎注意アーキテクチャに基づいて構築された大規模言語モデル(LLM)です。

shipped 2026年6月18日aifreemium
SubQ - AI tool for subq. Professional illustration showing core functionality and features.
1単一のプロンプトで最大1,200万トークンを処理し、従来のLLMの制限に対処します。
2劣二次疎注意(SSA)アーキテクチャを利用し、O(n)の計算複雑性を実現します。
3高密度注意よりも64.5倍少ない計算量で、100万トークンのコンテキストではFlashAttention-2よりも56倍高速です。
4SubQ 1.1 Smallは、2026年6月16日にマイアミを拠点とするスタートアップSubquadraticによってリリースされました。同社は2,900万ドルのシード資金を確保しています。

SubQ at a Glance

Pricing
freemium
Key Features
Processes up to 12 million tokens in a single context window, with a future target of 100 million tokens by Q4. · Utilizes Subquadratic Sparse Attention (SSA) for linear scaling of compute with context length, achieving O(n) attention complexity. · Demonstrates up to nearly 1,000x attention compute reduction and runs 56x faster than FlashAttention-2 at 1M tokens.
Alternatives
DeepSeek-V3, Mamba (State Space Models), RWKV, LongGen

類似ツール

代替製品を比較

検討すべき他のツール

1

DeepSeek-V3

DeepSeek-V3 utilizes a combination of Multi-head Latent Attention (MLA) and DeepSeek Sparse Attention (DSA) to optimize long-context processing and reduce KV-cache costs.

訪問
2

Mamba (State Space Models)

Mamba is a novel state-space model architecture that achieves linear scaling with sequence length, offering constant memory inference and strong performance on very long sequences without relying on traditional attention mechanisms.

Storkで見る
3

RWKV

RWKV is a recurrent neural network (RNN) architecture that combines the strengths of RNNs (linear scaling, constant memory) with the performance of Transformers, enabling efficient processing of extremely long sequences.

訪問
4

LongGen

LongGen improves both training and inference efficiency for long-context LLMs by integrating context length extension with a GPU-friendly KV cache reduction architecture, utilizing sparse attention patterns and a hybrid layer approach.

訪問

overview

SubQとは?

SubQは、Subquadraticが開発した大規模言語モデル(LLM)ツールであり、開発者、エンタープライズチーム、データエンジニア、研究者、およびコーディングエージェントが数百万トークンのコンテキスト全体で推論することを可能にします。非常に長いコンテキストタスクにおいて、強化された効率とパフォーマンスのために劣二次疎注意アーキテクチャを利用しています。SubQは、コンテキスト長とともに計算要件が指数関数的に増加する標準的なtransformerモデルの二次スケーリングの制限を克服するために特別に設計されています。その劣二次疎注意(SSA)アーキテクチャは、計算が入力長に対してほぼ線形にスケーリングされ、最も関連性の高いトークン関係に焦点を当てることを保証します。これにより、SubQは単一のプロンプトで最大1,200万トークンを品質を大幅に低下させることなく処理でき、複雑な長期的AIエージェントタスクや複数文書分析に適しています。

quick facts

基本情報

属性
開発元Subquadratic
ビジネスモデルFreemium
価格Freemium
プラットフォームAPI, コマンドライン (SubQ Code)
API利用可能はい
統合Claude Code, Codex, Cursor (コーディングエージェント向け)
設立2026
本社Miami, USA
資金調達2,900万ドルのシード資金

features

SubQの主な機能

SubQは、大規模言語モデルにおける長文コンテキスト処理のパフォーマンスと効率を最適化するために設計された、いくつかの技術的機能を組み込んでいます。

  • 1効率的なコンテキスト処理のための劣二次疎注意アーキテクチャ(SSA)。
  • 2数百万トークンの推論、最大1,200万トークンのコンテキストウィンドウをサポート。
  • 3コンテキストの線形コストスケーリングにより、二次モデルと比較して計算コストを削減。
  • 4ほぼ完璧な長文コンテキスト検索により、広範な入力全体で精度を維持。
  • 5高密度注意メカニズムよりも64.5倍少ない計算量を実現。
  • 6100万トークンのコンテキスト長でFlashAttention-2よりも56倍高速に動作。
  • 7APIを介したストリーミングおよびツール利用機能をサポート。
  • 8開発者統合のためのOpenAI互換APIエンドポイントを提供。
  • 9SubQ Code製品内で高価なモデルターンの自動リダイレクト機能を含む。
  • 10SubQ Code製品のワンラインインストールプロセスを提供。

use cases

SubQは誰が使うべきか?

SubQは、広範なコンテキスト処理と高い効率を必要とする特定の専門職のペルソナおよびエンタープライズアプリケーション向けに設計されています。

  • 1**ソフトウェアエンジニア:** コードベース全体の分析、アーキテクチャレベルの推論、ファイル間リファクタリング、依存関係の追跡、セキュリティ脆弱性の特定に。
  • 2**金融アナリストおよび法務専門家:** デューデリジェンス、財務書類、決算報告書、契約書、複雑な法的文書全体での推論に。
  • 3**研究者およびデータエンジニア:** 複数文書分析、数千ページにわたる規制当局への提出書類や医療記録を取り込んで相関関係を見つけ、深い研究ワークフローをサポートするために。
  • 4**開発者およびエンタープライズチーム:** 長期的なエージェントタスクの構築、APIを介した高度な長文コンテキスト推論のアプリケーションへの統合、永続的なエージェント状態の管理に。

pricing

SubQの価格とプラン

SubQはFreemiumビジネスモデルで運営されています。具体的な段階的価格設定構造や詳細な使用コストは公開されていませんが、Freemiumモデルは通常、限られたアクセスまたは機能を備えた無料ティアと、拡張された機能、より高い使用制限、または高度なサポートを提供する有料ティアを意味します。Subquadraticは、コスト効率を主要な利点として強調しており、同等のコーディングパフォーマンスを持つClaude Opusの約20分の1のコストなど、代替品と比較して長文コンテキストタスクの運用コストが大幅に低いと主張しています。

  • 1Freemium:具体的なティアの詳細と価格は公開されていません。

competitors

SubQと競合他社

SubQは、その劣二次アーキテクチャと大幅に大きなコンテキストウィンドウ機能を強調することで、フロンティア大規模言語モデルに対して自らを位置づけています。

1
DeepSeek-V3

DeepSeek-V3 utilizes a combination of Multi-head Latent Attention (MLA) and DeepSeek Sparse Attention (DSA) to optimize long-context processing and reduce KV-cache costs.

DeepSeek-V3, like SubQ, focuses on efficient long-context handling through sparse attention mechanisms. While both aim for efficiency, there are discussions in the research community regarding whether DeepSeek's sparse attention implementation achieves a truly sub-quadratic complexity across all layers, a core claim of SubQ's architecture.

2

Mamba is a novel state-space model architecture that achieves linear scaling with sequence length, offering constant memory inference and strong performance on very long sequences without relying on traditional attention mechanisms.

Mamba provides a fundamentally different architectural approach to long-context efficiency compared to SubQ's sparse attention. Both aim for linear scaling and high performance on extended contexts, but Mamba achieves this through recurrent state updates rather than attention approximations.

3
RWKV

RWKV is a recurrent neural network (RNN) architecture that combines the strengths of RNNs (linear scaling, constant memory) with the performance of Transformers, enabling efficient processing of extremely long sequences.

Similar to SubQ, RWKV targets linear scaling for long-context tasks to improve efficiency and performance. However, RWKV achieves this through a recurrent design, contrasting with SubQ's sub-quadratic sparse attention, offering an alternative paradigm for efficient long-sequence modeling.

4
LongGen

LongGen improves both training and inference efficiency for long-context LLMs by integrating context length extension with a GPU-friendly KV cache reduction architecture, utilizing sparse attention patterns and a hybrid layer approach.

LongGen directly competes with SubQ in optimizing LLMs for long contexts and efficiency, employing sparse attention and architectural modifications to reduce computational overhead. While SubQ emphasizes a 'fully subquadratic' architecture, LongGen uses a hybrid approach with a mix of full and efficient attention layers.

よくある質問

+SubQとは何ですか?

SubQは、Subquadraticが開発した大規模言語モデル(LLM)ツールであり、開発者、エンタープライズチーム、データエンジニア、研究者、およびコーディングエージェントが数百万トークンのコンテキスト全体で推論することを可能にします。非常に長いコンテキストタスクにおいて、強化された効率とパフォーマンスのために劣二次疎注意アーキテクチャを利用しています。

+SubQは無料ですか?

SubQはFreemiumビジネスモデルで運営されています。具体的な段階的価格設定構造は公開されていませんが、このモデルは通常、限られたアクセスまたは機能を備えた無料ティアと、拡張された機能またはより高い使用量のための有料オプションを含みます。

+SubQの主な機能は何ですか?

SubQの主な機能には、劣二次疎注意アーキテクチャ、単一プロンプトで最大1,200万トークンのサポート、コンテキストの線形コストスケーリング、ほぼ完璧な長文コンテキスト検索、高密度注意よりも64.5倍少ない計算量、100万トークンのコンテキストでFlashAttention-2よりも56倍高速な処理が含まれます。また、OpenAI互換のAPIエンドポイントも提供しています。

+SubQは誰が使うべきですか?

SubQは主に、非常に長い文書、コードベース、または履歴データ全体での高度な推論を必要とするソフトウェアエンジニア、金融アナリスト、法務専門家、研究者、データエンジニア、開発者、およびエンタープライズチーム、ならびに長期的AIエージェントの構築を目的としています。

+SubQは代替品とどう比較されますか?

SubQは、Anthropic Claude、Google Gemini、Qwen、DeepSeek-AIなどの競合他社と、主にその主張する1,200万トークンのコンテキストウィンドウと、極端な長文コンテキストタスクで優れた効率とパフォーマンスを提供する完全な劣二次疎注意アーキテクチャ(SSA)によって差別化を図っており、他のフロンティアモデルのコンテキストウィンドウサイズと効率性の主張をしばしば上回っています。

Storkでもっと

関連AIツール

このカテゴリの他のツール(コミュニティ評価順)

ディレクトリ全体を見る →

For builders

This page is doing a job for someone else’s tool.

AI agents read it. Buyers find it. Backlinks accrue. Your tool can have one too — live in 24 hours, indexed by Claude, ChatGPT, and Perplexity, queryable via MCP.