Mistral AI Pricing
Shares tags: pricing & licensing, billing units, per token
Preços Acessíveis, Transparentes e Flexíveis para Modelos Open-Source Hospedados
Similar Tools
Other tools you might consider
Mistral AI Pricing
Shares tags: pricing & licensing, billing units, per token
Cohere Usage
Shares tags: pricing & licensing, billing units, per token
OpenAI Usage APIs
Shares tags: pricing & licensing, billing units, per token
AWS Bedrock Token Metering
Shares tags: pricing & licensing, billing units, per token
<a href="https://www.stork.ai/en/together-api-token-pricing" target="_blank" rel="noopener noreferrer"><img src="https://www.stork.ai/api/badge/together-api-token-pricing?style=dark" alt="Together API Token Pricing - Featured on Stork.ai" height="36" /></a>
[](https://www.stork.ai/en/together-api-token-pricing)
overview
O Together API oferece um modelo de preços inteligente baseado em tokens que atende a diversos modelos de código aberto hospedados. Seja para ajuste fino, processamento em lote ou acesso dedicado a GPU, temos uma solução que se adapta às suas necessidades.
features
Aproveite uma variedade de recursos projetados para garantir a eficiência de custos e a clareza no seu processo de faturamento. Nosso modelo transparente permite que você entenda exatamente pelo que está pagando, evitando custos inesperados.
faqs
Obtenha respostas para dúvidas comuns sobre preços e funcionalidades da API Together.
A API Together utiliza uma estrutura de preços em três camadas que inclui pagamento por token para inferência sem servidor, um custo por token para ajustes finos e tarifas horárias para acesso dedicado à nuvem GPU.
A precificação dos tokens é calculada com base no modelo específico utilizado, considerando tanto os tokens de entrada quanto os de saída. Os usuários podem visualizar a contagem exata de tokens e os preços finais durante o processo de tokenização por meio do painel de tarefas ou da linha de comando (CLI).
Sim, com nossa API de inferência em lotes, você pode processar bilhões de tokens a um custo reduzido em 50% para a maioria dos modelos, tornando-a ideal para cargas de trabalho menos sensíveis ao tempo.
For builders
AI agents read it. Buyers find it. Backlinks accrue. Your tool can have one too — live in 24 hours, indexed by Claude, ChatGPT, and Perplexity, queryable via MCP.