WebLLM
Shares tags: deploy, self-hosted, browser/webassembly
Experimente modelos de linguagem de ponta com o WebLLM – totalmente do lado do cliente e com aceleração por hardware.
Ferramentas similares
Outras ferramentas a considerar
WebLLM
Shares tags: deploy, self-hosted, browser/webassembly
WebLLM
Shares tags: deploy, self-hosted, browser/webassembly
Web Stable Diffusion
Shares tags: deploy, self-hosted, browser/webassembly
Mistral.rs
Shares tags: deploy, self-hosted, browser/webassembly
<a href="https://www.stork.ai/en/webllm" target="_blank" rel="noopener noreferrer"><img src="https://www.stork.ai/api/badge/webllm?style=dark" alt="WebLLM - Featured on Stork.ai" height="36" /></a>
[](https://www.stork.ai/en/webllm)
overview
WebLLM é um projeto inovador que permite que modelos de linguagem de grande porte quantizados sejam executados totalmente no navegador utilizando WebGPU e WebAssembly. Essa inovação traz o poder da IA diretamente para os dispositivos dos usuários, mantendo altos padrões de privacidade e desempenho.
features
WebLLM oferece uma impressionante variedade de recursos projetados para desenvolvedores e entusiastas de IA. Com suporte para várias funcionalidades avançadas, você pode personalizar a ferramenta para atender às suas necessidades específicas.
use cases
WebLLM abre a porta para uma infinidade de aplicações, desde assistentes web impulsionados por IA até ferramentas sofisticadas de geração de conteúdo. Sua flexibilidade permite soluções inovadoras em diversos setores.
WebLLM suporta uma variedade de modelos open-source recentes, incluindo Llama 3, Phi 3 e Mistral, tornando-o versátil para diversas aplicações.
Ao processar todos os cálculos no lado do cliente, o WebLLM garante que seus dados permaneçam privados e seguros.
Sim! O WebLLM está disponível como um pacote NPM/Yarn e pode ser facilmente integrado em aplicações web existentes ou utilizado via CDN.
Mais no Stork
Mais ferramentas nesta categoria, classificadas por sinal da comunidade
Piodeto + Transformadores
🧩 Deploy
Tempo de execução Python compilado para WASM para tarefas de ML do navegador.
Mistral.rs
🧩 Deploy
Tempo de execução Rust + WASM para pequenos LLMs em navegadores.
WebLLM
🧩 Deploy
Executa LLMs quantizados totalmente no navegador via WebGPU/WebAssembly.
Difusão estável na web
🧩 Deploy
Difusão estável no dispositivo em execução no navegador.
WebLLM
🧩 Deploy
Executa LLMs diretamente no navegador via WebGPU/WebAssembly.
IA do Azure Stack Hub
🧩 Deploy
Serviços do Azure fornecidos no local para cargas de trabalho regulamentadas.
For builders
AI agents read it. Buyers find it. Backlinks accrue. Your tool can have one too — live in 24 hours, indexed by Claude, ChatGPT, and Perplexity, queryable via MCP.