Outil d'IA

Runtime Web ONNX

Libérez le potentiel de vos applications web avec une inférence de machine learning haute performance.

shipped 20 nov. 2025deploypaid

DeploySelf-hostedBrowser/WebAssembly

Pourquoi c'est important

1Profitez d'un support WebGPU à la pointe de la technologie pour une inférence GPU accélérée sur plusieurs plateformes.

2Activez des capacités avancées d'IA générative directement dans le navigateur, améliorant ainsi l'expérience utilisateur.

3Offrez une latence réduite et une meilleure confidentialité en exécutant des modèles d'apprentissage automatique sur les appareils des clients.

overview

Qu'est-ce qu'ONNX Runtime Web ?

ONNX Runtime Web est un puissant runtime WASM et WebGPU conçu pour exécuter des modèles ONNX directement sur des appareils clients. Il offre aux développeurs les outils nécessaires pour réaliser des inférences en apprentissage automatique de manière efficace au sein des applications web, tout en maximisant la performance et la flexibilité.

Prend en charge l'inférence à la fois sur CPU et GPU en utilisant WebAssembly et WebGPU.
Optimisé pour les développeurs JavaScript créant des applications multiplateformes.
Assure la compatibilité avec des modèles de langage avancés pour l'IA générative.

features

Fonctionnalités Clés

ONNX Runtime Web intègre plusieurs fonctionnalités robustes pour améliorer le déploiement de l'apprentissage automatique dans le navigateur. Avec l'exécution multi-thread et une intégration simplifiée, ces caractéristiques garantissent des performances élevées et une facilité d'utilisation.

Nouvelle accélération WebGPU pour des capacités de traitement graphique améliorées.
Améliorations continues de l'API pour une intégration facilitée.
Options de déploiement flexibles avec prise en charge des balises de script et des bundlers JavaScript.

use cases

Cas d'utilisation

ONNX Runtime Web est adapté à une variété d'applications nécessitant une inférence en machine learning en temps réel. Que vous développiez des applications web réactives ou déployiez des solutions multiplateformes, ONNX Runtime Web répond à vos besoins.

Applications web interactives nécessitant des réponses instantanées de l'IA.
Applications axées sur la confidentialité où le traitement des données se fait côté client.
Outils alimentés par l'IA qui utilisent des modèles linguistiques avancés pour une interaction améliorée.

Outils similaires

Comparer les alternatives

D'autres outils à considérer

Web Stable Diffusion

Voir sur Stork→

Mistral.rs

Voir sur Stork→

Pyodide + Transformers

Voir sur Stork→

TensorFlow.js

Voir sur Stork→

WebLLM

Voir sur Stork→

Visiter ONNX Runtime Web↗

Contact

𝕏

X / Twittertwitter.com/githubstatus