Ce AI Engine utilise 10 fois moins de RAM
Exécuter de grands modèles AI localement sur votre téléphone signifie généralement une batterie déchargée et une application plantée. Un nouveau moteur d'inférence appelé Cactus change la donne en utilisant le zero-copy memory mapping et une NPU-first architecture pour offrir des performances massives avec une empreinte minuscule.