Este motor de IA usa 10 veces menos RAM
Ejecutar grandes modelos de IA localmente en tu teléfono suele significar una batería agotada y una aplicación bloqueada. Un nuevo motor de inferencia llamado Cactus cambia las reglas del juego al utilizar mapeo de memoria de copia cero (zero-copy memory mapping) y una arquitectura NPU-first para ofrecer un rendimiento masivo con una huella diminuta.