Этот AI Engine использует в 10 раз меньше RAM
Запуск больших AI models локально на вашем телефоне обычно означает разряженную батарею и сбой приложения. Новый inference engine под названием Cactus меняет правила игры, используя zero-copy memory mapping и NPU-first architecture для обеспечения огромной performance с минимальным footprint.