Кратко / Главное
Агенту ИИ была дана одна подсказка из шести слов, и он работал 12 дней подряд, чтобы клонировать Microsoft Excel. Результатом является полностью функциональная реплика, доказывающая, что автономные агенты теперь могут справляться с невероятно сложными и продолжительными задачами.
Подсказка из шести слов, которая породила приложение
Мэттью Берман инициировал новаторский эксперимент с краткой подсказкой из шести слов: '/goal clone Excel, full feature parity.' Эта инструкция поставила агента ИИ, названного «Codex», перед амбициозной миссией по репликации повсеместно распространенного программного обеспечения для электронных таблиц от Microsoft. Задача агента заключалась не просто в имитации, а в достижении полного функционального эквивалента.
То, что произошло дальше, ознаменовало значительный скачок в возможностях автономных агентов ИИ. Codex работал без присмотра более 12 дней, усердно продвигаясь к своей цели, прежде чем Берман вручную остановил процесс. Эта беспрецедентная настойчивость разрушила прежние представления об агентах ИИ как о исполнителях короткоцикловых инструкций, продемонстрировав способность поддерживать сложные операции в течение длительных периодов.
Этот эксперимент иллюстрирует глубокий сдвиг: агенты ИИ развиваются за пределы выполнения простых, последовательных команд. Вместо этого они теперь демонстрируют долгосрочное преследование целей и сложную декомпозицию задач, самостоятельно разбивая такую масштабную цель, как клонирование Excel. Codex проанализировал каждую функцию в реальном настольном приложении Excel, а затем систематически воспроизвел их в своей собственной версии, доказав свою способность к сложному, самонаправленному развитию.
Деконструкция клона Excel, созданного ИИ
По подсказке из краткой команды из шести слов, агент ИИ, названный «Codex», приступил к амбициозной двенадцатидневной миссии. Он не просто генерировал код; он автономно открыл настольную версию Microsoft Excel непосредственно на машине Мэттью Бермана. Затем Codex тщательно проанализировал «каждую отдельную функцию» в работающем приложении, деконструируя его механику и пользовательский интерфейс.
Результатом стал потрясающе точный клон Excel. Берман продемонстрировал его проверенные функциональные возможности, подтвердив почти идеальное воспроизведение основных функций. Пользователи могли настраивать и выделять столбцы, вводить формулы, такие как «один плюс два», для мгновенного вывода, и даже беспрепятственно сортировать данные по возрастанию. Это был не поверхностный макет; это была глубоко функциональная реплика.
Берман выразил изумление качеством, описав приложение, созданное ИИ, как «красивое» и «полнофункциональное». Он отметил его визуальную неотличимость от оригинала для основных операций, провозгласив его «идеальным». Этот автономный процесс, работавший более 12 дней, подчеркивает значительный скачок в способности агентов ИИ понимать, воспроизводить и поставлять сложное программное обеспечение.
Технологии, обеспечивающие многодневные задачи ИИ
Автономные агенты ИИ быстро становятся фундаментальным сдвигом, что подтверждается многодневным экспериментом Бермана. Способность этих систем выполнять сложные, продолжительные задачи удваивается примерно каждые семь месяцев, расширяя границы за пределы простых, реактивных подсказок. Этот неустанный прогресс превращает ИИ из движка запросов-ответов в проактивного, настойчивого сотрудника.
В основе этой настойчивости лежат сложные фреймворки агентов и связки, такие как LangChain. Эти архитектуры обеспечивают критически важную основу для длительных операций, интегрируя внешние инструменты и организуя многоэтапные процессы. Они управляют внутренним состоянием, поддерживают согласованный план с течением времени и облегчают итеративный анализ задач, позволяя агентам управлять сложными проектами, такими как полнофункциональный клон Excel.
Работа в течение нескольких дней создает значительные технические препятствия: дрейф контекста и перегрузка памяти. Ранние модели ИИ с трудом сохраняли фокус и релевантную информацию на протяжении длительных сессий. Современные архитектуры агентов борются с этими проблемами с помощью передовых систем памяти, модулей иерархического планирования и избирательного поиска информации, гарантируя, что агент остается согласованным со своей первоначальной целью и предотвращая снижение производительности со временем. Для получения дополнительной информации о связанных разработках см. Codex is becoming a productivity tool for everyone - OpenAI.
От клонирования приложений к управлению рабочими процессами
Демонстрация Бермана «клонирование Excel» является мощным сигналом, соответствующим более широкому ускорению в отрасли. Мы наблюдаем быстрый рост инструментов разработки приложений на базе ИИ и глубоко интегрированного программного обеспечения для повышения производительности ИИ, выходящего за рамки простой генерации кода. Агенты эволюционируют от простых помощников к активным участникам, способным анализировать существующее программное обеспечение, понимать намерения пользователя и автономно управлять циклами разработки.
Enjoying this? Get one like it in your inbox each morning.
one email a day · unsubscribe in two clicks · no third-party tracking
Это развитие указывает на будущее, где ИИ-агенты станут постоянными, обладающими идентичностью программными коллегами. Они будут автономно управлять сложными рабочими процессами, организуя задачи в различных приложениях и сервисах, минимизируя человеческое вмешательство. Цикл хайпа Gartner 2025 года для ИИ определил агентов как одну из самых быстроразвивающихся технологий, прогнозируя эту реальность интегрированных ИИ-коллег к 2026 году.
Экономические изменения, вызванные этой агентной революцией, глубоки и затрагивают каждый сектор. Рынок агентного ИИ прогнозируется на взрывной рост, от значительных 5 миллиардов долларов в 2024 году до 200 миллиардов долларов к 2034 году. Это масштабное расширение будет в основном обусловлено автоматизацией предприятий, фундаментально переопределяя операционную эффективность, инновационные циклы и создание стоимости в отраслях по всему миру.
Часто задаваемые вопросы
Какой запрос был использован, чтобы заставить ИИ клонировать Excel?
ИИ был дан простой запрос из шести слов от Мэтью Бермана: '/goal Clone Excel, full feature parity.' Это запустило весь многодневный процесс.
Как долго работал ИИ-агент, прежде чем его остановили?
ИИ-агент, называемый Codex, работал автономно более 12 дней, прежде чем Мэтью Берман вручную остановил его. Он предположил, что он мог бы работать гораздо дольше.
Что такое автономные ИИ-агенты?
Автономные ИИ-агенты — это системы, которые могут независимо планировать, рассуждать и выполнять сложные, многоэтапные задачи в течение длительных периодов без прямого вмешательства человека. Они эволюционируют от простых инструментов в постоянных «программных коллег».
Была ли клонированная версия Excel полностью функциональной?
Клонированное приложение продемонстрировало значительную основную функциональность, включая регулируемые столбцы, рабочие формулы, форматирование ячеек и сортировку данных. Оно было описано как «полнофункциональное» для показанных основных задач.
