요약 / 핵심 포인트
AI 에이전트에게 6단어 프롬프트 하나가 주어졌고, Microsoft Excel을 복제하기 위해 12일 동안 연속으로 실행되었습니다. 그 결과는 완벽하게 작동하는 복제품이며, 이는 자율 에이전트가 이제 믿을 수 없을 정도로 복잡하고 장시간이 소요되는 작업을 처리할 수 있음을 증명합니다.
앱을 탄생시킨 6단어 프롬프트
Matthew Berman은 간결한 6단어 프롬프트인 '/goal clone Excel, full feature parity.'로 획기적인 실험을 시작했습니다. 이 지시는 "Codex"라는 AI 에이전트에게 Microsoft의 보편적인 스프레드시트 소프트웨어를 복제하는 야심찬 임무를 부여했습니다. 에이전트의 임무는 단순히 모방하는 것이 아니라 완전한 기능적 동등성을 달성하는 것이었습니다.
다음으로 전개된 일은 자율 AI 에이전트 역량의 중요한 도약을 알렸습니다. Codex는 12일 이상 무감독으로 실행되었고, Berman이 수동으로 프로세스를 중단하기 전까지 목표를 향해 부지런히 작업했습니다. 이 전례 없는 끈기는 AI 에이전트가 단기적인 지시 추종자라는 이전의 개념을 깨뜨리고, 장기간에 걸쳐 복잡한 작업을 유지할 수 있는 능력을 보여주었습니다.
이 실험은 심오한 변화를 보여줍니다. AI 에이전트는 단순하고 순차적인 명령을 실행하는 것을 넘어 진화하고 있습니다. 대신, 이제 그들은 Excel 복제와 같은 거대한 목표를 독립적으로 분해하며 장기 목표 추구와 정교한 작업 분해를 보여줍니다. Codex는 실제 Excel 데스크톱 앱의 모든 기능을 분석한 다음, 자체 버전에서 체계적으로 복제하여 복잡하고 자기 주도적인 개발 능력을 입증했습니다.
AI가 구축한 Excel 복제품 해부하기
간결한 6단어 명령에 따라 "Codex"라는 AI 에이전트는 12일간의 야심찬 임무에 착수했습니다. 단순히 코드를 생성한 것이 아니라, Matthew Berman의 컴퓨터에서 Microsoft Excel 데스크톱 버전을 자율적으로 열었습니다. Codex는 라이브 애플리케이션 내의 "모든 단일 기능"을 면밀히 분석하여 그 메커니즘과 사용자 인터페이스를 해체했습니다.
그 결과는 놀랍도록 정확한 Excel 복제품이었습니다. Berman은 핵심 기능의 거의 완벽한 복제를 확인하며 검증된 기능을 선보였습니다. 사용자는 열을 조정하고 강조 표시하고, "1 더하기 2"와 같은 수식을 입력하여 즉시 결과를 얻고, 데이터를 오름차순으로 원활하게 정렬할 수도 있었습니다. 이것은 피상적인 모형이 아니라 깊이 기능적인 복제품이었습니다.
Berman은 품질에 놀라움을 표하며 AI가 구축한 애플리케이션을 "아름답고" "기능적으로 완벽하다"고 묘사했습니다. 그는 핵심 작업에서 원본과 시각적으로 구별할 수 없다고 언급하며 "완벽하다"고 선언했습니다. 12일 이상 실행된 이 자율 프로세스는 복잡한 소프트웨어를 이해하고, 복제하고, 출시하는 AI 에이전트 능력의 중요한 도약을 강조합니다.
여러 날 동안 AI 작업을 가능하게 하는 기술
자율 AI 에이전트는 Berman의 여러 날 실험에서 볼 수 있듯이 근본적인 변화로 빠르게 부상하고 있습니다. 이러한 시스템이 복잡하고 장시간이 소요되는 작업을 완료하는 능력은 약 7개월마다 두 배로 증가하여 단순하고 반응적인 프롬프트의 한계를 넘어섰습니다. 이러한 끊임없는 발전은 AI를 질의응답 엔진에서 능동적이고 끈기 있는 협력자로 변화시킵니다.
이러한 끈기의 기반에는 LangChain과 같은 정교한 에이전트 프레임워크와 하네스가 있습니다. 이러한 아키텍처는 외부 도구를 통합하고 다단계 프로세스를 조율하며 장기 실행 작업에 필수적인 발판을 제공합니다. 이는 내부 상태를 관리하고, 시간이 지남에 따라 일관된 계획을 유지하며, 작업의 반복적인 분석을 촉진하여 에이전트가 전체 기능 복제 Excel과 같은 복잡한 프로젝트를 탐색할 수 있도록 합니다.
며칠에 걸쳐 작동하는 것은 상당한 기술적 난관을 초래합니다: 컨텍스트 드리프트 및 메모리 과부하. 이전 AI 모델은 장시간 세션 동안 집중력과 관련 정보를 유지하는 데 어려움을 겪었습니다. 현대 에이전트 설계는 고급 메모리 시스템, 계층적 계획 모듈 및 선택적 정보 검색을 통해 이러한 문제를 해결하여 에이전트가 초기 목표에 부합하고 시간이 지남에 따라 성능 저하를 방지하도록 합니다. 관련 개발에 대한 자세한 내용은 Codex is becoming a productivity tool for everyone - OpenAI를 참조하십시오.
앱 복제에서 워크플로우 소유로
Berman의 "Excel 복제" 시연은 더 넓은 산업 가속화와 일치하는 강력한 신호입니다. 우리는 단순한 코드 생성을 넘어 AI 기반 애플리케이션 개발 도구와 심층적으로 통합된 AI 생산성 소프트웨어의 급속한 증가를 목격하고 있습니다. 에이전트는 단순한 보조자에서 기존 소프트웨어를 분석하고 사용자 의도를 이해하며 개발 주기를 자율적으로 주도할 수 있는 능동적인 참여자로 진화하고 있습니다.
Enjoying this? Get one like it in your inbox each morning.
one email a day · unsubscribe in two clicks · no third-party tracking
이러한 발전은 AI 에이전트가 영구적이고 정체성을 지닌 소프트웨어 동료가 되는 미래를 가리킵니다. 이들은 복잡한 워크플로우를 자율적으로 관리하고, 여러 애플리케이션 및 서비스에 걸쳐 작업을 조율하며, 인간의 개입을 최소화할 것입니다. Gartner의 2025년 AI 하이프 사이클은 에이전트를 가장 빠르게 발전하는 기술 중 하나로 식별했으며, 2026년까지 통합 AI 동료라는 이러한 현실을 예측했습니다.
이 에이전트 혁명에서 비롯된 경제적 변화는 심오하며 모든 부문에 영향을 미칩니다. 에이전트 AI 시장은 2024년 상당한 50억 달러에서 2034년까지 2000억 달러로 폭발적인 성장을 이룰 것으로 예상됩니다. 이러한 대규모 확장은 주로 기업 자동화에 의해 주도될 것이며, 전 세계 산업 전반의 운영 효율성, 혁신 주기 및 가치 창출을 근본적으로 재정의할 것입니다.
자주 묻는 질문
AI가 Excel을 복제하는 데 어떤 프롬프트가 사용되었습니까?
AI는 Matthew Berman에 의해 간단한 6단어 프롬프트인 '/goal Clone Excel, full feature parity.'를 받았습니다. 이것이 전체 며칠에 걸친 프로세스를 시작했습니다.
AI 에이전트는 중단되기 전까지 얼마나 오래 실행되었습니까?
Codex라고 불리는 AI 에이전트는 Matthew Berman이 수동으로 중단하기 전까지 12일 이상 자율적으로 실행되었습니다. 그는 훨씬 더 오래 계속될 수 있었을 것이라고 추측했습니다.
자율 AI 에이전트란 무엇입니까?
자율 AI 에이전트는 직접적인 인간의 개입 없이 장기간에 걸쳐 복잡하고 다단계적인 작업을 독립적으로 계획, 추론 및 실행할 수 있는 시스템입니다. 이들은 단순한 도구에서 영구적인 '소프트웨어 동료'로 진화하고 있습니다.
복제된 Excel 버전은 완전히 작동했습니까?
복제된 애플리케이션은 조정 가능한 열, 작동하는 수식, 셀 서식 및 데이터 정렬을 포함한 중요한 핵심 기능을 시연했습니다. 이는 표시된 핵심 작업에 대해 '기능 완전'하다고 설명되었습니다.
