Skip to content

당신의 AI 코더에게 하네스가 필요합니다

Anthropic은 대규모 코드베이스에서 코딩할 때 AI 주변 도구가 모델 자체보다 더 중요하다는 것을 밝혔습니다. 이 문서는 그 '하네스'를 구축하고 AI 에이전트를 실제로 효과적으로 만드는 방법을 담은 플레이북입니다.

Stork.AI
Hero image for: 당신의 AI 코더에게 하네스가 필요합니다
💡

요약 / 핵심 포인트

Anthropic은 대규모 코드베이스에서 코딩할 때 AI 주변 도구가 모델 자체보다 더 중요하다는 것을 밝혔습니다. 이 문서는 그 '하네스'를 구축하고 AI 에이전트를 실제로 효과적으로 만드는 방법을 담은 플레이북입니다.

하네스는 새로운 유행입니다

표준 AI 코딩 에이전트는 실제 코드베이스의 방대한 복잡성에 직면했을 때 지속적으로 실패합니다. 종종 그들의 능력이 선전되는 이 시스템들은 수만 또는 수십만 줄의 코드로 이루어진 환경에서 극적으로 흔들리며, 복잡한 아키텍처와 레거시 시스템을 탐색하는 데 필요한 중요한 상황 인식이 부족합니다. 간단한 프로젝트에서 효과적인 전략은 빠르게 부적절하다는 것이 입증되어, 자율 작동의 근본적인 한계를 드러냅니다.

Anthropic은 최근 이 정확한 과제에 대한 MasterClass를 제공하며 강력한 핵심 주장을 펼쳤습니다. 즉, AI 에이전트를 둘러싼 하네스가 기본 대규모 언어 모델(LLM) 자체의 순수한 능력보다 더 중요하다는 것입니다. 벤치마크 점수뿐만 아니라 도구, 컨텍스트 및 구성으로 이루어진 이 생태계가 에이전트의 성공을 좌우합니다. 이는 에이전트를 안내하고 수백만 줄의 monorepos 또는 분산 시스템에서 효과적으로 작동할 수 있도록 올바른 환경을 조성하는 것입니다.

이 필수적인 하네스는 이제 현대 코드베이스의 새롭고 필수적인 세 번째 구성 요소인 AI Layer로 적절하게 명명되었습니다. 이는 전통적인 애플리케이션 코드 및 관련 테스트와 함께 존재하며, 에이전트 시스템을 위한 명시적인 가이드 역할을 합니다. AI Layer는 전역 규칙, 경로 범위 기술, 자체 개선 훅, 그리고 Model Context Protocol (MCP) 서버와 같은 요소들로 구성되며, 이 모든 것은 에이전트가 복잡한 작업을 안정적으로 수행하는 데 필요한 구조화된 컨텍스트를 제공하도록 설계되었습니다.

AI Layer 설계하기

효과적인 AI Layer를 설계하는 것은 `claude.md` 파일로 대표되는 간결하고 계층적인(Lean & Layered) 규칙 시스템으로 시작됩니다. 루트 수준의 `claude.md` 파일은 전역 컨텍스트, 즉 핵심 코드베이스 목적과 전반적인 규칙을 설정합니다. 하위 디렉토리 `claude.md` 파일은 점진적으로 공개되는 범위 지정 규칙을 도입하여, 에이전트에게 불필요한 세부 정보로 과부하를 주지 않으면서 특정 모듈 또는 기능에 대한 관련성 있고 지역화된 규칙을 제공합니다. 이러한 계층적 구조는 컨텍스트가 항상 정확하고 관리 가능하도록 보장합니다.

정적 규칙을 넘어, 동적 기능은 매우 중요합니다. 경로 범위 기술(Path-Scoped Skills)은 에이전트에게 특수 도구를 제공하여 특정 코드베이스 영역 내에서 목표 지향적인 작업을 가능하게 합니다. 이를 보완하는 것은 효율적인 심볼 검색 시스템인 Model Context Protocol (MCP)입니다. MCP는 에이전트가 방대한 코드베이스에서 정의, 사용법 및 관계를 신속하게 찾을 수 있도록 하여, 엔지니어가 IDE를 사용하여 복잡한 프로젝트를 탐색하는 능력과 유사하게 탐색 효율성을 크게 향상시킵니다.

이러한 지능적인 계층화를 일반적인 안티패턴인 단일의 거대한 프롬프트 파일과 대조해 보십시오. 이 접근 방식은 가능한 모든 컨텍스트를 종종 수천 줄에 달하는 하나의 문서에 쏟아부으려 합니다. 이러한 단일 프롬프트는 가장 유능한 LLM조차 압도하여 성능을 저하시키고, 추론 비용을 증가시키며, 에이전트를 인간 엔지니어보다 덜 효과적으로 만듭니다. Anthropic의 MasterClass는 대규모 코드베이스에서 에이전트의 성공을 좌우하는 것은 단순한 양이 아니라 선별되고 계층화된 컨텍스트임을 강조합니다.

정적 규칙에서 살아있는 시스템으로

정적 `claude.md` 파일을 넘어, 효과적인 AI Layer는 동적이고 자체 개선적인 아키텍처를 요구합니다. 정적 가이드라인을 살아있는 시스템으로 전환하기 위해 자체 개선 훅(self-improving hooks)을 구현하십시오. 특히, `stop hooks`는 에이전트의 세션을 검토하고, 비효율성 또는 일반적인 오류를 식별하며, 프로젝트의 규칙 파일에 대한 업데이트를 자동으로 제안하여 에이전트의 향후 동작을 개선하고 지속적인 최적화를 보장할 수 있습니다.

이를 보완하여, `start hooks`는 중요한 동적 컨텍스트를 제공합니다. 에이전트가 작업을 시작하기 전에, `start hook`는 개발자의 팀 또는 편집 중인 특정 모듈에 따라 Confluence에서 관련 문서를 가져올 수 있습니다. 이는 에이전트의 컨텍스트를 미리 채워 가장 적절하고 실시간 정보를 가지고 시작하도록 보장합니다. 이러한 정교한 에이전트 하네스를 구축하는 Anthropic의 통찰력은 그들의 가이드, How Claude Code works in large codebases에 자세히 설명되어 있습니다.

복잡한 작업을 위해 subagents는 집중적인 실행을 위한 강력한 전략을 제공합니다. 광범위한 탐색이나 전문화된 분석으로 주 코딩 에이전트를 압도하는 대신, subagents는 특정하고 복잡한 문제를 처리하도록 파견될 수 있습니다. 이러한 전문화된 엔티티는 다음을 수행할 수 있습니다: - 레거시 코드 아키텍처를 심층적으로 분석합니다. - 새로운 API 문서를 탐색합니다. - 포괄적인 단위 테스트 스위트를 생성합니다. 이러한 분할은 주 에이전트가 핵심 구현에 집중할 수 있도록 하여, 대규모 실제 코드베이스에서 효율성과 정확성을 크게 향상시킵니다. 그 결과는 더욱 강력하고 적응성이 뛰어나며 성능이 우수한 AI 코딩 어시스턴트가 되어, 다양한 프로젝트에서 지속적으로 학습하고 접근 방식을 최적화합니다.

프롬프트 입력은 멈추고, 엔지니어링을 시작하세요

"프롬프트 속삭임"이나 "바이브 코딩"으로 AI 코딩에 접근하는 것을 멈추세요. LLM에서 단순히 최선을 바라던 시대는 끝났습니다. 대신, 예측 가능하고 확장 가능한 결과를 위한 견고한 시스템을 구축하는 하네스 엔지니어링이라는 의도적인 사고방식을 채택하세요. Anthropic의 최근 MasterClass는 중요한 통찰력을 확인시켜 주었습니다: 모델 주변의 하네스, 즉 리포지토리 내의 AI 컨텍스트와 툴링이 모델 자체보다 더 중요합니다.

이러한 엔지니어링 접근 방식은 상당한 이점을 제공합니다. 프로젝트는 더 큰 AI 자율성을 얻고, 사소한 작업을 넘어 더욱 신뢰할 수 있는 코드 생성을 달성합니다. 이러한 구조화된 AI Layer는 에이전트가 수백만 줄의 모노레포, 수십 년 된 레거시 시스템, 수십 개의 리포지토리에 걸쳐 있는 분산 아키텍처를 포함한 복잡한 환경을 효과적으로 탐색하고 기여할 수 있도록 지원합니다. 내부적으로, Claude Code를 사용하는 Anthropic 엔지니어들은 3배 더 많은 코드를 출하하고 31% 더 많은 풀 리퀘스트를 병합하여, 실질적인 생산성 향상을 입증했습니다.

오늘부터 에이전트 엔지니어링 여정을 시작하세요. 리포지토리 루트에 간단한 `claude.md` 파일을 생성하여 초기 전역 컨텍스트를 설정하세요. 하위 디렉토리에 계층화된 규칙을 추가하고 자체 개선 `stop hooks`를 구현하여 이 기반을 점진적으로 확장하세요. 이 반복적인 프로세스는 프로젝트의 맞춤형 AI Layer를 점진적으로 구축하여 개발 워크플로우를 혁신합니다.

자주 묻는 질문

AI 에이전트 하네스란 무엇인가요?

AI 에이전트 하네스는 AI 모델이 대규모 코드베이스와 같은 특정 환경에서 효과적으로 작동하도록 돕기 위해 모델을 둘러싸는 컨텍스트, 도구 및 구성의 집합입니다. 이는 모델 주변에 구축된 생태계입니다.

하네스가 모델보다 더 중요한 이유는 무엇인가요?

복잡한 코드베이스에서는 순수한 모델 지능만으로는 불충분합니다. 하네스는 중요하고 범위가 지정된 컨텍스트를 제공하고, 규칙을 정의하며, 모델을 안내하는 전문화된 도구를 제공하여 모델이 길을 잃거나 치명적인 실수를 저지르는 것을 방지합니다.

에이전트 검색이란 무엇인가요?

이는 Claude Code가 리포지토리를 탐색하는 방식입니다. 미리 구축된 인덱스(RAG와 같은)를 사용하는 대신, `grep`과 같은 명령줄 도구를 사용하여 파일 시스템을 탐색하고 코드 구조를 이해합니다. 이는 마치 인간 개발자가 하는 방식과 유사합니다.

자체 개선 `hooks`는 어떻게 작동하나요?

AI 세션의 시작 또는 끝에 실행되는 스크립트입니다. 예를 들어, 'stop hook'은 세션의 작업을 분석하고 프로젝트의 규칙 파일(claude.md)에 대한 개선 사항을 제안하여 시간이 지남에 따라 시스템을 더 스마트하게 만들 수 있습니다.

One weekly email of tools worth shipping. No drip funnel.

one email per week · unsubscribe in two clicks · no third-party tracking

자주 묻는 질문

AI 에이전트 하네스란 무엇인가요?
AI 에이전트 하네스는 AI 모델이 대규모 코드베이스와 같은 특정 환경에서 효과적으로 작동하도록 돕기 위해 모델을 둘러싸는 컨텍스트, 도구 및 구성의 집합입니다. 이는 모델 주변에 구축된 생태계입니다.
하네스가 모델보다 더 중요한 이유는 무엇인가요?
복잡한 코드베이스에서는 순수한 모델 지능만으로는 불충분합니다. 하네스는 중요하고 범위가 지정된 컨텍스트를 제공하고, 규칙을 정의하며, 모델을 안내하는 전문화된 도구를 제공하여 모델이 길을 잃거나 치명적인 실수를 저지르는 것을 방지합니다.
에이전트 검색이란 무엇인가요?
이는 Claude Code가 리포지토리를 탐색하는 방식입니다. 미리 구축된 인덱스를 사용하는 대신, `grep`과 같은 명령줄 도구를 사용하여 파일 시스템을 탐색하고 코드 구조를 이해합니다. 이는 마치 인간 개발자가 하는 방식과 유사합니다.
자체 개선 `hooks`는 어떻게 작동하나요?
AI 세션의 시작 또는 끝에 실행되는 스크립트입니다. 예를 들어, 'stop hook'은 세션의 작업을 분석하고 프로젝트의 규칙 파일에 대한 개선 사항을 제안하여 시간이 지남에 따라 시스템을 더 스마트하게 만들 수 있습니다.
🚀더 알아보기

AI 트렌드를 앞서가세요

Stork.AIが엄선한 최고의 AI 도구, 에이전트, MCP 서버를 만나보세요.

P.S. 쓸 만한 걸 만드셨나요? Stork에 등록 — $49

모든 게시물로 돌아가기