WebMCP 설명: AI 에이전트가 웹사이트와 상호작용하는 방법

Q: WebMCP의 Imperative API와 Declarative API의 차이점은 무엇입니까?

Imperative API는 복잡한 앱에서 동적 도구 등록을 위해 JavaScript`)를 사용합니다. 새로운 Declarative API는 간단한 HTML 속성을 사용하여 기존 양식을 JavaScript 없이 AI와 호환되도록 만듭니다.

Q: 비디오에서 WebMCP를 '50% 완벽'이라고 부르는 이유는 무엇입니까?

웹사이트가 도구를 노출하는 기술은 빠르게 발전하고 있지만 , 나머지 절반은 빠져 있습니다. Gemini 및 Copilot과 같은 주요 AI 비서들은 아직 WebMCP를 통합하지 않아 사용자들이 실제로 이점을 얻을 방법이 없습니다.

Q: 개발자들은 WebMCP 테스트를 어떻게 시작할 수 있나요?

개발자들은 Chrome Flags 에서 WebMCP 지원을 활성화할 수 있습니다. 이렇게 하면 DevTools에 새로운 패널이 활성화되어 웹사이트가 노출한 도구들을 검사하고, 디버그하며, 수동으로 실행할 수 있습니다.

요약 / 핵심 포인트

WebMCP라는 새로운 웹 프로토콜이 AI 에이전트에게 웹사이트를 직접 사용하는 방법을 가르치고 있으며, 화면 스크래핑은 필요 없습니다. 하지만 새로운 개발자 도구가 이를 두 배 더 좋게 만들었음에도 불구하고, 여전히 절반의 해결책에 불과합니다.

취약한 자동화의 종말?

웹을 탐색하는 AI 에이전트는 종종 취약하고 시각 기반의 자동화와 씨름합니다. 픽셀 위치와 DOM 구조에 의존하는 화면 스크래핑 및 UI 자동화는 사소한 웹사이트 업데이트에도 깨집니다. 이러한 취약한 접근 방식은 에이전트의 신뢰성과 확장성을 제한하여 디지털 서비스와 진정으로 상호 작용할 수 있는 잠재력을 방해합니다.

WebMCP(웹 모델 컨텍스트 프로토콜)의 등장입니다. 이는 에이전트 기반 웹 브라우징을 혁신하기 위해 설계된 초기 단계의 브라우저 표준입니다. 이 프로토콜은 시각적 파싱을 넘어 웹사이트가 자신들의 기능을 구조화된 '도구'로 AI 에이전트에게 직접 노출할 수 있도록 합니다. 이는 추측에 의한 상호 작용에서 명시적이고 API와 유사한 통신으로 전환됩니다.

웹사이트는 document.modelContext 객체를 통해 이러한 도구들을 등록함으로써 WebMCP를 구현합니다. 개발자는 명확한 설명과 유형화된 입/출력 스키마를 가진 JavaScript 함수를 정의하여 견고하고 기계가 읽을 수 있는 인터페이스를 만들 수 있습니다. 이를 통해 AI 에이전트는 "장바구니에 항목 추가" 또는 "레스토랑 예약"과 같은 작업을 의미론적으로 이해하고 호출할 수 있습니다.

이것은 변두리 실험이 아닙니다. Google과 Microsoft는 W3C 내에서 WebMCP를 적극적으로 지지하고 있습니다. 현재 Chrome 146+에서 오리진 트라이얼 중이며, 이는 미래의 AI 기반 웹 상호 작용을 위한 기반 계층을 구축하려는 진지하고 협력적인 노력을 나타냅니다. WebMCP는 인터넷 전반에 걸쳐 지능적이고 신뢰할 수 있는 에이전트 통합의 새로운 시대를 열 것을 약속합니다.

에이전트 기반 웹을 향한 두 가지 경로

WebMCP는 개발자에게 웹 애플리케이션을 에이전트 준비 상태로 만들 수 있는 두 가지 뚜렷한 경로를 제공합니다. 이 이중 접근 방식은 간단한 양식부터 복잡하고 상태 저장 시스템에 이르기까지 웹의 다양한 요구 사항을 인정합니다. 두 가지 방법 모두 AI 소비를 위한 구조화된 도구를 노출하지만, 서로 다른 개발 패러다임을 충족시킵니다.

원래의 명령형 API는 개발자에게 JavaScript를 통해 권한을 부여합니다. `document.modelContext.registerTool()`을 사용하여 애플리케이션은 도구를 프로그래밍 방식으로 등록하며, 도구 이름, 설명 및 매개변수에 대한 세밀한 제어를 제공합니다. 이 방법은 사용자 상호 작용 또는 애플리케이션 상태에 따라 사용 가능한 작업이 변경될 수 있는 "Philly's Finest" 레스토랑 주문 시스템 또는 복잡한 OpenSCAD CAD 모델링과 같은 고도로 동적인 환경에서 탁월합니다.

강력한 새로운 선언형 API는 로우코드 대안을 제공합니다. 개발자는 이제 특정 속성을 마크업에 직접 삽입하는 것만으로 표준 HTML 양식을 AI가 읽을 수 있도록 만들 수 있습니다. 이는 JavaScript의 필요성을 없애고 프로세스를 크게 간소화합니다.

`tool name`, `tool description`, `tool param description`과 같은 속성은 도구의 목적과 입력 매개변수를 정의합니다. 브라우저는 이러한 주석을 구조화된 스키마로 자동 변환하여, 간단한 할 일 목록과 같은 양식을 어떠한 사용자 지정 코드 작성 없이도 AI 에이전트가 즉시 접근할 수 있도록 만듭니다.

이 이중 전략은 엄청난 유연성을 제공합니다. 간단한 데이터 입력 양식을 구축하든 정교한 엔지니어링 애플리케이션을 구축하든, WebMCP는 웹 상호 작용이 AI 에이전트에 의해 정확하게 이해되고 실행될 수 있도록 보장합니다. 이는 인간 중심의 UI와 기계가 실행 가능한 인터페이스 사이의 간극을 메웁니다.

새로운 DevTools로 AI 디버깅하기

Chrome devtools에 이제 WebMCP support가 제공되어, 이 초기 표준이 개념적 프레임워크에서 실질적이고 디버깅 가능한 현실로 전환됩니다. 이 중요한 추가는 웹사이트가 지능형 에이전트에 기능을 노출하는 방식을 개발자가 정확하게 검사하고 개선할 수 있도록 하는 성숙 지점을 나타냅니다. 이는 에이전트 웹의 약속을 실용적이고 배포 가능한 개발 워크플로우에 기반을 두어, AI 상호작용에 대한 세밀한 제어를 가능하게 합니다.

'Application' 패널 내의 새로운 WebMCP tab은 사이트의 에이전트 대면 인터페이스에 대한 전례 없는 가시성을 제공합니다. 이제 개발자는 다음을 수행할 수 있습니다: - 명령형으로든 선언형으로든 정의된 모든 등록된 도구를 볼 수 있습니다. - 이름, 설명 및 매개변수를 포함한 정확한 스키마를 검사하여 AI와의 정확한 통신을 보장합니다. - 도구 호출의 포괄적인 기록을 검토하여 에이전트 상호작용 및 그 순서를 이해합니다. 이러한 세부 정보 수준은 예상치 못한 에이전트 동작을 진단하는 데 중요합니다.

이러한 심층적인 내부 검사는 복잡한 에이전트 동작을 디버깅하고 노출된 함수의 정확성을 검증하는 데 매우 중요합니다. 또한, 이 패널을 통해 개발자는 특정 매개변수로 AI의 호출을 시뮬레이션하여 도구를 직접 수동으로 실행할 수 있습니다. 이 기능은 도구가 예상대로 작동하고 노출된 스키마가 에이전트에 대한 사이트의 의도된 상호작용을 정확하게 나타내는지 확인하여 빠른 검증을 제공하고 피드백 루프를 가속화합니다. 프로그래밍 방식 도구 등록에 대한 자세한 내용은 WebMCP Imperative API - Chrome Developers를 참조하십시오.

'50% 완벽' 문제

최근의 모든 발전에도 불구하고, WebMCP는 고전적인 "50% 완벽" 문제를 구현합니다. Jack Herrington이 설명했듯이, 새로운 devtools와 단순화된 선언형 API를 포함한 최근의 발전은 프로토콜을 효과적으로 두 배 더 좋게 만들었습니다. 그러나 이는 에이전트 웹을 가능하게 하는 완전한 solution의 절반에 불과합니다.

결정적으로 누락된 절반은 브라우저에 직접 내장된 AI 비서와의 기본 통합입니다. Google의 Gemini 또는 Microsoft의 Copilot와 같은 모델이 이러한 노출된 WebMCP 도구를 적극적으로 발견하고 사용하지 않으면, 이 프로토콜은 의미 있는 최종 사용자 애플리케이션이 부족합니다. 개발자는 이제 도구를 등록하고 디버깅할 수 있지만, 현재 어떤 브라우저 AI도 실제 작업을 위해 이를 활용할 준비가 되어 있지 않습니다.

이는 생태계에 중요한 질문을 제기합니다: Google과 같은 회사들은 WebMCP를 위한 브라우저 측 API와 정교한 devtools를 구축하면서도, 동시에 이러한 기능을 자체 주력 AI 제품에 연결하지 못하는 이유는 무엇입니까? 브라우저-AI 상호작용을 재정의할 것을 약속하는 기술을 출시하면서도 필요한 인프라의 절반만 제공하는 것은 로켓을 발사대에 그대로 두는 것과 같습니다.

자주 묻는 질문

WebMCP (Web Model Context Protocol)란 무엇입니까?

WebMCP는 웹사이트가 기능을 구조화된 도구로 노출할 수 있도록 하는 새로운 웹 표준입니다. 이를 통해 AI 에이전트는 취약한 화면 스크래핑에 의존하는 대신, API를 호출하는 것처럼 사이트와 안정적으로 상호작용할 수 있습니다.

WebMCP의 Imperative API와 Declarative API의 차이점은 무엇입니까?

Imperative API는 복잡한 앱에서 동적 도구 등록을 위해 JavaScript(`document.modelContext.registerTool()`)를 사용합니다. 새로운 Declarative API는 간단한 HTML 속성을 사용하여 기존 양식을 JavaScript 없이 AI와 호환되도록 만듭니다.

비디오에서 WebMCP를 '50% 완벽'이라고 부르는 이유는 무엇입니까?

웹사이트가 도구를 노출하는 기술은 빠르게 발전하고 있지만 (첫 50%), 나머지 절반은 빠져 있습니다. Gemini 및 Copilot과 같은 주요 AI 비서들은 아직 WebMCP를 통합하지 않아 사용자들이 실제로 이점을 얻을 방법이 없습니다.

개발자들은 WebMCP 테스트를 어떻게 시작할 수 있나요?

개발자들은 Chrome Flags (`chrome://flags`)에서 WebMCP 지원을 활성화할 수 있습니다. 이렇게 하면 DevTools에 새로운 패널이 활성화되어 웹사이트가 노출한 도구들을 검사하고, 디버그하며, 수동으로 실행할 수 있습니다.

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

AI가 당신의 웹사이트를 사용하는 법을 배우고 있습니다

취약한 자동화의 종말?

에이전트 기반 웹을 향한 두 가지 경로

새로운 DevTools로 AI 디버깅하기

'50% 완벽' 문제

자주 묻는 질문

WebMCP (Web Model Context Protocol)란 무엇입니까?

WebMCP의 Imperative API와 Declarative API의 차이점은 무엇입니까?

비디오에서 WebMCP를 '50% 완벽'이라고 부르는 이유는 무엇입니까?

개발자들은 WebMCP 테스트를 어떻게 시작할 수 있나요?

다음 읽기

예상치 못한 주간 요금 청구 — 그리고 한 번만 결제하는 방식의 아기 생성기 앱

AI Baby Generators는 얼마나 정확할까요? (솔직한 답변)

AI 패턴에 눈에 띄는 이음새가 생기는 이유 (그리고 True Tiling이 이를 해결하는 방법)

AI 트렌드를 앞서가세요