요약 / 핵심 포인트
당신의 AI 요금이 갑자기 40% 급증했습니다
Claude Code 사용자들은 코딩 습관이나 프롬프트 복잡성을 변경하지 않았음에도 불구하고 사용 한도가 급격히 소진되는 현상을 갑자기 경험했습니다. 많은 이들이 몇 주 전보다 40% 더 빠르게 구독 한도에 도달했다고 보고하며 광범위한 불만을 불러일으켰습니다. 이러한 예상치 못한 상당한 소비 증가는 개발자 커뮤니티 전반에 걸쳐 빠르게 경종을 울렸고, Anthropic에 투명성을 요구하는 목소리가 나오게 했습니다.
Anthropic이 사용자들이 예상보다 빠르게 한도에 도달하고 있음을 인정했지만, 커뮤니티는 자체적인 심층 조사를 시작했습니다. 개발자들은 HTTP 프록시를 사용하여 원시 API 요청을 면밀히 캡처했고, 극명하고 정량화 가능한 불일치를 밝혀냈습니다. 조사 결과 Claude Code 버전 2.1.98과 2.1.100을 비교했을 때 요청당 토큰이 직접적으로 40% 증가했음이 드러났습니다. 이는 사소한 변동이 아니라 모든 상호작용에 영향을 미치는 극적이고 측정 가능한 증가였습니다.
버전 2.1.98에서는 일반적인 기준 요청이 약 50,000 토큰을 소비했습니다. 그러나 버전 2.1.100으로 업그레이드한 후, 서버는 *정확히 동일한 클라이언트 측 작업*에 대해 추가로 20,000 토큰을 청구하기 시작했습니다. 이는 클라이언트가 더 적은 바이트를 보냈음에도 불구하고 발생했으며, 이는 서버 측 변경을 명확하게 지적합니다. 결정적으로, 이 추가된 토큰들은 CLI의 `/context` 보기에서 완전히 보이지 않아 사용자가 추적하거나 설명할 수 없습니다.
이 숨겨진 오버헤드는 사용자가 동일한 출력에 대해 훨씬 더 많은 비용을 지불하게 만들며, 종종 10센트 요청이 즉시 2달러 청구로 급증합니다. 문제는 사용자 코드가 더 "토큰을 많이 소비"하게 된 것이 아니라, Anthropic의 인프라가 클라이언트의 명시적인 입력에서 발생하지 않은 토큰에 대해 조용히 청구하고 있다는 것입니다. 이는 중요한 질문을 제기합니다: 이 미스터리 토큰들은 어디에서 오는 것이며, 왜 공개나 통제 없이 모든 사용자의 청구서에 추가되고 있는가?
보이지 않는 토큰 세금
Claude Code의 최근 토큰 급증의 상당 부분은 커뮤니티에서 보이지 않는 토큰 세금이라고 부르는 것에서 비롯됩니다. 이 숨겨진 요금은 사용자에게 완전히 불투명한 청구 범주인 "캐시 생성 입력 토큰"에서 발생합니다. Anthropic이 이 토큰에 대해 청구하지만, 이 토큰들은 CLI의 `/context` 보기에서 눈에 띄게 누락되어 사용자에게 실제 소비량에 대한 위험할 정도로 잘못된 인상을 줍니다.
개발자들은 원시 API 요청을 캡처하여 Claude 버전 간의 극명한 대조를 밝혀냈습니다. 버전 2.1.98에서는 기준 요청이 약 50,000 토큰이 들었습니다. 그러나 버전 2.1.100에서는 클라이언트가 더 적은 바이트를 보냈음에도 불구하고 요청당 20,000 토큰이 증가하여 40% 증가했습니다. 이 상당한 증가는 `/context` 감사에 나타나지 않아 사용자가 지출을 효과적으로 추적하는 것을 불가능하게 만듭니다.
Anthropic이 기술적인 사후 분석을 발표하지 않았기 때문에, 개발자들은 근본 원인을 밝히기 위해 CLI를 역설계했습니다. 유력한 이론은 Claude의 시스템 도구 레지스트리가 대규모로 확장되었다는 점을 지적합니다. Claude가 MCP 도구를 더 잘 사용하고 복잡한 스웜을 관리하도록 하기 위해 Anthropic은 지침과 스키마의 두꺼운 계층을 포함시켰을 가능성이 높습니다. 이 광범위하고 숨겨진 지침서는 이제 모든 요청에 동반됩니다.
매번 가게에서 재료 하나를 살 때마다 복잡한 요리책 전체의 무게에 해당하는 비용을 지불한다고 상상해 보세요. 바로 이 보이지 않는 토큰들에서 일어나는 일입니다. 사용자들이 이러한 새로운 기능이나 복잡한 도구를 적극적으로 활용하지 않더라도, 이를 지원하는 데 필요한 확장된 인프라에 대한 토큰 부담을 여전히 짊어지며, 모든 상호작용에서 조용히 여러분의 현금을 소모하고 있습니다.
버그 #1: 손상된 캐시 지문 (The Mangled Cache Fingerprint)
Claude Code는 비용 효율성의 초석이 되도록 캐싱 메커니즘을 설계했습니다. 사용자들은 시스템이 프로젝트 컨텍스트의 대부분, 특히 `Claude.md` 및 기타 안정적인 파일 내의 콘텐츠와 같은 코드베이스의 최대 90%를 지능적으로 저장할 것으로 기대했습니다. 이 전략은 새로 도입된 코드나 특정 수정 사항에 대해서만 비용을 청구하여 Claude를 통한 반복적인 개발을 경제적으로 실행 가능하게 하는 것을 목표로 했습니다. 약속은 분명했습니다: 전체가 아닌 델타에 대해 비용을 지불하세요.
그러나 독립형 Claude binary의 특정 릴리스에서 치명적인 결함이 발견되어 이 비용 절감 기능을 근본적으로 훼손하고 있습니다. 이 버그는 binary가 캐시 지문(cache fingerprint)을 손상시키도록 만듭니다. 캐시 지문은 캐시된 프로젝트 데이터의 무결성과 ID를 확인하기 위한 고유 식별자입니다. 기존 프로젝트 컨텍스트를 인식하는 대신, API는 모든 후속 상호작용을 완전히 새로운 프로젝트 제출로 잘못 해석하여 완전한 재처리를 강제합니다.
이 단일 버그로 인한 재정적 여파는 엄청납니다. 기존 코드베이스에 대한 사소한 쿼리와 같은 일상적인 요청은 불과 몇 센트(약 10센트)가 들어야 하지만, 즉시 비용이 급증합니다. API가 전체 프로젝트 컨텍스트를 강제로 재수집하면 명목상 10센트짜리 작업이 2달러 요청으로 변모하여 20배의 가격 인상을 초래할 수 있습니다. 이러한 보이지 않는 초과 요금은 사용자들이 예상보다 훨씬 빠르게 사용량 한도에 도달하는 데 직접적으로 기여합니다.
문제에 깊이 파고든 커뮤니티 개발자들은 특정 캐시 실패가 독립형 Claude Code binary에서 사용되는 Bun 런타임의 커스텀 포크(custom fork of the Bun runtime) 내의 문제로 인해 발생했음을 지적했습니다. 이 특수 런타임은 특정 조건에서 잘못된 문자열 대체를 수행합니다. 특히, 채팅 기록에 청구 관련 콘텐츠가 포함되어 있으면 이 대체로 인해 캐시 접두사가 손상되어 시스템이 이전에 처리된 정보를 식별할 수 없게 됩니다. 이로 인해 모든 상호작용에서 전체 프로젝트가 처음부터 다시 평가되어야 합니다. 추가 기술 토론 및 사용자 보고서는 다음 진행 중인 대화를 참조하십시오: CC v2.1.100+ inflates cache_creation by ~20K tokens vs v2.1.98 — same payload, server-side · Issue #46917 · anthropics/claude-code - GitHub.
또 다른 중요한 캐시 관련 결함이 문제를 더욱 악화시킵니다. 이전 대화를 원활하게 이어서 진행하기 위한 `--resume` 또는 `--continue` 명령을 활성화하면, 의도치 않게 전체 대화 기록에 대한 캐시가 손상됩니다. 이는 재개된 첫 번째 요청에서 발생하며, Claude가 이전 컨텍스트를 모두 다시 수집하면서 상당한 일회성 토큰 비용을 발생시킵니다. 이러한 숨겨진 요금은 지속적이고 효율적인 상호작용에 대한 기대와 모순됩니다.
버그 #2: 재개(Resuming)의 높은 비용
캐시 지문을 손상시켰던 이전 버그만이 Claude의 토큰 소모적인 행동의 유일한 원인은 아닙니다. 두 번째로, 똑같이 교활한 결함은 중단했던 지점부터 다시 시작하려는 사용자를 특별히 겨냥합니다. 이 별개의 문제는 원활한 워크플로우 연속성과 컨텍스트 보존을 위해 설계된 겉보기에는 무해한 기능인 `--resume` 또는 `--continue` 명령과 관련이 있습니다.
`--resume`를 사용하면 즉각적이고 상당한 페널티가 발생합니다. 대화를 재개한 후 첫 번째 요청에서 Claude Code는 설명할 수 없게도 *전체* 이전 대화 기록에 대한 캐시를 손상시킵니다. `Claude.md` 콘텐츠와 이전 턴을 저장해야 하는 90% 프로젝트 캐시를 지능적으로 활용하는 대신, 시스템은 모든 상호 작용을 처음부터 다시 처리합니다.
의도된 캐싱 메커니즘을 활용하지 못하는 이러한 실패는 막대한 일회성 토큰 비용으로 직결됩니다. 새로운 입력에 대해서만 비용을 지불할 것으로 예상하는 개발자들은 대신 전체 세션의 누적된 컨텍스트에 대해 요금이 청구됩니다. 이 예상치 못한 지출은 사용자의 월별 할당량 중 상당 부분을 빠르게 소모하여, 사용량의 갑작스러운 급증과 할당량의 빠른 소진에 당황하게 만듭니다.
일시 중지되었다가 재개된 긴 코딩 세션을 상상해 보십시오. 시간과 토큰을 절약하기 위한 `--resume` 명령은 대신 이전에 있었던 모든 것을 완전히 재처리합니다. 이 일회성 타격은 불균형적으로 커서 간단한 후속 쿼리를 값비싼 작업으로 바꿀 수 있습니다. 이는 Claude Code의 지속적인 개발 기능의 인지된 가치에 직접적인 영향을 미치는 값비싼 놀라움입니다.
손상된 캐시 지문 문제와 확장된 시스템 도구 레지스트리에서 발생하는 보이지 않는 토큰 세금과 결합되어, 이러한 버그들은 완벽한 폭풍을 만듭니다. 각 결함은 독립적으로 토큰 소비를 증가시키지만, 그 누적 효과는 일상적인 코딩 세션을 자원의 빠른 소모로 변모시킵니다. Claude Code는 조용히 당신의 돈을 태우고 있으며, 지속적인 개발을 점점 더 비싼 제안으로 만들고, 예측할 수 없는 요금 청구로 사용자들을 좌절하게 만듭니다.
Anthropic의 우발적인 고백
2026년 3월 31일의 중대한 사건은 Claude의 토큰 소비 증가에 대한 중요한 통찰력을 제공했습니다. npm 패키지에 우발적으로 포함된 59.8MB JavaScript 소스 맵이 노출되어, Claude Code의 내부 작동 방식 500,000줄이 드러났습니다. 이 의도치 않은 공개는 우발적인 고백이 되어, 사용자들의 부풀려진 요금에 기여하는 기본 아키텍처를 드러냈습니다.
개발자들은 Claude Code 바이너리 버전 2.1 내에서 이 거대한 파일을 발견했습니다. 표적 해킹이 아닌 이 의도치 않은 공개는 Anthropic의 막 뒤를 전례 없이 들여다볼 기회를 제공했습니다. 노출된 코드의 엄청난 양은 즉시 커뮤니티의 관심을 불러일으켰고, 강렬한 조사를 촉발했습니다.
Anthropic은 이 사건을 신속하게 인정하고, "보안 침해가 아닌 인적 오류"로 분류하는 공식 성명을 발표했습니다. Anthropic은 보안 관점에서 심각성을 경시했지만, 커뮤니티는 투명성과 청구 관행에 대한 심오한 함의를 이해했습니다. 이 우발적인 유출은 사용자 데이터가 아닌 중요한 증거를 제공했습니다.
개발자 커뮤니티는 시간을 낭비하지 않고 즉시 노출된 코드베이스를 파고들었습니다. 그들의 신속한 분석은 Claude Code 백엔드의 증가하는 복잡성에 대한 오랜 의혹을 확인시켜 주었습니다. 이 심층 분석은 최근 토큰 급증의 원인으로 많은 사람들이 추측했던 기능 과잉(feature creep) 이론에 대한 구체적인 증거를 제공했습니다.
코드 분석 결과 Terminal Pets, Proactive Mode, 백그라운드 메모리 통합과 같은 향후 기능에 대한 내부 기능 플래그가 드러났습니다. 이러한 발견은 Anthropic이 이러한 기능을 적극적으로 사용하지 않는 사용자에게도 모든 요청에 새로운 복잡한 인프라를 조용히 추가하고 있음을 시사했습니다. 결과적으로, 조용히 돈을 태우고 있던 사용자들은 현재 사용량이 아닌 미래 기능에 대한 보이지 않는 토큰 세금을 지불하고 있었습니다.
당신의 보이지 않는 'Terminal Pet'을 만나보세요
2026년 3월 31일 발생한 우발적인 소스 코드 유출은 Anthropic의 야심찬 로드맵을 적나라하게 보여주었으며, Claude의 숨겨진 토큰 소비량의 상당 부분이 어디서 발생하는지 의도치 않게 드러냈습니다. 잠시 노출되었던 59.8MB의 JavaScript 소스 맵 파일에는 미출시 기능에 대한 내부 기능 플래그가 포함되어 있었고, 이는 커뮤니티의 feature creep 의심을 확인시켜 주었습니다. 이 유출은 Anthropic이 사용자들이 예상보다 빠르게 사용량 제한에 도달하고 있음을 인정한 시점과 거의 동시에 발생했으며, 이는 Anthropic admits Claude Code quotas running out too fast - The Register에 의해 보도되었습니다.
가장 흥미로운 사실 중 일부는 다음과 같습니다: - Terminal Pets: 개발 환경 내에서 작동하도록 설계된 타마고치와 유사한 보조 도구로, 지속적이고 상호작용적인 동반자 역할을 제공합니다. - Proactive Mode (Kairos): 개발자의 요구를 예측하고, 코드를 능동적으로 모니터링하며, 명시적인 프롬프트 없이 개선 사항을 제안하도록 고안된 상시 작동 에이전트입니다. - Background memory consolidation (Auto Dream): 지속적인 학습 및 컨텍스트 유지를 위한 시스템으로, Claude가 프로젝트에 대한 더 깊고 장기적인 이해를 구축할 수 있도록 합니다.
이러한 복잡하고 미출시된 기능들은 정교한 기반 인프라를 요구합니다. 개발자들은 Anthropic이 이러한 미래 기능을 지원하기 위해 Claude의 시스템 도구 레지스트리를 대규모로 확장했을 것이라고 추측합니다. 비록 아직 사용자에게 활성화되지 않았더라도 말입니다. 이러한 확장은 이제 Claude Code로 보내는 모든 요청에 포함되어 전송되는 지침, 스키마 및 내부 로직의 무거운 계층을 추가하는 것을 수반합니다.
Kairos 및 Auto Dream과 같은 기능의 최종 배포에 필수적인 미래 기능에 대한 이 광범위한 "사용 설명서"는 보이지 않는 토큰 세금에 직접적으로 기여합니다. 이러한 포괄적인 스키마는 "cache creation input tokens"로 청구됩니다. 즉, 청구서에 조용히 누적되지만 CLI의 `/context` 보기에서는 완전히 숨겨져 감사 도구로 추적할 수 없습니다.
따라서 사용자들은 자신들의 프로젝트가 갑작스럽고 설명할 수 없는 비용 증가에 직면하고 있음에도 불구하고, Anthropic의 미래 제품 개발을 위한 infrastructure tax를 사실상 지불하고 있는 셈입니다. 미출시 기능에 대한 이러한 시기상조의 청구는 조용히 현금을 소모하며 일상적인 코딩을 예상치 못한 재정적 손실로 변화시킵니다. 시스템은 접근할 수 없는 기능을 준비하기 위해 귀중한 토큰을 소비하고 있으며, 이는 즉각적인 가치를 제공하지 않으면서 현재 운영 비용에 영향을 미칩니다.
'AI Shrinkflation' 시대에 오신 것을 환영합니다.
고객이 인공지능 모델에 대해 동일한 가격을 지불하면서도 명백히 적은 기능을 제공받거나 더 큰 제약을 받는 불안정한 AI Shrinkflation 시대에 오신 것을 환영합니다. 제품 크기나 품질이 조용히 감소하는 반면 가격은 그대로 유지되는 전통적인 소비자 슈링크플레이션의 디지털 아날로그가 이제 생성형 AI의 최첨단을 괴롭히고 있습니다. 사용자들은 개인 사용량 증가 때문이 아니라, 기본 모델이 동일한 결과물을 위해 더 많은 리소스를 조용히 요구하기 때문에, 종종 명시적인 통지 없이 컴퓨팅 예산이 갑자기 증발하는 것을 발견했습니다.
보이지 않는 'cache creation input tokens'와 손상된 캐시 지문을 통해 조용히 현금을 소모하는 Claude Code의 교활하고 토큰을 탐하는 행동은 이러한 경고적인 추세를 완벽하게 보여줍니다. 10센트짜리 요청이 즉시 2달러 청구로 바뀔 수 있는 이 문제는 더 광범위한 불만을 반영합니다. AI 업계 전반의 파워 유저들은 특히 Claude Opus 4.6과 같은 플래그십 모델에서 출력 품질, 추론 능력 및 전반적인 신뢰성의 현저한 저하를 언급하며 유사한 경험을 보고합니다. 이러한 불만 사항들은 모델이 더 장황해지거나, 덜 정확해지거나, 또는 한때 쉽고 효율적으로 처리했던 작업을 단순히 완료하지 못하는 경우가 많다고 자세히 설명합니다.
Anthropic은 다른 주요 AI 개발사들과 마찬가지로 모델의 의도적인 성능 저하를 공식적으로 부인합니다. 대신, Anthropic은 사용자들이 예상보다 빠르게 사용량 제한에 도달하고 있음을 인정하면서도, 이러한 변화를 명시적인 다운그레이드보다는 필요한 최적화, 효율성 개선 또는 내부 'effort levels' 조정으로 설명하는 경우가 많습니다. 이러한 미묘하고 종종 모호한 언어는 사용자들의 의심을 부추기며, 인지된 성능 저하를 제공업체와 가장 적극적인 고객 간의 심각한 trust deficit으로 전환시킵니다. 상세한 기술적 사후 분석의 부재는 이러한 불만을 더욱 악화시킵니다.
이러한 불투명한 커뮤니케이션 전략은 2026년 3월 31일 소스 코드 유출로 드러난 숨겨진 청구 메커니즘과 결합하여 AI 기업과 가장 헌신적인 사용자들 사이의 중요한 신뢰를 심각하게 침식합니다. 전문 프로젝트와 혁신적인 애플리케이션을 위해 예측 가능한 성능과 투명한 청구에 의존하는 개발자들은 점점 더 예측 불가능하고 비용이 많이 드는 환경을 헤쳐나가야 합니다. 급속한 기술 발전의 초석인 지속적인 개선에 대한 암묵적인 약속은 예상치 못한 비용 급증과 인지된 기능 퇴보라는 실망스러운 현실과 정면으로 충돌하며, 파워 유저들은 빠르게 진화하는 시장에서 착취당하고 무시당한다고 느끼게 됩니다.
Anthropic의 피해 통제
커뮤니티의 광범위한 비난과 Claude Code subscription이 사용량 제한을 40% 더 빠르게 소모한다는 상세한 사용자 보고에 직면하여, Anthropic은 공개적인 대응을 시작했습니다. 독립적인 조사와 2026년 3월 31일의 소스 코드 유출로 촉발된 커지는 불만은 중요한 청구 불일치와 백엔드 비효율성을 부각시켰습니다.
Claude Code의 제품 책임자인 Lydia Hallie는 예상보다 빠른 할당량 소진 문제에 대해 회사가 'actively investigating'임을 확인하며 escalating issue를 공개적으로 인정했습니다. 이러한 인정은 수많은 사용자들이 일관된 코딩 습관과 프로젝트 크기를 유지했음에도 불구하고 갑자기 사용량 상한에 훨씬 더 빨리 도달했다고 보고한 후에 나왔으며, 숨겨진 토큰 비용에 대한 광범위한 논쟁을 촉발시켰습니다.
즉각적인 우려를 해결하기 위해 Anthropic은 토큰 소비에 영향을 미치는 여러 백엔드 조정을 구현했습니다. 그들은 프롬프트 캐시의 Time To Live (TTL)을 1시간에서 5분으로 대폭 줄여, API가 이전에 불필요한 재처리에 기여했던 오래되거나 관련 없는 캐시 데이터를 참조하는 것을 방지했습니다. Anthropic은 또한 특정 내부 작업에 대한 기본 'effort' 수준을 낮췄는데, 이는 백그라운드 계산 오버헤드와 토큰 사용량을 줄이기 위해 고안된 조치입니다.
Anthropic은 'outsized strain on our systems'을 이유로 타사 에이전트 프레임워크 제한을 추가로 정당화했습니다. 이 결정은 시스템 안정성을 위해 필요하다고 설명되었지만, 개발자들을 외부 통합에서 멀어지게 하고 잠재적으로 Anthropic의 독점 도구로 유도하기도 합니다. 이는 사용자가 Claude의 기능을 상호 작용하고 확장하는 방식에 대한 통제권의 미묘하지만 중요한 변화를 나타냅니다.
이러한 조치들은 'AI Shrinkflation'—즉, 덜 유능하거나 더 제한적인 AI 모델에 대해 동일한 가격을 지불하는 현상—에 대한 증가하는 비난에 맞서 Anthropic이 피해 통제를 시도하는 것을 나타냅니다. 이러한 단계들이 즉각적인 완화를 제공하지만, 손상된 캐시 지문 버그와 확장된 시스템 도구 레지스트리를 포함한 핵심 문제들은 Anthropic의 포괄적인 기술적 사후 분석과 최종적인 해결을 여전히 기다리고 있습니다.
출혈을 멈추는 방법 (일단은)
Anthropic의 보이지 않는 토큰 세금과 지속적인 캐시 버그로 어려움을 겪는 사용자들은 즉각적이지만 임시적인 대응책을 구현할 수 있습니다. 개발자 커뮤니티는 엄격한 HTTP proxy 분석을 통해 중요한 해결책을 찾아냈습니다: User-Agent 헤더를 스푸핑하는 것입니다. 문제가 있는 `claude-cli/2.1.100` 또는 이후 버전 대신 `claude-cli/2.1.98`로 식별되도록 요청을 수동으로 구성함으로써, 개발자들은 각 API 호출에 비밀리에 추가되는 "캐시 생성 입력 토큰"을 크게 줄일 수 있습니다. 이 간단한 변경은 확장된 시스템 도구 레지스트리 오버헤드의 상당 부분을 우회하는 것으로 보이며, 이 오버헤드는 그렇지 않으면 요청당 최대 40%까지 비용을 부풀립니다.
Claude Code 내에서 `--resume` 또는 `--continue` 명령을 사용할 때 극도의 주의를 기울이십시오. 독립적인 조사에 따르면 이 기능은 종종 특정 버그를 유발하여 초기 재개 요청 시 전체 대화 기록의 캐시를 손상시키는 것으로 확인되었습니다. 이는 상당한 일회성 토큰 급증으로 이어질 수 있으며, 전체 코드베이스가 다시 처리되면서 10센트짜리 쿼리가 즉시 2달러 청구로 바뀔 수 있습니다. 항상 billing dashboards를 꼼꼼하게 모니터링하십시오. CLI의 `/context` 뷰는 이러한 보이지 않는 토큰을 고려하지 않으므로, 예상치 못한 요금을 방지하기 위해 세부적인 비용 추적이 절대적으로 필수적입니다.
Claude Code CLI 버전을 `2.1.98`로 직접 다운그레이드하는 것은 더 포괄적이지만 잠재적으로 덜 안정적인 옵션입니다. 이 롤백은 최신 버전에서 관찰된 토큰 소모 증가를 효과적으로 완화하지만, 이후 릴리스에서 도입된 합법적인 버그 수정, 성능 개선 또는 새로운 기능을 포기해야 함을 의미하기도 합니다. 사용자는 즉각적인 비용 절감과 오래된 알려진 문제 또는 호환성 문제에 직면할 가능성을 비교 평가해야 합니다. 버전 간의 특정 토큰 급증에 대한 자세한 분석은 Claude Code Silently Burns 40% More Tokens Since v2.1.100 | Awesome Agents를 참조하십시오.
이러한 조치들은 임시방편일 뿐 영구적인 해결책은 아닙니다. Anthropic은 이러한 근본적인 결제 및 캐싱 문제를 직접적이고 투명하게 해결할 책임이 있습니다. 포괄적인 수정이 이루어질 때까지, 적극적인 사용자 경계와 커뮤니티 공유 해결책이 보이지 않는 토큰과 손상된 캐싱 메커니즘으로 인해 조용히 돈을 낭비하는 것을 막는 주요 방어 수단으로 남아있습니다.
신뢰 부족: Claude의 나아갈 길
AI safety and trust를 중심으로 세심하게 구축된 Anthropic의 브랜드 아이덴티티는 이제 중대한 도전에 직면했습니다. Claude Code가 보이지 않는 토큰과 지속적인 캐싱 버그를 통해 사용자 자금을 조용히 소모하고 있다는 사실은 윤리적인 AI라는 그들의 핵심 약속과 정면으로 배치됩니다. 이러한 사용자 신뢰의 침식은 예측 가능한 비용과 신뢰할 수 있는 성능이 필수적인 개발자 도구에 특히 해롭습니다. 이 사건은 투명성과 사용자 중심 디자인에 대한 그들의 약속에 긴 그림자를 드리웁니다.
Claude Code 사용자들이 겪는 "AI Shrinkflation"은 경쟁사들에게 뚜렷한 경쟁 기회를 제공합니다. Anthropic이 신뢰 부족으로 고심하는 동안, GitHub Copilot 및 Cursor와 같은 기존 플레이어들은 개발자 경험을 계속해서 개선하고 있습니다. 이 사건은 개발자들에게 AI 코딩 어시스턴트 선택을 재평가할 강력한 동기를 부여하며, 잠재적으로 Claude Code에서 더 안정적인 가격과 투명한 운영을 제공하는 대안으로의 상당한 이탈을 유도할 수 있습니다. AI 개발 도구 시장은 치열합니다. 이와 같은 실수는 막대한 결과를 초래합니다.
Claude Code의 청구 문제들은 더 넓은 AI 산업 전반에 걸친 시스템적 문제를 조명합니다: 바로 청구 투명성의 심각한 부족입니다. 많은 AI 제공업체들은 시스템 프롬프트, 백그라운드 처리, 캐시 관리를 불투명한 토큰 계산 안에 숨겨 운영의 실제 비용을 모호하게 만듭니다. 이 사건은 기업들이 더 명확하고 감사 가능한 청구 관행을 채택하도록 잠재적으로 강제하고, 사용자들에게 토큰이 정확히 어떻게 소비되는지에 대한 세부적인 통찰력을 제공하는 중요한 경종 역할을 합니다. 명시적인 비용 내역에 대한 기대는 더욱 커질 것입니다.
사용자 신뢰를 재건하려면 Anthropic의 단호한 조치가 필요합니다. 망가진 캐시 지문부터 `--resume` 명령어의 숨겨진 비용, 그리고 토큰 소모를 40% 증가시킨 시스템 도구 레지스트리 확장까지, 특정 버그들을 공개적으로 상세히 설명하는 철저한 기술적 사후 분석이 가장 중요합니다. 기술적 투명성을 넘어, Anthropic은 실질적인 해결책을 제시해야 합니다: 과다 청구된 사용자에 대한 선제적 환불, 실시간으로 세부적인 토큰 내역을 제공하는 개선된 사용량 대시보드, 그리고 독립 감사에 대한 약속입니다. 이러한 포괄적인 조치를 통해서만 신뢰를 회복하고 사용자들에게 진정한 헌신을 보여줄 수 있을 것입니다.
자주 묻는 질문
Claude Code가 왜 그렇게 많은 토큰을 사용하는 원인은 무엇인가요?
눈에 띄지 않게 청구되는 시스템 도구 레지스트리의 대규모 확장, 매 턴마다 전체 코드베이스를 재처리하는 캐시 버그, 그리고 캐시 기본값 변경을 포함한 여러 요인의 조합입니다.
Anthropic이 Claude Code 사용자들의 비용을 의도적으로 인상했나요?
Anthropic은 모델을 의도적으로 저하시켰다는 주장을 부인했지만, 조사 결과 캐시 TTL 감소 및 미출시 기능을 위한 새로운, 토큰 소모가 많은 백그라운드 지침과 같은 변경 사항이 드러나 'AI 슈링크플레이션'이라는 비난으로 이어졌습니다.
Claude Code 소스 코드 유출에서 무엇이 밝혀졌나요?
2026년 3월의 유출은 'Terminal Pets' 및 'Proactive Mode'와 같은 미출시 도구에 대한 내부 기능 플래그를 노출시켰으며, 이는 사용자들이 아직 사용할 수 없는 백그라운드 기능 인프라에 대해 비용을 지불하고 있다는 이론에 힘을 실어주었습니다.
지금 당장 Claude Code 토큰 사용량을 어떻게 줄일 수 있나요?
커뮤니티 회원들은 User-Agent를 이전 버전(claude-cli/2.1.98)으로 위장하는 임시 해결책을 찾았는데, 이는 보이지 않는 토큰 주입을 줄일 수 있습니다. 또한, '--resume' 명령어 사용 시 주의하십시오.