Новый ИИ Claude — это токен-ловушка

Opus 4.7 от Anthropic сжигает токены, и распространенное решение только усугубляет ситуацию. Откройте для себя контринтуитивную стратегию, которая сокращает расходы, максимизируя его мощность.

Stork.AI
Hero image for: Новый ИИ Claude — это токен-ловушка
💡

Кратко / Главное

Opus 4.7 от Anthropic сжигает токены, и распространенное решение только усугубляет ситуацию. Откройте для себя контринтуитивную стратегию, которая сокращает расходы, максимизируя его мощность.

Токен-ловушка, которую вы не ожидали

Opus 4.7 представляет собой тонкую, но значительную токен-ловушку. Его новый токенизатор и уникальный режим рассуждения adaptive thinking принципиально изменяют потребление токенов. Тот же входной текст, который использовался для Opus 4.6, теперь соответствует примерно в 1.0–1.35 раза большему количеству токенов в Opus 4.7, причем некоторые независимые тесты фиксируют увеличение до 1.47x для сложных технических документов. Несмотря на это существенное увеличение расхода входных токенов, Anthropic сохраняет свою цену в $5 за миллион входных токенов, что фактически неожиданно повышает затраты на задачу.

Многие пользователи ошибочно пытаются снизить эти растущие затраты, уменьшая уровень усилий модели, выбирая средние или низкие настройки вместо высоких или максимальных. Эта тактика часто оказывается контрпродуктивной. Хотя изначально кажется, что это экономит токены, снижение усилий обычно приводит к менее точным или неполным результатам, требуя больше итеративных исправлений и последующих запросов. Этот цикл, по иронии судьбы, увеличивает общее использование токенов и в конечном итоге повышает расходы.

Итеративные запросы в стиле чата еще больше усугубляют проблему, превращая Opus 4.7 в значительный множитель затрат. В отличие от моделей, которые могут обрабатывать последующие шаги более эффективно, Opus 4.7 «думает усерднее над каждым запросом пользователя». Взаимодействие с ним как с «pair programmer» — пошаговое руководство на протяжении десятков итераций — вызывает значительные накладные расходы на рассуждения при каждом взаимодействии. Этот обмен данными резко увеличивает потребление токенов, делая один, хорошо составленный запрос более экономичным и эффективным подходом.

Прекратите парное программирование с вашим ИИ

Многие пользователи взаимодействуют с Claude Opus 4.7 как с pair programmer, итеративно уточняя код или текст на протяжении нескольких итераций. Однако лучшие практики Anthropic рекомендуют другой подход: относиться к Opus 4.7 как к capable engineer. Этот сдвиг имеет решающее значение для управления уникальной динамикой токенов модели.

Adaptive thinking Opus 4.7 управляет его внутренней обработкой, что означает, что он прилагает значительные усилия к рассуждениям для каждого запроса пользователя. Частые двусторонние взаимодействия, характерные для стиля pair-programming, резко увеличивают эти накладные расходы на рассуждения. Это напрямую приводит к более высокому потреблению токенов и неожиданно возросшим эксплуатационным расходам.

Вместо разрозненных инструкций, загрузите весь необходимый контекст в один, всеобъемлющий запрос. Слабый запрос может просто гласить: «Напиши мне функцию Python». Сильный, одноразовый запрос, напротив, предоставляет: - Детальный контекст: «Разработайте функцию Python для надежной аутентификации API». - Специфические ограничения: «Используйте OAuth2 с библиотекой `requests`, обеспечивая безопасную обработку токенов». - Критерии приемки: «Функция должна возвращать объект аутентифицированной сессии, включать логику обновления токена и реализовывать комплексное логирование ошибок».

Этот всеобъемлющий, одноразовый метод минимизирует внутренние циклы рассуждений Opus, позволяя ему выполнять задачу более эффективно. Сокращая количество итераций, пользователи напрямую снижают расход токенов, делая взаимодействие с Opus 4.7 более экономичным и предсказуемым в долгосрочной перспективе.

Anthropic манипулирует своей собственной системой?

Совет Anthropic относиться к Opus 4.7 как к capable engineer, требуя исчерпывающих начальных подсказок, вызывает немедленный скептицизм. Этот подход, хотя потенциально и дает лучшие результаты, по своей сути увеличивает потребление токенов. Учитывая, что обновленный токенизатор Opus 4.7 уже преобразует один и тот же входной текст в 1,0–1,35 раза больше токенов — иногда до 1,47x для технических документов — эта рекомендация выгодно сказывается на прибыли Anthropic, которая взимает $5 за миллион входных токенов.

Однако пользователи обнаруживают мощные альтернативы для экономии средств. Opus 4.7 на уровнях усилий 'medium' или даже 'low' часто превосходит Opus 4.6, работающий на 'max'. Это открытие ставит под сомнение представление о том, что максимальные усилия всегда необходимы, позволяя разработчикам достигать превосходных результатов со значительно меньшим количеством токенов и более низкими затратами, даже с учетом возросших накладных расходов на токенизацию.

Anthropic также предоставляет пользователям новые рычаги управления для балансирования компромисса между стоимостью и производительностью. Введение уровня усилий xhigh, расположенного между 'high' и 'max', предлагает более тонкую детализацию для распределения ресурсов. В сочетании с предстоящими 'task budgets' эти инструменты позволяют пользователям восстановить контроль над расходами на токены. Для получения дополнительной информации по оптимизации взаимодействий обратитесь к Prompting best practices - Claude API Docs от Anthropic.

Освоение 4.7 без разорения

Расширенные возможности Opus 4.7 оправдывают его повышенное потребление токенов в определенных сценариях. Используйте его adaptive thinking для по-настоящему агентных рабочих процессов, сложных задач кодирования или требовательных задач компьютерного зрения высокого разрешения. Эти приложения, часто потребляющие в 1,35 раза или более токенов на запрос из-за нового токенизатора, являются теми областями, где его превосходная производительность приносит ощутимую ценность, компенсируя более высокую цену в $5 за миллион входных токенов.

Стратегический выбор модели имеет решающее значение для предотвращения перерасхода бюджета. Для рутинных задач часто достаточно средних или низких уровней усилий на Opus 4.7, превосходящих эквиваленты Opus 4.6 при более низкой стоимости токенов. Зарезервируйте уровень усилий "xhigh" и полную мощность Opus 4.7 для задач, требующих беспрецедентного рассуждения и точности, понимая значительные последствия для токенов.

Opus 4.7 представляет собой значительный скачок в возможностях ИИ, но он требует фундаментального изменения во взаимодействии с пользователем. Раскрытие его полного потенциала требует strategic prompting, обращения с Claude как со старшим инженером, путем предварительной загрузки исчерпывающих инструкций в начальные запросы. Это сознательное усилие в разработке запросов и тщательное cost management определяет, станет ли Opus 4.7 мощным союзником или дорогостоящей ловушкой для токенов.

Часто задаваемые вопросы

Почему Opus 4.7 использует больше токенов, чем 4.6, для одного и того же запроса?

Opus 4.7 использует обновленный токенизатор, который может преобразовывать текст в 1,0-1,35 раза больше токенов. Его 'adaptive thinking' также добавляет накладные расходы на рассуждения к каждому ходу, увеличивая количество токенов в диалогах.

Является ли снижение 'effort level' на Opus 4.7 хорошим способом сэкономить токены?

Не всегда. Хотя это уменьшает количество токенов за ход, это может привести к большему количеству циклов исправлений, если результат слабый, что в конечном итоге увеличивает общее количество токенов. Лучшая стратегия — предоставить полный, подробный запрос заранее.

Что такое метод запросов 'capable engineer' для Opus 4.7?

Это означает отношение к ИИ как к старшему разработчику. Вы предоставляете всю задачу, включая ограничения, критерии приемлемости и расположение файлов, в самом первом запросе, чтобы минимизировать количество диалоговых ходов и накладные расходы на рассуждения.

Всегда ли использование Opus 4.7 дороже, чем Opus 4.6?

В зависимости от задачи, это возможно. Хотя цена за токен остается прежней, увеличенное использование токенов может повысить затраты. Однако его улучшенные возможности могут решать сложные задачи быстрее с меньшим количеством общих итераций, потенциально снижая общую стоимость при правильном использовании.

Часто задаваемые вопросы

Anthropic манипулирует своей собственной системой?
Совет Anthropic относиться к Opus 4.7 как к capable engineer, требуя исчерпывающих начальных подсказок, вызывает немедленный скептицизм. Этот подход, хотя потенциально и дает лучшие результаты, по своей сути увеличивает потребление токенов. Учитывая, что обновленный токенизатор Opus 4.7 уже преобразует один и тот же входной текст в 1,0–1,35 раза больше токенов — иногда до 1,47x для технических документов — эта рекомендация выгодно сказывается на прибыли Anthropic, которая взимает $5 за миллион входных токенов.
Почему Opus 4.7 использует больше токенов, чем 4.6, для одного и того же запроса?
Opus 4.7 использует обновленный токенизатор, который может преобразовывать текст в 1,0-1,35 раза больше токенов. Его 'adaptive thinking' также добавляет накладные расходы на рассуждения к каждому ходу, увеличивая количество токенов в диалогах.
Является ли снижение 'effort level' на Opus 4.7 хорошим способом сэкономить токены?
Не всегда. Хотя это уменьшает количество токенов за ход, это может привести к большему количеству циклов исправлений, если результат слабый, что в конечном итоге увеличивает общее количество токенов. Лучшая стратегия — предоставить полный, подробный запрос заранее.
Что такое метод запросов 'capable engineer' для Opus 4.7?
Это означает отношение к ИИ как к старшему разработчику. Вы предоставляете всю задачу, включая ограничения, критерии приемлемости и расположение файлов, в самом первом запросе, чтобы минимизировать количество диалоговых ходов и накладные расходы на рассуждения.
Всегда ли использование Opus 4.7 дороже, чем Opus 4.6?
В зависимости от задачи, это возможно. Хотя цена за токен остается прежней, увеличенное использование токенов может повысить затраты. Однако его улучшенные возможности могут решать сложные задачи быстрее с меньшим количеством общих итераций, потенциально снижая общую стоимость при правильном использовании.
🚀Узнать больше

Будьте в курсе трендов ИИ

Откройте лучшие инструменты ИИ, агенты и MCP-серверы от Stork.AI.

P.S. Сделали что-то полезное? Опубликуйте на Stork — $49

Все статьи