Кратко / Главное
Великий парадокс вычислительных мощностей ИИ
Лаборатории, такие как OpenAI и Anthropic, часто называют критическое узкое место: дефицит AI compute. Тем не менее, Google работает с позиции глубокого изобилия, не только питая свои собственные колоссальные модели, такие как Gemini, но и поставляя вычислительную мощность своим самым яростным конкурентам. Этот поразительный парадокс раскрывает уникальное стратегическое преимущество Google.
Генеральный директор Google Cloud Томас Куриан предлагает ключевое понимание этого неравенства. Он подчеркивает уникальное положение Google: владение всем стеком ИИ, от пользовательского silicon, такого как его Tensor Processing Units (TPUs), до передовых моделей ИИ и базовой инфраструктуры корпоративных данных. Этот полный контроль стека позволяет Google оптимизировать каждый уровень для беспрецедентной эффективности и масштаба.
Как Google может поддерживать такую огромную мощность, даже продавая ее конкурентам, таким как Anthropic, когда другие испытывают трудности? Ответ кроется в десятилетиях тщательного, долгосрочного стратегического планирования. Google предвидел бум ИИ много лет назад, заблаговременно обеспечив обширные площади для центров обработки данных и диверсифицировав свои источники энергии для обеспечения бесперебойного питания.
Компания также произвела революцию в строительстве центров обработки данных, перейдя от традиционных методов строительства к более эффективному производственному процессу. Это резко сократило время цикла развертывания машин, что позволило быстро масштабироваться. Приверженность Google разработке собственных TPU на протяжении более десяти лет еще больше укрепила ее аппаратную независимость и экономическую эффективность, гарантируя ей получение «отличной прибыли» независимо от того, как она монетизирует свои вычислительные мощности.
Это предвидение выливается в огромные обязательства, такие как обещание Anthropic использовать до одного миллиона TPUs и примерно 3,5 гигаватта вычислительных мощностей следующего поколения на базе TPU, начиная с 2027 года. Способность Google генерировать значительный денежный поток, предоставляя эту мощность, финансирует ее собственные амбициозные исследования в области ИИ, создавая самоподдерживающийся цикл инноваций и доминирования в инфраструктуре.
Козырь Google: Десятилетие пользовательского Silicon
Секретное оружие Google — это ее пользовательский silicon, Tensor Processing Unit (TPU). В отличие от GPU общего назначения от NVIDIA, TPU — это специализированные интегральные схемы (ASICs), разработанные с нуля для машинного обучения. Этот специализированный дизайн обеспечивает им превосходную эффективность и производительность на ватт для рабочих нагрузок ИИ, оптимизируя как задачи обучения, так и задачи вывода по всей обширной инфраструктуре Google.
Компания начала этот амбициозный путь более 12 лет назад, сделав стратегическую ставку, которая теперь приносит огромные дивиденды. Эта долгосрочная приверженность разработке проприетарных чипов уникальным образом поставила Google впереди текущего бума ИИ, позволив ей масштабировать свои собственные модели и поддерживать партнеров, таких как Anthropic. Последние TPU 8-го поколения от Google, TPU 8t для обучения и TPU 8i для вывода, являются примером этого лидерства. TPU 8t масштабируется до 9600 чипов с двумя петабайтами общей высокоскоростной памяти, удваивая пропускную способность между чипами по сравнению с предыдущим поколением и обеспечивая до 2,7-кратного улучшения производительности на доллар для крупномасштабного обучения.
Владение этой интеллектуальной собственностью позволяет Google осуществлять беспрецедентный контроль над своей инфраструктурой AI. Эта вертикальная интеграция напрямую приводит к значительному контролю затрат, оптимизированной производительности, адаптированной к ее обширной экосистеме, и критически важной изоляции от узких мест в цепочке поставок, которые преследуют конкурентов, полагающихся на стороннее оборудование. Генеральный директор Google Cloud Томас Куриан подчеркивает: «Мы владеем нашей собственной IP. Мы не просто дистрибьютор чужой IP», выделяя их способность достигать высокой операционной прибыли и обеспечивать выгодные условия с поставщиками благодаря агрегированному спросу.
TPU теперь выходят далеко за рамки внутренних потребностей Google в AI или даже обеспечения работы партнеров, таких как Anthropic, которая обязалась использовать до одного миллиона TPU, начиная с 2027 года, для своей модели Mythos с 10 триллионами параметров. Google Cloud диверсифицирует монетизацию TPU, развертывая их как инфраструктуру общего назначения. Министерство энергетики (Department of Energy) использует TPU для высокопроизводительных вычислений. Фирмы на рынках капитала, такие как Citadel, все чаще используют их для алгоритмической торговли, переходя от традиционных численных вычислений к более быстрым и эффективным методам, основанным на инференсе. Это широкое внедрение подчеркивает универсальность TPU и стратегическое преимущество Google в условиях ограниченных вычислительных ресурсов в сфере AI.
Зачем делиться своей суперсилой?
Почему Google, обладая беспрецедентными вычислительными мощностями AI, делится своим секретным оружием? Генеральный директор Google Cloud Томас Куриан прямо отвечает на этот вопрос, заявляя о необходимости «зарабатывать деньги, чтобы финансировать все это». Даже при огромных ресурсах Google, колоссальные капитальные затраты, необходимые для разработки AI — прогнозируемые на уровне от 175 до 185 миллиардов долларов к 2026 году — требуют постоянного денежного потока.
Куриан излагает трехстороннее бизнес-обоснование для демократизации доступа к их специализированным Tensor Processing Units (TPUs). Во-первых, это генерирует критически важный денежный поток, балансируя внутренние потребности Google с внешним спросом. Во-вторых, это обеспечивает значительное влияние на цепочку поставок. Совокупный спрос Google, представляющий гораздо больший объем, обеспечивает выгодные условия от поставщиков компонентов, гарантируя надежный и эффективный производственный конвейер.
В-третьих, совместное использование TPU улучшает сам продукт. Разнообразные требования клиентов, от финансовых фирм, таких как Citadel, до государственных учреждений, таких как Department of Energy, побуждают Google к инновациям и совершенствованию своего аппаратного и программного обеспечения. Это широкое использование превращает TPU в более универсальную инфраструктуру, выходящую далеко за рамки первоначальных алгоритмов AI. Для получения дополнительной технической информации изучите Tensor Processing Units (TPUs) - Google Cloud.
Эта стратегия также предлагает спасательный круг другим лабораториям AI. Куриан подчеркивает, что «венчурный капитал не может финансировать вас бесконечно», поскольку затраты на вычисления для масштабных обучающих прогонов растут. Модель Google предоставляет путь к прибыльности, позволяя таким лабораториям, как Anthropic, масштабироваться, не полагаясь исключительно на все более неустойчивое венчурное финансирование (VC funding). Обязательство Anthropic использовать до одного миллиона Google Cloud TPUs для своей модели Claude Mythos 5, начиная с 2027 года, является примером этих симбиотических отношений.
В конечном итоге, Google превращает внутреннее инженерное чудо в мощную, приносящую доход платформу. Этот шаг укрепляет рыночную позицию Google Cloud не просто как поставщика инфраструктуры, но как ключевого партнера для передовой разработки AI. Учитывая, что 75% клиентов Google Cloud теперь используют ее продукты AI, а модели обрабатывают более 16 миллиардов токенов в минуту, эта стратегия явно приносит дивиденды.
Новые титаны: TPU v8 прибыли
Google официально представила свои Tensor Processing Units 8-го поколения, что знаменует собой значительный скачок в аппаратном обеспечении ИИ. Линейка включает TPU 8t для интенсивных рабочих нагрузок обучения и TPU 8i, оптимизированный для эффективного вывода. Этот двухсторонний подход нацелен на различные фазы разработки и развертывания моделей ИИ.
Исследования подчеркивают существенное увеличение производительности нового оборудования. TPU 8t обеспечивает впечатляющее улучшение производительности на доллар в 2,7 раза для крупномасштабного обучения по сравнению со своим предшественником, Ironwood. Для вывода TPU 8i может похвастаться увеличением производительности на доллар до 80%, что делает крупномасштабный ИИ более доступным и экономичным.
Помимо чистой скорости, TPU 8-го поколения отдают приоритет эффективности. И 8t, и 8i достигают до 2 раз лучшей энергоэффективности, решая растущие проблемы, связанные с энергопотреблением ИИ. TPU 8t масштабируется до ошеломляющих 9600 чипов и двух петабайт общей высокоскоростной памяти, удваивая пропускную способность между чипами. TPU 8i также значительно увеличивает емкость до 331,8 ТБ HBM на под, что является огромным скачком по сравнению с 49,2 ТБ предыдущего поколения.
Эти аппаратные достижения открывают новые возможности для ИИ. Более быстрое обучение означает, что разработчики могут итерировать более крупные и сложные модели за меньшее время, расширяя границы того, что может достичь ИИ. Более дешевый и эффективный вывод позволяет развертывать модели следующего поколения в масштабе, снижая эксплуатационные расходы для пользователей в Google Cloud.
Критически важно, что эта вычислительная мощность позволяет размещать модели, ранее считавшиеся невыполнимыми из-за масштаба. Слухи о модели Anthropic с 10 триллионами параметров, Mythos, служат тому примером. Такие массивные модели, требующие беспрецедентных вычислительных ресурсов, теперь могут найти свое место на передовой инфраструктуре TPU Google, стимулируя следующую волну агентского ИИ.
Монстр Anthropic с 10 триллионами параметров
Слухи о модели Anthropic Claude Mythos 5 представляют собой новый рубеж в ИИ. Эта колоссальная модель, как сообщается, может похвастаться беспрецедентными 10 триллионами параметров, масштабом, который затмевает даже самые крупные общеизвестные модели и переопределяет ожидания от генеративного ИИ. Такой огромный масштаб сигнализирует о глубоком скачке в возможностях ИИ, указывая на переход от чат-ботов общего назначения к высокоспециализированным, мощным агентам.
Критически важно, что этот левиафан генеративного ИИ — не просто концепция; он активно обучается и обслуживается на надежной инфраструктуре TPU Google Cloud. Решение Anthropic использовать специализированные чипы Google для модели масштаба Mythos служит мощным публичным подтверждением беспрецедентной вычислительной мощности, эффективности и масштабируемости платформы. Это партнерство подчеркивает критическую роль Google
Стратегия «Друговрага»: Поддержка конкурентов
Стратегия Google с ее специализированными Tensor Processing Units (TPUs) раскрывает увлекательную динамику «коопетиции», особенно с Anthropic. В то время как Google разрабатывает свои собственные фундаментальные модели, такие как Gemini, она одновременно поддерживает конкурентов, таких как Anthropic, ведущая лаборатория ИИ, которая, по слухам, разрабатывает модель Claude Mythos 5 с 10 триллионами параметров. Эти парадоксальные отношения подчеркивают просчитанный шаг в высококонкурентной гонке ИИ.
Anthropic получает критически важный доступ к вычислительной мощности мирового класса и экономически эффективной на Google Cloud, что необходимо для обучения и развертывания моделей огромного масштаба Mythos 5. Недавно анонсированный TPU 8t предлагает до 2,7-кратного улучшения производительности на доллар для крупномасштабного обучения, в то время как TPU 8i обеспечивает до 80% лучшую производительность на доллар для вывода. Эта эффективность позволяет Anthropic расширять границы разработки ИИ без непомерных первоначальных затрат на инфраструктуру.
Для Google эти отношения подтверждают, что ее платформа TPU является передовым решением для исследований в области передового ИИ. Обеспечение работы Anthropic приносит значительный доход, способствуя денежному потоку, необходимому для финансирования масштабных капитальных затрат Google, прогнозируемых в диапазоне от 175 до 185 миллиардов долларов в 2026 году. Эта диверсификация также укрепляет позиции Google с поставщиками в цепочке поставок, обеспечивая выгодные условия благодаря агрегированному спросу.
Принятие подхода открытой платформы, а не накопление вычислительных ресурсов, ускоряет инновации во всей индустрии ИИ. Генеральный директор Google Cloud Томас Куриан подчеркивает, что Google балансирует свои собственные потребности с внешним спросом, обеспечивая достаточный денежный поток и способствуя развитию более широкой экосистемы. Это резко контрастирует с закрытой стратегией, которая потенциально может подавить те самые прорывы, которые могли бы стимулировать будущий спрос на инфраструктуру Google.
Несмотря на поддержание мультиоблачной стратегии, также используя платформы, такие как AWS и NVIDIA, Anthropic значительно углубляет свои инвестиции в Google. Компания обязалась использовать до одного миллиона TPUs и примерно 3,5 гигаватт вычислительных мощностей следующего поколения на базе TPU от Google Cloud, начиная с 2027 года. Это существенное обязательство демонстрирует уверенность Anthropic в специализированных чипах Google для своих самых амбициозных проектов. Для получения дополнительной информации об их работе посетите Home \ Anthropic.
Помимо чистой мощности: Экономика доминирования ИИ
Помимо чистых терафлопс и теоретической пиковой производительности, истинное поле битвы за доминирование в ИИ все больше смещается к общей стоимости владения (TCO). В то время как NVIDIA рекламирует свои возможности GPU, Google Cloud позиционирует свои специализированные Tensor Processing Units (TPU) как экономически превосходящий выбор, что особенно убедительно для компаний, сталкивающихся с астрономическими затратами на разработку и развертывание больших языковых моделей. Речь идет не только о более быстрых чипах; речь идет обо всех операционных расходах.
Отличительное преимущество Google проистекает из ее глубокой вертикальной интеграции. Компания разрабатывает собственные чипы, строит свои специализированные центры обработки данных, оптимизированные для этого оборудования, и разрабатывает программный стек, который всем этим управляет. Этот сквозной контроль позволяет Google точно настраивать каждый уровень для максимальной эффективности и передавать эту экономию клиентам. Конкуренты часто перепродают оборудование другой компании, неся дополнительные наценки и не имея целостной оптимизации, которую предоставляет Google. Это фундаментальное различие позволяет Google предлагать превосходную экономику единицы.
Генеральный директор Google Cloud Томас Куриан подчеркивает эти «привлекательные экономические показатели единицы» как ключевое конкурентное преимущество в условиях постоянного дефицита мощностей. Для таких клиентов, как Anthropic, обучающих колоссальную модель с 10 триллионами параметров, такую как Mythos 5, повышение эффективности напрямую приводит к экономии миллиардов в течение всего срока службы проекта. Например, недавно анонсированный TPU 8t обещает до 2,7-кратного улучшения производительности на доллар по сравнению с предшественником для крупномасштабного обучения, в то время как TPU 8i предлагает до 80% улучшения производительности на доллар для рабочих нагрузок инференса.
Что особенно важно, эта экономическая эффективность распространяется на производительность на ватт. В мире, заботящемся об энергопотреблении, где центры обработки данных ИИ потребляют огромную мощность, аппаратная эффективность Google представляет собой как экологический императив, так и значительное экономическое преимущество. TPU 8-го поколения обеспечивают до 2-кратного улучшения производительности на ватт по сравнению с предыдущим поколением, напрямую сокращая операционные расходы, связанные с электричеством и охлаждением. Эта эффективность делает вычислительные мощности Google не только мощными, но и устойчиво масштабируемыми, что является критически важным фактором для долгосрочной инфраструктуры ИИ.
Этот комплексный подход позволяет Google не только поддерживать собственные амбициозные проекты в области ИИ, но и стратегически подпитывать ключевых партнеров и конкурентов. Предоставляя экономически эффективную и высокопроизводительную основу, Google гарантирует, что ее TPUs станут незаменимой инфраструктурой, укрепляя ее позиции в экосистеме ИИ даже при усилении конкуренции. Это тонкий, но мощный рычаг в стратегии Google «заклятых друзей».
Строим будущее по-заводски
Генеральный директор Google Cloud Томас Куриан раскрывает радикальный сдвиг в развертывании центров обработки данных, переходя от традиционного строительства к производственному подходу. Этот инновационный подход включает предварительную сборку и тестирование целых рядов центров обработки данных за пределами площадки. Затем Google быстро развертывает эти стандартизированные, модульные блоки, значительно сокращая время цикла по сравнению с обычными методами строительства с нуля.
Эта операционная эффективность имеет первостепенное значение для опережения кривой вычислений ИИ. Куриан подчеркивает, что производство позволяет значительно быстрее развертывать инфраструктуру, чем строительство, что является жизненно важной возможностью, учитывая неустанный и растущий спрос как со стороны внутренних проектов Google, так и внешних ИИ-лабораторий, таких как Anthropic. Эта стратегия напрямую позволяет Google масштабировать свое физическое присутствие беспрецедентными темпами.
Приверженность Google этой физической инфраструктуре огромна: капитальные затраты, по прогнозам, достигнут от 175 до 185 миллиардов долларов в 2026 году. Эти значительные инвестиции напрямую приводят к существенному экономическому эффекту, способствуя созданию рабочих мест в местных сообществах вокруг этих передовых объектов. От строительных профессий до высококвалифицированных техников — возникает широкий спектр возможностей для трудоустройства.
Компания активно реагирует на общественное мнение, интегрируя передовые энергетические решения в свою стратегию центров обработки данных. Это включает диверсификацию источников энергии, развертывание технологий «за счетчиком» и использование возобновляемых источников энергии для повышения устойчивости и надежности своих энергоемких объектов. Google стремится быть ответственным соседом, строя будущее ИИ.
Этот стратегический переход от индивидуального строительства к эффективному, повторяемому производству напрямую лежит в основе способности Google удовлетворять ненасытный спрос на вычисления ИИ. Он обеспечивает быстрое масштабирование ее специализированных Tensor Processing Units (TPUs), удовлетворяя колоссальные требования таких моделей, как Anthropic’s 10-триллионно-параметрический Mythos 5.
Оптимизируя свое физическое присутствие и ускоряя развертывание, Google не только обеспечивает необходимую вычислительную мощность для своих собственных достижений в области ИИ, но и сохраняет свою позицию критически важного поставщика высокопроизводительной инфраструктуры. Это операционное мастерство позволяет Google поддерживать разнообразную экосистему разработки ИИ, включая ее конкурентов-«заклятых друзей», укрепляя свою основополагающую роль в эпоху ИИ.
Рассвет «Эры агентов»
Генеральный директор Google Cloud Томас Куриан недвусмысленно заявил, что «эра агентов наступила», что знаменует собой ключевой сдвиг в применении ИИ. Это заявление сигнализирует о переходе от разговорных чат-ботов и простых систем вопросов и ответов к сложным, автономным сущностям, способным выполнять сложные бизнес-процессы в масштабах предприятий. Мощная вычислительная инфраструктура Google, основанная на ее новейших TPU 8t и TPU 8i, специально создана для поддержки этой следующей волны ИИ.
Агент ИИ выходит за рамки простого поиска информации; это система, разработанная для автоматизации сложных, многоэтапных процессов с минимальным участием человека. В отличие от статической модели, агент может воспринимать свою среду, рассуждать о своих целях, планировать действия и выполнять их, часто взаимодействуя с несколькими корпоративными системами и источниками данных. Эта возможность имеет решающее значение для повышения операционной эффективности в различных отраслях.
Вертикально интегрированный стек Google, от специализированного кремния до передовых моделей, уникально позиционирует его для поддержки этих требовательных рабочих нагрузок. Представьте себе агентов, помогающих медицинским страховщикам автоматизировать сложную обработку претензий, от первоначальной подачи до окончательной выплаты, или расширяющих возможности онкологов, просеивая обширную медицинскую литературу и данные пациентов для предложения персонализированных протоколов лечения. Эти приложения требуют беспрецедентной надежности и производительности, напрямую используя значительные достижения в технологии TPU.
Для облегчения разработки и развертывания этих сложных систем Google представила Gemini Enterprise Agent Platform. Это комплексное решение предоставляет надежные инструменты, необходимые для создания, оркестровки и управления агентами ИИ в масштабе любого корпоративного окружения. Оно гарантирует, что агенты могут безопасно получать доступ к конфиденциальным данным, соответствовать строгим нормам и беспрепятственно интегрироваться в существующие ИТ-ландшафты, открывая совершенно новые уровни автоматизации. Для получения дополнительной информации о больших моделях, лежащих в основе таких агентов, можно изучить обсуждения, такие как Anthropic Claude Mythos 5: The First 10-Trillion-Parameter Model — Scaling Laws Hit a New Milestone | by Analyst Uttam | AI & Analytics Diaries | Apr, 2026 | Medium. Эта платформа подчеркивает приверженность Google к созданию практичных, агентных решений ИИ для будущего.
Настоящий ров — это не модель
Истинное конкурентное преимущество Google выходит далеко за рамки любой отдельной модели ИИ, такой как Gemini, или даже предполагаемого гиганта с 10 триллионами параметров, такого как Mythos 5 от Anthropic. Его стратегический гений заключается в контроле над всей цепочкой создания стоимости ИИ, вертикально интегрированной империей, простирающейся от кремния до платформы. Этот полностековый подход позиционирует Google как незаменимую основу для растущей экономики ИИ, обеспечивая масштабы, о которых другие могут только мечтать.
Разрабатывая собственные специализированные Tensor Processing Units (TPUs), строя сверхэффективные центры обработки данных и организуя глобальную сеть, предназначенную для рабочих нагрузок ИИ, Google диктует базовую экономику и производительность всей отрасли. Его надежные программные платформы еще больше укрепляют это доминирование, предлагая разработчикам и предприятиям полную, оптимизированную экосистему. Эта беспрецедентная инфраструктура позволяет Google Cloud обеспечивать разработку таких массивных моделей, как Mythos 5, и поддерживать «эру агентов», которую предвидит Kurian.
Общественность и СМИ часто зацикливаются на «гонке моделей», отмечая прорывы в больших языковых моделях и их возможностях. Однако настоящая власть достается компании, которая владеет ипподромом, конюшнями и кормом. Google — не просто участник; это архитектор и владелец всей арены ИИ, получающий прибыль независимо от того, преуспевают ли его собственные модели или модели его «друзей-соперников», таких как Anthropic.
По мере того как модели ИИ неизбежно будут становиться все более стандартизированными, главными «делателями королей» станут поставщики этой фундаментальной вычислительной инфраструктуры. Десятилетняя ставка Google на специализированный кремний и комплексное облачное предложение идеально позиционирует его как эту незаменимую силу. Этот всеобъемлющий контроль обеспечивает долгосрочное влияние Google, делая его тихим, мощным двигателем следующего поколения искусственного интеллекта.
Часто задаваемые вопросы
Что такое Google TPU и почему это важно?
Tensor Processing Unit (TPU) — это специально разработанный чип-ускоритель ИИ, созданный Google. Он крайне важен, поскольку обеспечивает высокоэффективные и экономичные вычисления для обучения и запуска крупномасштабных AI models, предоставляя Google контроль над всей своей аппаратной и программной инфраструктурой.
Что такое модель Mythos от Anthropic?
Claude Mythos 5 от Anthropic — это, по слухам, AI model с 10 триллионами параметров, одна из крупнейших из когда-либо задуманных. Она разработана для выполнения критически важных задач, таких как cybersecurity и coding, и разрабатывается с использованием мощной TPU infrastructure Google Cloud.
Почему Google продает свои ценные вычислительные мощности TPU таким конкурентам, как Anthropic?
Генеральный директор Google Cloud Томас Куриан объясняет, что это стратегическое бизнес-решение. Оно генерирует значительный денежный поток для финансирования R&D, создает более крупный рынок, который обеспечивает влияние на supply chain vendors, а диверсификация вариантов использования улучшает продукт для всех.
В чем заключается улучшение новой TPU v8 от Google?
TPU v8 8-го поколения предлагает значительные улучшения. TPU 8t (training) имеет до 2,7 раз лучшую performance-per-dollar, в то время как TPU 8i (inference) имеет улучшение до 80%. Оба до 2 раз более power-efficient, чем предыдущее поколение.