Крупные компании, строящие масштабные ИИ-модели, традиционно закупают графические процессоры Nvidia. Однако Google идёт другим путём: её облачная инфраструктура для ИИ основана на собственных тензорных процессорах (TPU). После анонса TPU седьмого поколения Ironwood в 2025 году компания представила восьмое поколение — TPU 8t и TPU 8i.

По словам Google, новые чипы не просто более быстрые версии предыдущих, а принципиально новая архитектура, адаптированная под требования «агентного ИИ». Это новый этап развития искусственного интеллекта, где системы не только обрабатывают данные, но и принимают автономные решения.

Что нового в TPU восьмого поколения?

  • TPU 8t — предназначен для обучения моделей. Сокращает время обучения передовых ИИ-систем с месяцев до недель.
  • TPU 8i — оптимизирован для инференса (вывода результатов), что ускоряет работу готовых моделей.

По данным Google, новые чипы демонстрируют значительное улучшение энергоэффективности и производительности. Это особенно важно для компаний, работающих с большими языковыми моделями и мультимодальными системами.

Почему Google отказывается от Nvidia?

Хотя Nvidia остаётся лидером на рынке ИИ-ускорителей, Google делает ставку на собственные решения. Причины:

  • Интеграция с экосистемой Google Cloud — TPU оптимизированы для работы с TensorFlow и другими инструментами компании.
  • Контроль над инфраструктурой — Google не зависит от сторонних поставщиков, что снижает риски сбоев и задержек.
  • Специализация под «агентный ИИ» — новые чипы разрабатывались с учётом потребностей автономных ИИ-агентов, а не только традиционных моделей.

Реакция рынка и перспективы

Аналитики отмечают, что Google бросает вызов Nvidia, но пока не ясно, сможет ли компания потеснить лидера. В то же время, новые TPU могут стать ключевым элементом в гонке за создание более мощных и автономных ИИ-систем.

Эксперты прогнозируют, что в ближайшие годы «агентный ИИ» станет основным трендом, и компании, инвестирующие в соответствующие аппаратные решения, получат конкурентное преимущество.

Источник: Ars Technica