Технологический гигант Alphabet, которому принадлежит Google, ведёт переговоры с Marvell Technology о создании двух новых чипов, ориентированных на более эффективное выполнение задач с нейросетями. Об этом стало известно из публикации The Information. На ожиданиях, связанных с возможным сотрудничеством, котировки Marvell в допродажной сессии пошли вверх.
Что именно планируют разработать
Согласно сообщению, в рамках обсуждений рассматриваются два отдельных решения. Одно из них — memory processing unit (MPU), то есть процессорный модуль, заточенный под работу с памятью. Его предполагается использовать в паре с tensor processing unit (TPU) компании Google.
Второй чип — это новая TPU, разработанная специально для этапа inference, то есть для «вывода» уже обученных моделей. Если обучение — это процесс настройки параметров модели на данных, то inference применяется, когда модель уже готова и используется для выдачи результатов: распознавания, прогнозирования, генерации контента и других прикладных задач.
Сроки и производственный этап
Компании, как утверждается, рассчитывают согласовать архитектуру чипа для работы с памятью уже в следующем году. Далее планируется перейти к этапу тестового выпуска и проверок перед запуском серийного производства.
Почему этот шаг важен для Google
Переговоры с Marvell — ещё один сигнал о том, что Google системно укрепляет свои позиции на рынке ИИ-вычислений. Ключевой акцент делается на том, чтобы TPUs (ускорители для тензорных вычислений) выглядели как реальная и убедительная альтернатива Nvidia, которая долгое время доминирует благодаря своим графическим процессорам (GPU) — именно они стали стандартом де-факто для множества ИИ-проектов.
Для Google Cloud продажи TPU становятся всё более значимым источником выручки. Это связано с тем, что компания параллельно наращивает расходы на ИИ и стремится показать отдачу от этих инвестиций.
Как Google меняла модель продаж TPU
На протяжении значительной части своей истории Google использовала TPU в основном для собственных нужд — то есть внутри экосистемы компании. Однако в 2022 году ситуация изменилась: облачное подразделение Google смогло добиться передачи полномочий по коммерческой продаже чипов группе, которая занимается внешними поставками. В результате объём TPU, доступный для клиентов, заметно увеличился.
По мере роста спроса на вычисления для ИИ Google начала масштабировать как производство TPU, так и их поставки заказчикам. Ещё в прошлом году компания перешла к модели, при которой ускорители стали продаваться напрямую для размещения в собственных дата-центрах клиентов. Раньше доступ к таким мощностям, как правило, был жёстче привязан к инфраструктуре самой облачной платформы.
Связь с TorchTPU и попытка упростить внедрение
В начале текущего месяца Google официально объявила инициативу TorchTPU. Её цель — добиться нативной совместимости чипов Google с PyTorch — одним из самых распространённых фреймворков для разработки и обучения нейросетей.
Смысл проекта в том, чтобы разработчикам было проще переносить существующие рабочие нагрузки, написанные под PyTorch, на TPU с минимальными изменениями в коде. Для многих компаний это критичный фактор: когда инфраструктура уже построена вокруг конкретного ПО, любые серьёзные миграции могут тормозить переход. Упрощение совместимости снижает эту «трение», ускоряя внедрение TPU и дополнительно усиливая давление на позиции Nvidia на рынке ИИ-вычислений.
Коротко о терминах
- TPU — специализированный ускоритель для тензорных операций, созданный для задач машинного обучения и ИИ.
- MPU (memory processing unit) — модуль, ориентированный на работу с памятью и передачей данных, чтобы снизить узкие места при вычислениях.
- Inference — использование обученной модели для получения результата (а не для обучения).
- PyTorch — популярная среда разработки для ИИ, на которой строится множество моделей и пайплайнов.
Если стороны действительно доведут проект до тестового производства и затем начнут выпуск, это может стать важным шагом в конкурентной гонке за инфраструктуру для ИИ: не только по мощности, но и по эффективности работы с памятью и по удобству внедрения для разработчиков.
