20 мая Alibaba Group представила новый ИИ-чип Zhenwu M890. Новинка выходит на фоне усиления попыток китайских технологических компаний выстроить собственную экосистему вычислителей вместо решений Nvidia — на практике это связано с ужесточением американских экспортных ограничений для чипов высокой производительности.
Что представляет собой Zhenwu M890
Разработкой занимается полупроводниковое проектное подразделение Alibaba — T-Head. Компания позиционирует Zhenwu M890 как заметный шаг вперёд по сравнению с предыдущей моделью Zhenwu 810E: заявленная производительность выше в три раза.
Ключевая особенность чипа — ориентация на новый класс программных систем, которые называют «агентами» в контексте ИИ. Под «агентами» обычно понимают программных помощников, способных выполнять многошаговые задачи: они анализируют входные данные, планируют последовательность действий и действуют в рамках заданных ограничений, не требуя постоянного ручного управления со стороны человека.
Почему чип рассчитан на «агентные» нагрузки
Alibaba отмечает, что M890 особенно подходит для сценариев, где одновременно высоки требования к памяти и обмену данными. Для агентных задач это критично: модели должны удерживать длительные фрагменты контекста (то есть помнить, что происходило раньше), а также координироваться в реальном времени, когда несколько компонентов системы работают параллельно или обмениваются промежуточными результатами.
Дорожная карта: что будет после M890
Компания представила план обновления линейки чипов на несколько лет. По словам Alibaba, после M890 следующим поколением станет процессор V900, который выйдет в третьем квартале 2027 года. Далее, в третьем квартале 2028 года, ожидается чип J900.
Для V900 Alibaba прогнозирует ещё примерно трёхкратный прирост производительности по сравнению с M890. Такая последовательность обновлений должна подтвердить, что компания намерена сохранять регулярный темп развития собственной «силиконовой» платформы.
Контекст: ответ на ограничения и гонка за собственными ИИ-чипами
План Alibaba отражает общую тенденцию на китайском рынке: усиливающийся спрос на ИИ-вычисления подталкивает к созданию локальных альтернатив. В основе давления — запреты Вашингтона на поставки в Китай наиболее мощных американских процессоров, которые ранее широко использовались для обучения и работы ИИ-систем.
В материале также подчёркивается, что это не единичный шаг: ранее аналогичное заявление делала Huawei.
Ресурсы для инфраструктуры: крупные вложения в облако и ИИ
Дополнительный сигнал серьёзности намерений — инвестиционная программа Alibaba. В прошлом году компания из Ханчжоу пообещала направить на облачную и ИИ-инфраструктуру более 380 млрд юаней (что эквивалентно 53 млрд долларов) в течение трёх лет. Это названо крупнейшим в истории компании обязательством по финансированию данного направления.
Подобные расходы отражают ожидание, что потребность в вычислительной мощности будет продолжать расти по мере того, как бизнес в Китае будет внедрять агентные приложения — от корпоративных ассистентов до более сложных сценариев автоматизации.
Где представили технологию: Alibaba Cloud Summit
Презентация M890 прошла на ежегодном Alibaba Cloud Summit. Помимо чипа компания показала и новое серверное решение — Panjiu AL128.
Система Panjiu AL128 рассчитана на размещение 128 ускорителей в одном серверном «стойке» (rack). Такой подход обычно удобен для масштабирования дата-центров: заказчик может наращивать вычисления блоками, не перестраивая инфраструктуру с нуля.
Доступность для клиентов и платформа Bailian
По данным Alibaba, новый серверный комплекс доступен сразу китайским корпоративным заказчикам через внутреннюю модельную платформу Alibaba Cloud. Она называется Bailian (Байлянь).
Опыт T-Head: объёмы поставок и отрасли
T-Head заявила, что к настоящему моменту отгружено более 560 000 устройств линейки Zhenwu. Компания также указывает, что число внешних клиентов превышает 400, а применение чипов уже затронуло 20 отраслей — среди них названы автопроизводители и финансовые организации.
Параллельный релиз: Qwen 3.7-Max
В рамках того же выступления Alibaba представила Qwen 3.7-Max — очередную версию своего флагманского большого языкового модели (LLM). Компания позиционирует её как разработанную для продвинутого кодинга и для агентных задач, которые могут выполняться длительное время.
Отдельно отмечается, что модель способна работать непрерывно до 35 часов без снижения качества (в компании это описывают как отсутствие деградации производительности).
Справка: что означает рост «агентных» вычислений
Агентные сценарии обычно требуют не только быстрой обработки запросов, но и стабильного управления контекстом, а также эффективного обмена данными между компонентами системы. Именно поэтому в таких проектах особое значение приобретают чипы, ориентированные на высокую пропускную способность памяти и межсоединений — то есть на то, чтобы «агент» мог удерживать смысловую нить и координировать действия на протяжении всей многошаговой задачи.
