Китайская компания DeepSeek объявила о серии ценовых послаблений для разработчиков, приуроченных к запуску нового поколения моделей. До 5 мая сервис будет предлагать существенную скидку на недавно представленный ИИ-вариант DeepSeek-V4-Pro, а также пересчитает стоимость операций с входными «кэш-попаданиями» в рамках всей линейки DeepSeek API.
Скидка на DeepSeek-V4-Pro: как долго действует
В сообщении компании указано, что скидка составляет 75% на модель DeepSeek-V4-Pro. Акция будет доступна разработчикам с 27 апреля и продлится до 5 мая. Такая мера обычно направлена на то, чтобы ускорить внедрение новых моделей в тестовые и пилотные проекты: снижение цены делает экспериментирование менее затратным, особенно когда речь идет о регулярных запросах к API.
Как меняется стоимость «кэш-попаданий» в API
Параллельно DeepSeek снизила тарифы на «input cache hits» — это ситуации, когда при повторном обращении к API система может использовать ранее вычисленные результаты для уже встречавшихся фрагментов входных данных. В технологическом смысле кэш помогает уменьшить вычислительную нагрузку и время ответа, поскольку часть работы не нужно выполнять заново.
Компания заявила, что теперь цена таких операций составит одну десятую от первоначальной стоимости. Снижение применяется ко всей линейке DeepSeek API, то есть затрагивает разные сценарии использования, где разработчики повторно передают схожие промпты или структуру запросов.
Премьера V4: адаптация под чипы Huawei
В пятницу DeepSeek вывела в режим предпросмотра модель V4 — одну из самых ожидаемых итераций в своем развитии. Особенность релиза в том, что новая версия V4 была адаптирована под технологию чипов Huawei. Для рынка это важно, поскольку совместимость с аппаратной экосистемой конкретных производителей снижает барьеры для развертывания и помогает компаниям быстрее запускать решения на собственной инфраструктуре.
Две версии модели: Pro и Flash
Линейка V4 представлена в двух вариантах:
- Pro — более мощная конфигурация с более высокой ценой;
- Flash — облегченная и более доступная версия.
Такое разделение обычно позволяет подобрать модель под разные задачи: где-то важнее максимальное качество и глубина рассуждений (Pro), а где-то — скорость и экономичность (Flash).
Производительность: сравнение с другими open-source моделями
DeepSeek отмечает, что версия Pro демонстрирует лучшие результаты среди открытых моделей на бенчмарках, связанных с «мировыми знаниями» (world-knowledge benchmarks). При этом компания подчеркивает, что в этой категории V4 Pro уступает только Google’s closed-source Gemini-Pro-3.1 — то есть единственным ориентиром для сравнения остается закрытая модель другого крупного игрока.
Бенчмарки world-knowledge обычно оценивают, насколько хорошо модель оперирует фактологическими знаниями и способна корректно отвечать на вопросы о событиях, терминах и контексте из широкого набора тем.
Почему V4 ориентирована на работу ИИ-агентов
Отдельный акцент в анонсе сделан на том, что модели V4 особенно подходят для задач, связанных с ИИ-агентами. В отличие от чат-ботов, агентные системы нацелены не только на диалог, но и на выполнение более сложных действий: они могут разбивать задачу на шаги, планировать последовательность действий и использовать инструменты для результата.
При этом агентная работа, как правило, требует заметно больше вычислительных ресурсов — именно поэтому компании важно предложить разработчикам как более производительные варианты (Pro), так и более легкие и экономичные (Flash), а также сделать доступ к API дешевле за счет скидок и оптимизации кэширования.
