DeepSeek-V4: первые отзывы, цены API, ограничения и замена старых моделей

DeepSeek 24 апреля выпустила DeepSeek-V4 Preview, новую линейку открытых моделей с контекстом до 1 млн токенов. В релиз вошли две версии: DeepSeek-V4-Pro на 1,6 трлн параметров и DeepSeek-V4-Flash на 284 млрд параметров. Обе доступны через веб-чат, мобильное приложение, API и открытые веса на Hugging Face.
Не «DeepSeek 4», а V4 Preview
В обсуждениях модель часто называют «Дипсик 4», но официальное название - DeepSeek-V4 Preview. Это предварительный релиз, а не финальная версия семейства. Такой статус важен: часть ограничений, особенно по скорости и доступности Pro, может меняться по мере развёртывания инфраструктуры.
DeepSeek разделила линейку на две модели. V4-Pro рассчитана на сложные задачи, программирование, рассуждения и агентные сценарии. V4-Flash позиционируется как более дешёвый и быстрый вариант для массового применения. Обе модели используют MoE-архитектуру, где при ответе активируется не вся модель, а только часть параметров.
У Pro всего 1,6 трлн параметров, но активных - 49 млрд. У Flash всего 284 млрд параметров, активных - 13 млрд. Такой подход позволяет держать стоимость ниже, чем у плотных моделей сопоставимого масштаба.
Первые отзывы сместили фокус на Flash
За первые дни после релиза в пользовательских обсуждениях проявился повторяющийся мотив: DeepSeek-V4-Flash часто воспринимают как более полезную модель прямо сейчас. Её хвалят за скорость, цену и достаточное качество для рабочих сценариев, где важны быстрые итерации.
На Hacker News один из ранних тестировщиков отметил, что Flash выглядит «дешёвой, эффективной и очень быстрой», а Pro пока страдает от медленной работы, ограничений по доступности и нестабильности. Это не полноценное независимое исследование, но как ранний пользовательский сигнал оно хорошо совпадает с общей логикой релиза.
«DeepSeek V4 Flash - модель, на которую здесь стоит обратить внимание: она дешёвая, эффективная и очень быстрая».
Такой опыт не отменяет преимуществ Pro в тяжёлых тестах. Он скорее показывает, что для реальных задач разработчиков и редакций важна не только максимальная «умность», но и предсказуемая скорость, цена запроса и доступность без жёстких лимитов.
Pro сильнее, но дороже в реальной работе
По данным Artificial Analysis, DeepSeek-V4-Pro Max набрала 52 балла в Intelligence Index, заметно поднявшись относительно DeepSeek-V3.2. Среди моделей с открытыми весами она заняла второе место в категории reasoning-моделей, уступив Kimi K2.6. V4-Flash Max получила 47 баллов и тоже обошла V3.2.
Сильная сторона Pro - агентные рабочие задачи. В тесте GDPval-AA модель набрала 1554 балла и обошла Kimi K2.6, GLM-5.1, GLM-5 и MiniMax-M2.7. Для рынка это важный сигнал: DeepSeek нацеливает V4 не только на чат, но и на сценарии, где модель должна пользоваться инструментами, писать код, проверять результат и исправлять ошибки.
Но в практической экономике есть нюанс. Artificial Analysis отмечает очень высокий расход выходных токенов: около 190 млн для V4-Pro и 240 млн для V4-Flash при прохождении их набора тестов. Из-за этого Pro может оказаться дороже, чем кажется по цене за 1 млн токенов.
Галлюцинации остаются слабым местом
Самая неприятная часть ранних независимых оценок - поведение модели в ситуациях, когда она не знает ответа. Artificial Analysis зафиксировала высокий уровень галлюцинаций: 94% у DeepSeek-V4-Pro и 96% у V4-Flash в тесте AA-Omniscience. Проще говоря, модели часто продолжают отвечать уверенно, даже когда должны признать неопределённость.
Для обычного пользователя это означает необходимость перепроверки фактов. Для бизнеса и редакций - обязательную валидацию источников, особенно если модель используют для новостей, юридических справок, медицины, финансовых материалов или аналитики.
DeepSeek-V4 выглядит сильной в коде, длинном контексте и агентных сценариях, но пока не снимает базовую проблему больших языковых моделей: уверенный тон ответа не равен достоверности.
Как воспользоваться DeepSeek-V4
Официально DeepSeek-V4 доступна в нескольких вариантах. Обычные пользователи могут открыть веб-чат DeepSeek или мобильное приложение. В интерфейсе заявлены режимы Expert Mode и Instant Mode: первый ближе к Pro-подходу, второй ориентирован на быстрые ответы.
Разработчики могут подключить модель через API. DeepSeek сохранила базовый адрес API, а для перехода достаточно указать новые имена моделей:
deepseek-v4-pro
или
deepseek-v4-flash
Поддерживаются OpenAI Chat Completions и Anthropic API, что упрощает миграцию для проектов, уже работающих с похожими интерфейсами.
Исследователи и команды с собственной инфраструктурой могут скачать открытые веса с Hugging Face или ModelScope. Лицензия указана как MIT, что делает релиз особенно заметным для open-source-сообщества и компаний, которым нужен больший контроль над развёртыванием модели.
Цены и временная скидка
DeepSeek агрессивно играет ценой. Для V4-Flash стоимость составляет $0,14 за 1 млн входных токенов без попадания в кэш и $0,28 за 1 млн выходных токенов. По курсу Банка России на 28 апреля 2026 года, 74,8081 рубля за доллар, это примерно 10,5 и 21 рубль соответственно.

Для V4-Pro действует временная скидка 75% до 5 мая 2026 года, 15:59 UTC. На время акции входные токены стоят $0,435 за 1 млн, выходные - $0,87 за 1 млн. В рублях это примерно 32,5 и 65 рублей. После окончания скидки заявленная цена поднимется до $1,74 и $3,48 за 1 млн токенов, около 130 и 260 рублей.
Отдельно DeepSeek снизила цену cache hit, то есть повторного использования уже обработанного контекста, до 1/10 от стартовой цены. Для длинных документов и агентных задач это может быть важнее обычной цены за токен: модель чаще работает с большими блоками текста, и кэширование снижает стоимость повторных проходов.
Что будет выведено из обращения
Старые API-имена deepseek-chat
и deepseek-reasoner будут выведены из обращения после 24 июля 2026 года в 15:59 UTC. Пока они сохранены для совместимости и фактически маршрутизируются на DeepSeek-V4-Flash: deepseek-chat
- в обычный режим, deepseek-reasoner
- в thinking mode.
Разработчикам лучше не ждать дедлайна и явно перейти на deepseek-v4-flash
или
deepseek-v4-pro
.
Иначе после отключения старых имён приложения могут начать возвращать ошибки или вести себя непредсказуемо.
Кому модель полезна уже сейчас
DeepSeek-V4-Flash выглядит наиболее практичным вариантом для массовых задач: черновики текстов, суммаризация, обработка документов, быстрые ассистенты, простые агентные цепочки, генерация и проверка кода на уровне повседневной разработки.
DeepSeek-V4-Pro стоит тестировать там, где нужна более глубокая логика: сложные задачи по программированию, разбор больших кодовых баз, многошаговые агенты, технические документы, исследовательские сценарии. Но первые отзывы указывают, что Pro пока может быть медленнее и менее доступна из-за ограниченной пропускной способности.
Reuters отдельно отмечает, что V4 адаптирована под чипы Huawei. Это делает релиз частью более широкой истории: китайские AI-компании пытаются снижать зависимость от Nvidia и выстраивать собственную инфраструктуру для больших моделей.
Главный вывод после первых дней
DeepSeek-V4 не выглядит повторением шока, который когда-то вызвала R1. Рынок стал взрослее, конкуренты быстрее, а пользователи внимательнее к реальным ограничениям. Но релиз всё равно важен: открытые веса, контекст 1 млн токенов, низкая цена API и ставка на агентные сценарии делают V4 одной из самых заметных моделей весны 2026 года.
Проверочная точка наступит в ближайшие недели. Если DeepSeek улучшит стабильность Pro, расширит пропускную способность и снизит эффект галлюцинаций, V4 может стать рабочей альтернативой дорогим закрытым моделям. Пока же самым рациональным выбором для большинства выглядит V4-Flash: она дешевле, быстрее и уже получила больше практических одобрений в первых пользовательских тестах.


