DeepSeek-V4: первые отзывы, цены API, ограничения и замена старых моделей

DeepSeek-V4 вышла 24 апреля в статусе preview, и за первые четыре дня вокруг релиза уже сложилась более трезвая картина. Модель действительно выглядит сильной и очень дешёвой для API, но ранний пользовательский опыт показывает: главная практическая звезда релиза пока не Pro, а более быстрая Flash.
DeepSeek-V4: первые отзывы, цены API, ограничения и замена старых моделей

DeepSeek 24 апреля выпустила DeepSeek-V4 Preview, новую линейку открытых моделей с контекстом до 1 млн токенов. В релиз вошли две версии: DeepSeek-V4-Pro на 1,6 трлн параметров и DeepSeek-V4-Flash на 284 млрд параметров. Обе доступны через веб-чат, мобильное приложение, API и открытые веса на Hugging Face.

Не «DeepSeek 4», а V4 Preview

В обсуждениях модель часто называют «Дипсик 4», но официальное название - DeepSeek-V4 Preview. Это предварительный релиз, а не финальная версия семейства. Такой статус важен: часть ограничений, особенно по скорости и доступности Pro, может меняться по мере развёртывания инфраструктуры.

DeepSeek разделила линейку на две модели. V4-Pro рассчитана на сложные задачи, программирование, рассуждения и агентные сценарии. V4-Flash позиционируется как более дешёвый и быстрый вариант для массового применения. Обе модели используют MoE-архитектуру, где при ответе активируется не вся модель, а только часть параметров.

У Pro всего 1,6 трлн параметров, но активных - 49 млрд. У Flash всего 284 млрд параметров, активных - 13 млрд. Такой подход позволяет держать стоимость ниже, чем у плотных моделей сопоставимого масштаба.

Первые отзывы сместили фокус на Flash

За первые дни после релиза в пользовательских обсуждениях проявился повторяющийся мотив: DeepSeek-V4-Flash часто воспринимают как более полезную модель прямо сейчас. Её хвалят за скорость, цену и достаточное качество для рабочих сценариев, где важны быстрые итерации.

На Hacker News один из ранних тестировщиков отметил, что Flash выглядит «дешёвой, эффективной и очень быстрой», а Pro пока страдает от медленной работы, ограничений по доступности и нестабильности. Это не полноценное независимое исследование, но как ранний пользовательский сигнал оно хорошо совпадает с общей логикой релиза.

«DeepSeek V4 Flash - модель, на которую здесь стоит обратить внимание: она дешёвая, эффективная и очень быстрая».

Такой опыт не отменяет преимуществ Pro в тяжёлых тестах. Он скорее показывает, что для реальных задач разработчиков и редакций важна не только максимальная «умность», но и предсказуемая скорость, цена запроса и доступность без жёстких лимитов.

Pro сильнее, но дороже в реальной работе

По данным Artificial Analysis, DeepSeek-V4-Pro Max набрала 52 балла в Intelligence Index, заметно поднявшись относительно DeepSeek-V3.2. Среди моделей с открытыми весами она заняла второе место в категории reasoning-моделей, уступив Kimi K2.6. V4-Flash Max получила 47 баллов и тоже обошла V3.2.

Сильная сторона Pro - агентные рабочие задачи. В тесте GDPval-AA модель набрала 1554 балла и обошла Kimi K2.6, GLM-5.1, GLM-5 и MiniMax-M2.7. Для рынка это важный сигнал: DeepSeek нацеливает V4 не только на чат, но и на сценарии, где модель должна пользоваться инструментами, писать код, проверять результат и исправлять ошибки.

Но в практической экономике есть нюанс. Artificial Analysis отмечает очень высокий расход выходных токенов: около 190 млн для V4-Pro и 240 млн для V4-Flash при прохождении их набора тестов. Из-за этого Pro может оказаться дороже, чем кажется по цене за 1 млн токенов.

Галлюцинации остаются слабым местом

Самая неприятная часть ранних независимых оценок - поведение модели в ситуациях, когда она не знает ответа. Artificial Analysis зафиксировала высокий уровень галлюцинаций: 94% у DeepSeek-V4-Pro и 96% у V4-Flash в тесте AA-Omniscience. Проще говоря, модели часто продолжают отвечать уверенно, даже когда должны признать неопределённость.

Для обычного пользователя это означает необходимость перепроверки фактов. Для бизнеса и редакций - обязательную валидацию источников, особенно если модель используют для новостей, юридических справок, медицины, финансовых материалов или аналитики.

DeepSeek-V4 выглядит сильной в коде, длинном контексте и агентных сценариях, но пока не снимает базовую проблему больших языковых моделей: уверенный тон ответа не равен достоверности.

Как воспользоваться DeepSeek-V4

Официально DeepSeek-V4 доступна в нескольких вариантах. Обычные пользователи могут открыть веб-чат DeepSeek или мобильное приложение. В интерфейсе заявлены режимы Expert Mode и Instant Mode: первый ближе к Pro-подходу, второй ориентирован на быстрые ответы.

Разработчики могут подключить модель через API. DeepSeek сохранила базовый адрес API, а для перехода достаточно указать новые имена моделей: deepseek-v4-pro  или deepseek-v4-flash

Поддерживаются OpenAI Chat Completions и Anthropic API, что упрощает миграцию для проектов, уже работающих с похожими интерфейсами.

Исследователи и команды с собственной инфраструктурой могут скачать открытые веса с Hugging Face или ModelScope. Лицензия указана как MIT, что делает релиз особенно заметным для open-source-сообщества и компаний, которым нужен больший контроль над развёртыванием модели.

Цены и временная скидка

DeepSeek агрессивно играет ценой. Для V4-Flash стоимость составляет $0,14 за 1 млн входных токенов без попадания в кэш и $0,28 за 1 млн выходных токенов. По курсу Банка России на 28 апреля 2026 года, 74,8081 рубля за доллар, это примерно 10,5 и 21 рубль соответственно.

Для V4-Pro действует временная скидка 75% до 5 мая 2026 года, 15:59 UTC. На время акции входные токены стоят $0,435 за 1 млн, выходные - $0,87 за 1 млн. В рублях это примерно 32,5 и 65 рублей. После окончания скидки заявленная цена поднимется до $1,74 и $3,48 за 1 млн токенов, около 130 и 260 рублей.

Отдельно DeepSeek снизила цену cache hit, то есть повторного использования уже обработанного контекста, до 1/10 от стартовой цены. Для длинных документов и агентных задач это может быть важнее обычной цены за токен: модель чаще работает с большими блоками текста, и кэширование снижает стоимость повторных проходов.

Что будет выведено из обращения

Старые API-имена deepseek-chat  и deepseek-reasoner будут выведены из обращения после 24 июля 2026 года в 15:59 UTC. Пока они сохранены для совместимости и фактически маршрутизируются на DeepSeek-V4-Flash: deepseek-chat  - в обычный режим,  deepseek-reasoner - в thinking mode.

Разработчикам лучше не ждать дедлайна и явно перейти на deepseek-v4-flash  или deepseek-v4-pro .

Иначе после отключения старых имён приложения могут начать возвращать ошибки или вести себя непредсказуемо.

Кому модель полезна уже сейчас

DeepSeek-V4-Flash выглядит наиболее практичным вариантом для массовых задач: черновики текстов, суммаризация, обработка документов, быстрые ассистенты, простые агентные цепочки, генерация и проверка кода на уровне повседневной разработки.

DeepSeek-V4-Pro стоит тестировать там, где нужна более глубокая логика: сложные задачи по программированию, разбор больших кодовых баз, многошаговые агенты, технические документы, исследовательские сценарии. Но первые отзывы указывают, что Pro пока может быть медленнее и менее доступна из-за ограниченной пропускной способности.

Reuters отдельно отмечает, что V4 адаптирована под чипы Huawei. Это делает релиз частью более широкой истории: китайские AI-компании пытаются снижать зависимость от Nvidia и выстраивать собственную инфраструктуру для больших моделей.

Главный вывод после первых дней

DeepSeek-V4 не выглядит повторением шока, который когда-то вызвала R1. Рынок стал взрослее, конкуренты быстрее, а пользователи внимательнее к реальным ограничениям. Но релиз всё равно важен: открытые веса, контекст 1 млн токенов, низкая цена API и ставка на агентные сценарии делают V4 одной из самых заметных моделей весны 2026 года.

Проверочная точка наступит в ближайшие недели. Если DeepSeek улучшит стабильность Pro, расширит пропускную способность и снизит эффект галлюцинаций, V4 может стать рабочей альтернативой дорогим закрытым моделям. Пока же самым рациональным выбором для большинства выглядит V4-Flash: она дешевле, быстрее и уже получила больше практических одобрений в первых пользовательских тестах.

06:10
142
Нет комментариев. Ваш будет первым!