Новый чемпион в программировании DeepSeek Coder V2 обошёл популярную GPT-4 Turbo

Новинка с открытым исходным кодом превзошла всех конкурентов в задачах по написанию кода и математике, она понимает более 300 языков программирования, обладает расширенным контекстным окном и демонстрирует улучшенные способности к рассуждению.

Китайский стартап DeepSeek представил DeepSeek Coder V2 - первую в мире открытую модель для программирования, которая превзошла по своим возможностям даже закрытые аналоги, такие как GPT-4 Turbo и Claude 3 Opus. Новинка также обошла Gemini 1.5 Pro и Llama 3-70B, показав выдающиеся результаты в задачах по написанию кода и математике.

DeepSeek Coder V2 поддерживает более 300 языков программирования и демонстрирует высокие способности к общему рассуждению и пониманию языка. Модель основана на предыдущей версии DeepSeek-V2 и была дополнительно обучена на огромном количестве данных, включая программный код из GitHub и информацию из CommonCrawl.

Благодаря особой архитектуре Mixture of Experts, DeepSeek Coder V2 может активировать только необходимые "экспертные" параметры для выполнения конкретных задач, что позволяет оптимизировать использование вычислительных ресурсов.

На различных тестах, оценивающих генерацию кода, решение задач и математические способности, DeepSeek Coder V2 показал высокие результаты, опередив большинство конкурентов. Единственной моделью, превзошедшей DeepSeek Coder V2 на нескольких бенчмарках, стала GPT-4o.

Стартап DeepSeek, основанный всего год назад, уже стал значимым игроком на китайском рынке ИИ, присоединившись к таким компаниям, как SenseTime, Megvii Technology и Baidu. Миссия компании - "разгадать тайну AGI с помощью любопытства".

Читайте новости в Telegram

t.me/ v_neuro