Anthropic представила Claude 3.7 Sonnet

Новое поколение ИИ для бизнеса
Claude 3.7 Sonnet доступен во всех тарифных планах Anthropic, включая Free, Pro, Team и Enterprise, а также через API компании, платформу Amazon Bedrock и сервис Google Cloud Vertex AI. В отличие от предыдущих версий, эта модель предлагает пользователям возможность контролировать глубину размышлений перед выдачей ответа, обеспечивая баланс между скоростью работы и качеством результатов.
Anthropic заявляет, что Claude 3.7 Sonnet значительно превосходит своих предшественников в кодинге, разработке фронтенда и анализе сложных задач. Одним из ключевых нововведений стала возможность настраивать «бюджет размышлений» через API — пользователи могут задать ограничение на количество токенов, потраченных на размышление перед выдачей ответа (до 128 тысяч токенов). Это позволит компаниям оптимизировать затраты и производительность.
Кроме того, модель сфокусирована на реальных задачах бизнеса, а не только на математических и научных соревнованиях, как это делалось в ряде других ИИ-систем. По словам разработчиков, Claude 3.7 Sonnet особенно хорош в инструкциях, обработке сложных кодовых баз и планировании изменений в программных проектах.
Claude Code: новый инструмент для разработчиков
Anthropic также представила Claude Code — инструмент для «агентного программирования», который позволяет разработчикам передавать значительную часть задач ИИ напрямую из командной строки. На данный момент Claude Code доступен в формате исследовательского превью.
Claude Code умеет:
- анализировать и редактировать код,
- запускать тесты,
- коммитить изменения и отправлять их в GitHub,
- работать с командной строкой.
Разработчики, уже протестировавшие инструмент, отмечают, что он способен выполнять задачи, на которые у человека ушло бы более 45 минут, всего за один прогон. Компания планирует в ближайшие недели активно развивать инструмент, улучшая его функциональность и поддержку долгих команд.
Одной из ключевых целей Claude Code является изучение того, как разработчики взаимодействуют с ИИ при программировании, что поможет улучшить будущие версии модели.
GitHub-интеграция и поддержка проектов
Anthropic также улучшила взаимодействие ИИ с кодовыми базами. Теперь пользователи могут напрямую подключать свои репозитории на GitHub во всех тарифных планах Claude. Благодаря этому Claude 3.7 Sonnet может помогать с исправлением багов, разработкой новых функций и написанием документации.
В ходе тестирования Claude 3.7 Sonnet показал отличные результаты:
- Replit смог использовать его для автоматической разработки веб-приложений и дашбордов,
- Canva отметила, что код, сгенерированный Claude, имел лучшее структурное оформление и меньше ошибок по сравнению с другими моделями,
- Vercel подчеркнула высокую точность модели при выполнении сложных агентных задач.
Claude 3.7 Sonnet демонстрирует передовую производительность в тесте SWE-bench Verified, оценивающем способность ИИ-моделей решать реальные программные задачи.
Claude 3.7 Sonnet демонстрирует передовую производительность в тесте TAU-bench — системе оценки, проверяющей ИИ-агентов на способность решать сложные реальные задачи с учетом взаимодействия с пользователями и инструментами.
Claude 3.7 Sonnet демонстрирует выдающиеся результаты в области следования инструкциям, общего рассуждения, мультимодальных возможностей и агентного программирования. Расширенное мышление дает значительное преимущество в математике и науке. Помимо традиционных тестов, модель превзошла все предыдущие версии в наших испытаниях на игровом процессе Pokémon
Приоритет Anthropic
Компания заявляет, что провела обширное тестирование Claude 3.7 Sonnet на предмет безопасности, надежности и защиты от атак. В новой версии на 45% сокращено количество необоснованных отказов в ответах, что делает модель более удобной в использовании.
Anthropic также опубликовала System Card — документ, в котором детально описаны меры безопасности, методы защиты от атак на промпты и механизмы анализа логики работы модели. Разработчики уверены, что Claude 3.7 Sonnet станет не только более мощным, но и более надежным инструментом для бизнеса.
Будущее Claude
Anthropic рассматривает выпуск Claude 3.7 Sonnet и Claude Code как важный шаг на пути к созданию по-настоящему автономных и интеллектуальных ИИ-систем. В компании уверены, что такие технологии способны значительно расширить возможности людей в разработке, аналитике и других сферах.
Разработчики приглашают всех желающих протестировать новые возможности и оставить обратную связь, которая поможет улучшить следующие версии моделей.