Языковая модель o1 от OpenAI: улучшение ИИ в решении сложных задач

OpenAI представила новую языковую модель o1, способную значительно улучшить качество рассуждений и решения сложных задач. Новая модель превосходит GPT-4 по многим критериям, в том числе в области математики, программирования и естественных наук.

Компания OpenAI анонсировала новую языковую модель под названием o1, разработанную с использованием методов обучения с подкреплением. Модель ориентирована на решение сложных задач, требующих цепочек рассуждений, и демонстрирует впечатляющие результаты в различных тестах.

o1 превосходит GPT-4 и другие предшествующие модели в выполнении математических, научных и программных заданий. В ходе тестирования на экзаменах по математике для школьников AIME, она решила 74% задач с первой попытки и достигла результата в 93% при повторных попытках, что выше среднего уровня среди лучших учащихся США. Также модель превзошла экспертов с докторской степенью в тесте GPQA, который проверяет знания в области физики, химии и биологии.

Модель o1 использует новую технику рассуждений под названием "цепочка мыслей", которая помогает ей более эффективно решать сложные задачи. Эта цепочка позволяет модели поэтапно анализировать проблему, корректировать ошибки и применять различные подходы для достижения правильного результата. Это привело к значительному улучшению в решении задач, требующих глубокого анализа, таких как программирование и научные исследования.

Модель также показала выдающиеся результаты в программировании, заняв 49-е место на Международной олимпиаде по информатике (IOI) среди участников. В состязаниях по алгоритмам и решению программных задач она превзошла 93% участников на платформе Codeforces.

Безопасность и этичность работы ИИ также остаются приоритетом OpenAI. Модель o1 лучше справляется с задачами по предотвращению ошибок и недопущению вредоносных действий, улучшая свои результаты на внутренних тестах безопасности. Одной из ключевых особенностей стало применение скрытых цепочек рассуждений, которые помогают отслеживать процесс "мышления" модели, что способствует безопасности и корректной работе системы.

Ожидается, что o1 откроет новые горизонты в применении ИИ в науке, математике и программировании, улучшая производительность и помогая пользователям в ежедневной работе.

openai chatgpt

Читайте новости в Telegram

t.me/ v_neuro