Новый искусственный интеллект от OpenAI способен рассуждать

OpenAI представила новую языковую модель — o1, которая может «рассуждать» и «логически решать» задачи в точных и естественных науках на уровне аспирантов. ИИ-модель, прежде чем ответить пользователю на запрос, обдумывает ответ — тем самым разработчики компании учат ее «оттачивать мыслительный процесс, пробовать разные стратегии и находить свои же ошибки».

Новая ИИ-модель o1 отличается от прошлых версий тем, что обладает способностью имитировать человеческий процесс мышления. Таким образом вводится новое понятие: «цепочка мыслей».

ИИ-модель учится по методу «обучение с подкреплением». Для решения сложной задачи ИИ-модель разбивает ее на более простые шаги, анализирует различные варианты решения и исправляет свои ошибки, если они были допущены. Она «как и человек может длительное время размышлять перед тем, как ответить на сложный вопрос», заявляют разработчики.

Новая языковая модель o1 показала высокие результаты, отвечая на уровне хорошего специалиста в тестах и соревнованиях по физике, химии, биологии и информатике.

В естественных науках новая модель превзошла по результатам докторов и кандидатов наук в сложном тесте GPQA diamond, который оценивает знания в области химии, физики и биологии.

Но разработчики прокомментировали, что «это не означает, что o1 умнее любого кандидата наук. Это говорит о том, что модель способна решать некоторые задачи на уровне высококвалифицированных специалистов».

OpenAI на своем сайте сообщила, что ИИ-модель вошла в число 500 лучших студентов США на квалификационном этапе Американской математической олимпиады (AIME), демонстрируя хороший навык решения сложных задач для одаренных школьников.

Сравнительные результаты тестирования разных моделей ИИ в математике, кодировании и общем тесте в области химии, физики и биологии

На Международной олимпиаде по информатике (IOI) 2024 года ИИ-модель заняла 49-е место, тем самым превосходя 89% людей на платформе Codeforces. Также модель o1 также превзошла предыдущие ИИ- модели во многих тестах на интеллект и решение задач, как MMMU и MMLU.

Компания сообщила, что новая ИИ- модель превосходит GPT-4o по логическому мышлению, но у последней более «обширные знания о мире». В отборочном туре Международной математической олимпиады (IMO) GPT-4o показала всего 13% правильных решений , а новая «рассуждающая» модель — 83%.

Но модель о1 значительно медленнее работает и дороже обходится. Новая ИИ-модель не имеет больших энциклопедических знаний, как GPT-4o и не умеет обрабатывать веб-страницы, файлы и изображения.

К новой модели нужно обращаться со сложными задачи, которые требуют логического мышления. К примеру, физики могут с помощью о1 вывести формулы в квантовой оптике, а программистам ИИ-модель поможет написать сложный код.

Компания выпустила также облегчённую и менее дорогую версию новой модели o1 — o1-mini. Контекстное окно у обеих моделей составляет 128 тысяч токенов. Файлы и изображения они не принимают и не смогут пока искать данные в интернете.

OpenAI сообщила, что впереди еще много доработок, чтобы усовершенствовать новую модель и сделать ее простой в пользовании, как GPT-4o. Новую модель можно контролировать и компания прежде чем выпустить o1-preview для публичного использования провела все тесты на безопасность.

Для пользователей платных тарифов ChatGPT Plus и ChatGPT Team доступ будет предоставлен к превью o1 и o1-mini 12 сентября 2024 года. Еженедельный лимит составляет — 30 сообщений для o1-preview и 50 сообщений для o1-mini.

В перспективе компания хочет открыть доступ к o1-mini всем пользователям бесплатного плана ChatGPT, но официальная дата пока неизвестна. Пользователи планов Enterprise и Edu смогут получить доступ с 16 сентября 2024 года.

Пользователю при работе с o1-preview 1 млн «входных» токенов будет составлять — $15, а «выходных» — $60. Для o1-mini «входные» токены будут составлять- $3, а «выходные» — $12. Если сравнивать с GPT-4o, то в $5 оценивается 1 млн «входных» токенов и $15 за миллион «выходных».

Ранее OpenAI выпустили бюджетную ИИ-модель — GPT-4o mini. HTNews подробно писал о ней в этом материале.

Следите за новостями в наших социальных сетях: ВКонтакте и Telegram.

Tags: OpenAI