OpenAI — известный разработчик нейросетей, представил самую бюджетную ИИ-модель: GPT-4o mini. Ставка: 15 центов за миллион введенных в контекстное окно токенов (эквивалентно 1 млн знаков на русском языке), и 60 центов — за сформулированные ответы чат-бота (объемом в миллион токенов). Новая система может решать математические задачи, работать с изображениями, а в дальнейшем получит поддержку видео и аудио.
Новая модель искусственного интеллекта GPT-4o mini тестировалась на понимание и анализ текстов. В тесте MMLU она набрала 82 балла из 100, обойдя конкурентов: Gemini Flash (77.9 балла) и Claude Haiku (73.8 балла).
Лучший результат среди них GPT-4o mini показала и в тесте на математические способности (87%). Исследовался также навык программирования новой нейросети: она показала результат в 87.2% (на тесте HumanEval).
GPT-4o mini показал способность к мультимодальному мышлению (умение работать не только с текстом, но и с изображениями). OpenAI в будущем планирует добавить также поддержку видео и аудио.
Преимущества GPT-4o mini
OpenAI позиционирует новую ИИ-модель как одну из самых бюджетных на рынке — она на 60% дешевле GPT-3.5 Turbo. Ставка: 15 центов за миллион входных токенов, 60 центов за миллион выходных токенов. Для понимания: один токен равен четырем символам на английском языке или одному символу на русском. Текстовые запросы вводятся в контекстное окно — там же и появляются ответы.
Само контекстное окно вмещает объем информации в 128 тысяч токенов. К слову, модель GPT-4o mini работает и с другими языками помимо английского: русским, корейским, хинди, французским, португальским, немецким, испанским и т.д.
GPT-4o mini подходит для решения простых задач с большими объемами данных. Можно создавать собственные чат-боты, анализировать тексты, разрабатывать голосовые помощники и т.д.
Новая ИИ-система сохранила методы фильтрации данных на этапе обучения, которые были еще в прошлой модели — GPT-4o. Кроме того, поддерживается обучение с подкреплением на основе отзывов людей. Также GPT-4o mini защищает информацию от взлома с помощью нового метода иерархии.
Новая разработка унаследовала от GPT-4o передовые методы фильтрации данных на этапе обучения, обучение с подкреплением на основе отзывов людей (RLHF) и новый метод «иерархии инструкций», который защищает от взлома и нежелательного использования. Этот метод отдает приоритет системным инструкциям в случае любых попыток пользователя заставить ИИ выполнить нежелательные действия.
GPT-4o mini заменит прошлую модель GPT-3.5 Turbo в ChatGPT, поэтому у пользователей больше не будет возможности выбирать между двумя моделями. GPT-3.5 Turbo будет пока доступной для разработчиков через API, но в будущем будет полностью удалена из системы.
Новая GPT-4o mini предназначена для разработчиков через Assistants API, Chat Completions API и Batch API. По словам OpenAI, модель схожа по уровню с ранее вышедшими Llama 3 8b, Claude Haiku и Gemini 1.5 Flash.
Однако тестирование показало, что GPT-4o mini работает намного быстрее конкурентов (средняя скорость вывода 202 токена в секунду), и при этом ее использование обойдется дешевле.
Ранее OpenAI концентрировалась на создании более мощных ИИ-моделей, таких как GPT-4. Теперь компания сместила приоритет на удобные и доступные решения. Быстрее всех доступ к новому ИИ получили пользователи ChatGPT на тарифах Free, Plus и Team, а пользователям Enterprise система должна стать доступна на этой неделе.
GPT-4o mini должна помочь разработчикам, у которых нет больших бюджетов, создавать приложения на основе ИИ. Одним из пользователей новой разработки стал проект Ramp (платформа управления финансовыми операциями компании). Они используют GPT-4o mini для визуального анализа чеков, и учета с его помощью информации о расходах.
Разработчики электронной почты на базе искусственного интеллекта — Superhuman также внедрили GPT-4o mini в свою систему. На основе модели была создана функция автоматических ответов на письма.
Следите за новостями в наших социальных сетях: ВКонтакте и Telegram.