OpenAI представила модель o3: нейросеть мыслит почти как человек
Новинка оказалась самой мощной разработкой компании. Но пока воспользоваться ей не получится.
Компания OpenAI завершила марафон громких анонсов различных технологий и возможностей своих сервисов презентацией новых ИИ-моделей o3 и o3-mini. Они оказались самыми мощными среди всех разработок создателей ChatGPT.
Новинки оказалась более продвинутыми по сравнению с линейкой моделей o1. При этом в названии перескочили через цифру 2. По данным СМИ, это связано с риском судебных разбирательств со стороны британского оператора O2, который давно зарегистрировал такой бренд. Глава OpenAI Сэм Альтман отметил, что их решение следует традиции компании выбирать плохие названия.
По данным OpenAI, o3 показала очень хороший результат в ARC-бенчмарке. С его помощью тестируют технологии, которые могут перейти к следующему уровню искусственного интеллекта. ИИ-модель набрала 87,5%, при этом средний показатель людей равняется примерно 85%. Это намного больше, чем у o1, которая достигала лишь 32%. Однако стоимость выполнения задач оказалась очень высокой. По предварительным данным, она может составлять 2000 долларов (206 тыс. рублей).
Отлично нейросеть продемонстрировала себя и особом экзамене по математике из США. Модель получила 96,7 балла, не справившись только с одним вопросом. В бенчмарке Frontier Math удалось установить рекордный показатель — 25,2%. Другие модели не набирали больше 2%. У o3-mini результаты оказались более скромными, однако в OpenAI заявили, что она превосходит по возможностям o1.