OpenAI разрабатывает новую систему искусственного интеллекта под кодовым названием Strawberry, которая отличается способностью к рассуждению. Об этом сообщает Reuters, ссылаясь на внутренний документ компании, который был получен журналистами в мае.

Документ подробно описывает, как OpenAI планирует использовать Strawberry для исследований, хотя точная дата создания документа неизвестна. В данный момент модель находится в стадии разработки, и неизвестно, когда она станет доступной для широкой публики. Проект строго засекречен, и доступ к нему ограничен даже внутри компании. Согласно документу, Strawberry не просто отвечает на вопросы, а составляет план для автономной навигации ИИ в интернете для выполнения "глубокого исследования".

В OpenAI подтвердили существование проекта, заявив:

Мы хотим, чтобы наши ИИ модели видели и понимали мир так же, как мы. Исследование новых возможностей ИИ — это обычная практика в отрасли, и мы уверены, что эти системы будут совершенствовать свои способности к рассуждению.

Проект был запущен ещё в прошлом году под названием Q* ("Q со звёздочкой"), и инцидент с увольнением Сэма Альтмана (Sam Altman) произошёл вскоре после получения первых результатов. Два сотрудника OpenAI рассказали, что в этом году видели демонстрации Q*, где модель успешно решала сложные научные и математические задачи.

Во вторник в компании прошло внутреннее собрание, на котором был представлен исследовательский проект, связанный с новыми навыками рассуждения ИИ, аналогичными человеческим. Представитель OpenAI подтвердил проведение встречи, но отказался раскрыть её детали. Reuters не удалось установить, обсуждался ли на ней проект Strawberry. Ожидается, что эта система установит новую планку в способности ИИ к рассуждению благодаря новому способу обработки модели, обученной на больших наборах данных.

В последние месяцы OpenAI в конфиденциальном порядке сообщала разработчикам и другим заинтересованным лицам, что находится на пороге выпуска технологии с продвинутыми способностями к рассуждению. Особенностью Strawberry является уникальная методика обработки ИИ после обучения, напоминающая метод StaR (Self-Taught Reasoner), разработанный в 2022 году в Стэнфордском университете. Этот метод описывает самообучение ИИ и итеративную подготовку собственных наборов данных для дополнительного обучения, что в теории может создать ИИ, превосходящий человеческий интеллект.

Ключевой способностью Strawberry является выполнение задач, требующих планирования и длительных действий. OpenAI проводит создание, обучение и оценку моделей на данных "глубокого исследования". Состав этих данных и продолжительность планирования остаются неизвестными. Такая модель реализует собственные исследовательские проекты, автономно осуществляя веб-серфинг при помощи специального агента — пользователя компьютера (Computer-Using Agent, CUA). В рамках тестирования модель будет выполнять задачи, обычно поручаемые инженерам по ПО и машинному обучению.