Специалисты считают, что нам пора обновить тест Тьюринга

14.10.2024

Вот уже более 70 лет тест Тьюринга используется в качестве основного инструмента оценки уровня искусственного интеллекта. Бурный рост и развитие нейросетей заставляет задуматься над тем, что методика требует доработки.

Впервые предложенный в 1950 году "Тест Тьюринга", названный в честь известного британского ученого-компьютерщика Алана Тьюринга, представляет собой гипотетическую основу для проверки интеллекта системы ИИ. Первоначально Тьюринг описывал метод тестирования похожий на игру, в которой участник-человек вслепую задает вопросы как человеку, так и компьютеру. Если компьютер успешно обманывает спрашивающего, заставляя его думать, что это человек, значит, он прошел тест Тьюринга.

Первая попытка пройти тест была предпринята в середине 1960-х годов, когда был разработан один из первых чат-ботов по имени Элиза, имитирующего психолога, а в 2014 году первым ИИ, который, как сообщается, прошел тест (ставится под сомнение), был Юджин Густман — программа, способная смоделировать ответы 15-летнего мальчика.

За прошедшее десятилетие гораздо больше программ претендовали на то, чтобы пройти тест Тьюринга. Совсем недавно искусственный интеллект Google LaMDA прошел тест и даже убедил инженера Google в том, что он разумен и осознает себя.

Однако некоторые утверждают, что тест далек от совершенства. Использование языка в качестве теста на "интеллектуальность" нейронной сети в какой-то степени имеет смысл, поскольку это одна из самых сложных вещей для системы искусственного интеллекта. Но основная критика заключается в том, что тест игнорирует несколько других аспектов интеллекта, которые столь же важны, как и языковые способности человека, и многие чат-боты были разработаны специально для того, чтобы обманывать людей, заставляя их думать, что они люди. Eugene Goostman, например, был разработан таким образом, что английский язык был вторым языком чат-бота, эффективно скрывая его откровенные ошибки.

Предложения по изменению или даже замене теста Тьюринга чем-то, что более точно отражает истинный интеллект, звучали уже много лет. Буквально на этой неделе был предложен новый тест под названием "Структура классификации ИИ". Он, по сути, делает тест Тьюринга и его языковые возможности лишь частью оценки общего интеллекта ИИ, состоящей из 8 частей.

За созданием метода стоит, бывший руководитель отдела разработки продуктов в Uber. По словам разработчика, он черпал вдохновение в "Теории множественного интеллекта" 1983 года, идее психолога Говарда Гарднера о том, что интеллект — это не просто монолитная конструкция, а гобелен из 8 отдельных интеллектов.

К ним относятся логико-математические, языково-вербальные, зрительно-пространственные, музыкально-ритмические, телесно-кинестетические, межличностные, внутриличностные и экзистенциальные. Отсюда ИИ оценивается по одной для каждой категории интеллекта по шкале от 1 до 5: "1" означает практически несуществующее или младенческое, а "5" — сверхразум.

Используя эту структуру искусственного интеллекта применительно к популярному на данный момент чат-боту, ChatGPT четко демонстрирует средний человеческий интеллект, когда речь идет о логико-математическом и лингвистически-вербальном интеллекте, но, по сути, получает оценку N/A по всем остальным параметрам. Хотя некоторые уже утверждали , что чат-бот прошел тест Тьюринга, в соответствии с этой новой структурой ChatGPT предстоит пройти долгий путь, прежде чем он будет считаться по-настоящему умным.

Становится все более очевидным, что сегодняшний ИИ перерастает тесты, разработанные в эпоху, когда мощность и сложность современных компьютеров были совершенно невообразимы. Возможно, сегодняшний ИИ действительно может пройти тест Тьюринга, но ему нужно многому научиться, если он хочет сдать последний экзамен, называемый человеческим сознанием.

Теги:

#искусственный интеллект