У ИИ большие сложности с правдой и точностью, и человеческое мышление, похоже, только усугубляет проблему. Однако новое поколение ИИ меняет подход, используя более экспериментальные методы, что может вывести их далеко за пределы человеческих возможностей.
Вспомните AlphaGo от DeepMind. Это был настоящий прорыв в развитии ИИ, ведь это один из первых ИИ, который научился побеждать в играх без помощи людей и без знания правил. Вместо этого AlphaGo использовал метод обучения с подкреплением (RL), где он сам искал пути к победе через миллионы, если не миллиарды, проб и ошибок в виртуальных играх, начиная с хаотичных ходов и постепенно формируя своё понимание.
За пару лет после начала проекта в 2014 году AlphaGo разгромил чемпиона Европы по го 5-0, а к 2017 году победил сильнейшего игрока мира. Затем DeepMind разработала AlphaZero — ИИ для шахмат. В отличие от более ранних моделей вроде Deep Blue, которая обучалась на основе человеческих знаний и правил, AlphaZero пошла другим путем. Она сыграла 100 матчей против Stockfish — лучшего на тот момент шахматного ИИ, и выиграла 28 из них, остальные закончив вничью.
DeepMind быстро стал лидером в интеллектуальных играх, включая сёдзи, Dota 2 и Starcraft II, поскольку они отошли от идеи, что подражание человеку — лучший путь. Эти машины, которые "думают" иначе, чем мы, нашли свои собственные пути к победе, основываясь на собственной логике. AlphaZero не знает шахматы так, как Магнус Карлсен. Он не в курсе дебютов или шахматной истории, но играет, используя чистую логику побед и поражений, постепенно формируя своё, уникальное понимание игры, независимое от человеческих стандартов.
Теперь мы точно знаем: ни человек, ни модель, основанная на человеческом опыте, не смогут противостоять подобным ИИ в шахматах. То же самое начинает происходить и с новыми версиями ChatGPT.
Ранние языковые модели, как и шахматные ИИ, обучались на всех доступных данных, созданных людьми, и достигли огромных успехов. Но LLM (большие языковые модели) не заточены на абсолютную точность. Вот почему они могут выдавать неправдивую информацию — они хорошо работают с языком, но не с фактами.
Новая модель o1 изменила подход и начала использовать метод AlphaGo, основанный на пробах и ошибках, для улучшения своей точности. В отличие от предыдущих версий, она получила возможность "размышлять" перед тем, как дать ответ. Это позволяет ей рассуждать о проблеме и искать правильный путь решения. Она по-прежнему использует шаги, созданные человеком, но теперь может выбирать их случайным образом и строить своё собственное понимание того, как лучше справляться с задачами.
Это первый LLM, который начинает по-настоящему "понимать" сложные задачи, приближаясь к этому методом проб и ошибок. В тех областях, где есть четкий правильный и неправильный ответ, этот ИИ начинает превосходить даже самых образованных людей.
Тем не менее, даже o1, хоть и намного умнее предыдущих версий, все ещё обучается на языке, который сам по себе далек от истины. Язык — это лишь грубое отображение реальности, где невозможно точно передать физические аспекты мира. Но что произойдет, когда ИИ начнут "ощущать" физический мир, подобно тому, как мы едим печенье?
Скоро мы это узнаем, ведь ИИ, встроенные в тела роботов, начинают развивать своё понимание физической реальности. Эти ИИ, будучи свободными от человеческих ограничений, будут исследовать мир так, как мы не можем себе представить. Они будут использовать собственные методы, избегая привычных для нас подходов вроде научного метода или деления на дисциплины.
Эти воплощённые ИИ будут действовать по своим странным, но эффективным правилам, открывая новые знания, которые люди могли бы не осознать и за миллиард лет. И они прорвутся через границы нашего понимания, разгадывая загадки Вселенной и создавая технологии, о которых мы даже не мечтали.
Хотя это не произойдет сразу, их развитие будет куда быстрее, чем у нас, ведь они смогут обучаться вместе, делая это на огромных скоростях.
Такие компании, как Tesla, Figure и Sanctuary AI, уже работают над созданием гуманоидных роботов, которые смогут конкурировать с людьми по эффективности и стоимости. Когда они это сделают, ИИ начнут обучаться, взаимодействуя с реальным миром, и делать это на совершенно новом уровне. И кто знает, может быть, эти роботы будут изучать Вселенную в свободное от работы время.
Пока это всё звучит как фантастика, но мы живём в интересное время, когда такие вещи начинают становиться реальностью. Модель o1 от OpenAI, хоть и не выглядит революцией на первый взгляд, является важным шагом вперёд в развитии ИИ. Это первый проблеск того, как эти "чужие" машины постепенно опережают нас во всех аспектах жизни.