Искусственный интеллект научился создавать жизнеспособные белковые последовательности

14.10.2024

Ученые спроектировали и обучили нейросеть, которая смогла сгенерировать эффективные и жизнеспособные ферменты, многие из которых не имеют природных аналогов. Структура большинства образцов в корне отличается от изученных и используемых последовательностей.

Исследователи разработали систему искусственного интеллекта, которая может создавать искусственные ферменты с нуля. В лабораторных экспериментах некоторые из этих ферментов продемонстрировали эффективность, сравнимую с природными ферментами, даже когда их искусственно созданные аминокислотные последовательности сильно отличались от любого известного природного белка.

Эксперимент показывает, что обработка естественного языка, изначально созданная для чтения и написания языковых текстов, может уловить некоторые фундаментальные концепции биологии. Программа искусственного интеллекта, известная как ProGen, была разработана Salesforce Research и использует предсказание следующего маркера для создания искусственных белков из аминокислотных последовательностей.

Ученые заявили, что новая технология может стать более мощной, чем направленная эволюция, получившая Нобелевскую премию технология проектирования белков, и она оживит 50-летнюю область белковой инженерии, ускорив разработку новых белков, которые можно использовать почти для всех. что угодно, от терапии до деградации пластика.

Чтобы создать модель, ученые просто загрузили аминокислотные последовательности 280 миллионов различных белков всех видов в модель машинного обучения и дали ей переварить информацию в течение нескольких недель. Затем они доработали модель, добавив в нее 56 000 последовательностей из пяти семейств лизоцимов, а также некоторую контекстуальную информацию об этих белках.

Модель быстро сгенерировала миллион последовательностей, и исследовательская группа выбрала 100 для тестирования, основываясь на том, насколько они похожи на последовательности природных белков, а также на то, насколько натуралистичны "грамматика" и "семантика" аминокислот, лежащих в основе белков ИИ.

Из этой первой партии из 100 белков, которые были проверены в пробирке Tierra Biosciences, команда сделала пять искусственных белков для тестирования в клетках и сравнила их активность с ферментом, обнаруженным в белках куриных яиц, известным как лизоцим куриного яйца.

Два искусственных фермента были способны разрушать клеточные стенки бактерий с активностью, сравнимой с HEWL, однако их последовательности были идентичны друг другу лишь примерно на 18%. Две последовательности были примерно на 90% и 70% идентичны любому известному белку.

Всего одна мутация в природном белке может заставить его перестать работать, но в другом раунде скрининга команда обнаружила, что ферменты, созданные искусственным интеллектом, проявляли активность, даже когда всего 31,4% их последовательности напоминали любой известный природный белок.

ИИ даже смог узнать, как должны формироваться ферменты, просто изучив необработанные данные о последовательности. Атомные структуры искусственных белков, измеренные с помощью рентгеновской кристаллографии, выглядели именно так, как должны, хотя последовательности были такими, каких раньше не видели.

По словам авторов работы, дальнейшее развитие технологии может создать условия для фармацевтической революции.

Теги: