Искусственный интеллект активно проникает в различные сферы нашей жизни, в том числе в биологию. В частности, ИИ способен анализировать огромные массивы геномных данных для выявления новых терапевтических целей. Однако, несмотря на полезность таких открытий, учёные часто не понимают, как современные модели ИИ приходят к таким выводам. В этом контексте появляется новая система под названием SQUID, предназначенная для раскрытия внутренней логики ИИ.
SQUID, что расшифровывается как Surrogate Quantitative Interpretability for Deepnets, является вычислительным инструментом, разработанным в Лаборатории Колд-Спринг-Харбор (CSHL). Он создан для понимания процессов, с помощью которых модели ИИ анализируют геномные данные. В отличие от других аналитических инструментов, SQUID обеспечивает большую последовательность, снижает уровень фонового шума и позволяет делать более точные прогнозы относительно генетических мутаций.
Ключ к успеху SQUID, по мнению доцента CSHL Питера Ку, заключается в его специализированной подготовке.
Инструменты, которые обычно используются для понимания моделей ИИ, часто происходят из других областей, таких как компьютерное зрение или обработка естественного языка. Хотя они могут быть полезны, они не оптимальны для геномики. Мы использовали десятилетия знаний в области количественной генетики для создания SQUID, чтобы лучше понять обучение глубоких нейронных сетей.
SQUID начинает свою работу с создания библиотеки, включающей более 100 000 вариантов ДНК последовательностей. Затем система анализирует эффекты мутаций с помощью программы MAVE-NN (мультиплексный анализ нейронной сети с вариантными эффектами). Это позволяет учёным проводить тысячи виртуальных экспериментов одновременно, выявляя алгоритмы, стоящие за наиболее точными прогнозами ИИ. Такие вычислительные эксперименты могут подготовить почву для более реалистичных лабораторных исследований.
Виртуальные эксперименты in silico не могут полностью заменить лабораторные эксперименты, но они могут быть весьма информативными, помогая учёным формировать гипотезы о работе определённых геномных областей или о клинически значимых эффектах мутаций.
В мире существует множество моделей искусственного интеллекта, и их количество постоянно растёт. Ку, Кинни и их коллеги надеются, что SQUID поможет учёным выбрать те модели, которые наиболее соответствуют их специфическим задачам.
Несмотря на то что геном человека уже картирован, он остаётся чрезвычайно сложной областью. SQUID может помочь биологам эффективнее ориентироваться в этой области, приближая их к реальному медицинскому значению своих открытий.