Ученые использует ИИ для поиска ответа на невозможный вопрос

Когда вода замерзает, она превращается из жидкой фазы в твёрдую, что приводит к значительным изменениям плотности и объёма. Фазовые переходы в воде настолько обычны, что большинство из нас их не замечают, но изучение фазовых переходов в новых материалах или сложных физических системах является важной областью науки.

Чтобы понять эти системы, учёным необходимо уметь распознавать фазы и обнаруживать переходы между ними. Однако количественная оценка фазовых изменений в неизвестных системах остаётся сложной задачей, особенно при ограниченных данных.

Исследователи из Массачусетского технологического института и Базельского университета в Швейцарии применили генеративные модели искусственного интеллекта для этой проблемы, разработав новую структуру машинного обучения, способную автоматически строить фазовые диаграммы для новых физических систем.

Этот физически обоснованный подход к машинному обучению более эффективен, чем трудоёмкие ручные методы, основанные на теоретических знаниях. Важно отметить, что благодаря использованию генеративных моделей этот метод не требует огромных размеченных наборов данных, которые используются в других методах машинного обучения.

Такой подход может помочь учёным исследовать термодинамические свойства новых материалов или, например, обнаруживать запутанность в квантовых системах. В конечном итоге это позволит автоматически открывать неизвестные фазы материи.

К работе над статьей присоединились Джулиан Арнольд, аспирант Базельского университета; Алан Эдельман, профессор прикладной математики и руководитель лаборатории Джулии; и Кристоф Брудер, профессор физики Базельского университета. Исследование было опубликовано в журнале Physical Review Letters.

Хотя переход воды в лёд является одним из самых очевидных примеров фазового перехода, более экзотические фазовые изменения, такие как превращение материала из обычного проводника в сверхпроводник, представляют большой интерес для учёных.

Эти переходы можно обнаружить, определив «параметр порядка» — величину, которая изменяется при переходе. Например, вода замерзает при температуре ниже 0 градусов Цельсия, и подходящий параметр порядка можно определить как долю молекул воды, входящих в кристаллическую решётку.

Ранее исследователи полагались на физические знания для ручного построения фазовых диаграмм, опираясь на теоретическое понимание, чтобы определить важные параметры порядка. Это не только трудоёмко для сложных систем и практически невозможно для неизвестных систем с новыми свойствами, но и вносит в решение человеческую предвзятость.

Недавно учёные начали использовать машинное обучение для создания классификаторов, которые могут решать эту задачу, обучаясь на статистике измерений.

Исследователи продемонстрировали, как генеративные модели можно использовать для более эффективного решения задачи классификации с учётом физики.

Язык программирования Julia, популярный в научных вычислениях и используемый на вводных занятиях по линейной алгебре в MIT, предоставляет множество инструментов, полезных для построения таких генеративных моделей.

Генеративные модели, такие как те, что лежат в основе ChatGPT и Dall-E, оценивают вероятностное распределение данных для создания новых данных, соответствующих этому распределению.

Когда моделирование физической системы возможно с использованием проверенных методов, исследователи получают модель её распределения вероятности бесплатно. Это распределение описывает статистику измерений физической системы.

Исследовательская группа использует это распределение для создания генеративной модели, на основе которой строится классификатор. Этот генеративный классификатор определяет фазу системы по параметрам, таким как температура или давление.

Их метод работает лучше других методов машинного обучения, поскольку напрямую аппроксимирует вероятностные распределения измерений физической системы, что позволяет классификатору быть более точным.

В будущем, как ChatGPT решает математические задачи, исследователи смогут задавать вопросы генеративному классификатору, например, «Относится ли этот образец к фазе I или фазе II?» или «Этот образец получен при высокой или низкой температуре?».

Учёные могут использовать этот подход для решения различных задач классификации в физических системах, таких как обнаружение запутанности в квантовых системах или определение наилучшей теории для решения проблемы. Этот метод также поможет в улучшении языковых моделей, таких как ChatGPT, путём оптимизации параметров для достижения наилучших результатов.

Команда MIT планирует исследовать теоретические гарантии относительно количества измерений, необходимых для эффективного обнаружения фазовых переходов, и оценить вычислительные ресурсы, необходимые для этого.