Более 100 лет назад Александр Грэм Белл призвал читателей National Geographic к смелому новаторству — "создать новую науку". Он отметил, что науки, основанные на измерениях звука и света, уже существуют, но науки обоняния не было. Белл предложил своим читателям "измерить запах".
Сегодня в наших смартфонах реализованы впечатляющие возможности, основанные на звуке и свете, такие как голосовые помощники, распознавание лиц и улучшение фотографий. Наука обоняния пока не предлагает подобных достижений. Однако ситуация меняется благодаря прогрессу в области машинного обоняния, также известного как "цифровое обоняние", который отвечает на призыв Белла.
Исследования машинного обоняния сталкиваются с огромными трудностями из-за сложности человеческого обоняния. В отличие от человеческого зрения, основанного на рецепторах сетчатки — палочках и трех типах колбочек, — обоняние зависит от примерно 400 типов рецепторов в носу.
Машинное обоняние начинается с датчиков, которые обнаруживают и идентифицируют молекулы в воздухе, выполняя ту же функцию, что и рецепторы в носу. Однако для полноценного использования этих данных системе нужно знать, как пахнет определенная молекула или их комбинация для человека. Здесь вступает в игру машинное обучение.
Машинное обучение, особенно глубокое обучение, лежит в основе достижений, таких как голосовые помощники и приложения для распознавания лиц. Оно также необходимо для оцифровки запахов, так как может сопоставлять молекулярную структуру соединений с текстовыми описаниями запахов. Модель машинного обучения изучает слова, которые люди используют, например «сладкий» или «десерт», чтобы описать свои ощущения от определенных соединений, таких как ванилин.
Однако машинное обучение требует больших наборов данных. В Интернете доступно огромное количество аудио, изображений и видеоконтента для обучения систем ИИ, распознающих звуки и изображения. Но машинное обоняние сталкивается с проблемой нехватки данных, так как большинство людей не могут легко описывать запахи так же, как виды и звуки. Без крупных наборов данных исследователи не могли обучать мощные модели машинного обучения.
Ситуация начала меняться в 2015 году с запуском конкурса DREAM Olfaction Prediction Challenge. На конкурсе были опубликованы данные, собранные биологами Андреасом Келлером и Лесли Восшаллом, и команды со всего мира приглашены представить свои модели машинного обучения. Модели должны были предсказать запахи, такие как "сладкий" или "цветочный", на основе молекулярной структуры соединений.
Лучшие модели были опубликованы в журнале Science в 2017 году. Победителем стал метод машинного обучения "случайный лес", объединяющий результаты нескольких деревьев решений.
Я исследователь машинного обучения и давно интересуюсь его применением в химии и психиатрии. Конкурс DREAM вызвал у меня интерес, и я почувствовал личную связь с обонянием, так как моя семья имеет корни в Каннаудже, парфюмерной столице Индии, а мой отец — химик, посвятивший карьеру анализу геологических образцов. Машинное обоняние открыло для меня возможности на стыке парфюмерии, культуры, химии и машинного обучения.
Прогресс в машинном обонянии набрал обороты после конкурса DREAM. Во время пандемии COVID-19 многие столкнулись с аносмией, и интерес к обонянию возрос. Исследовательский проект Pyrfume сделал общедоступными все больше наборов данных.
К 2019 году крупнейшие наборы данных выросли с менее чем 500 до около 5000 молекул. Группа исследователей Google под руководством Александра Вильчко совершила прорыв в машинном обонянии с использованием графовых нейронных сетей. Сейчас Вильчко — основатель и генеральный директор компании Osmo, целью которой является «научить компьютеры ощущать запахи».
Недавно Вильчко и его команда создали "основную карту запахов", где похожие запахи располагаются ближе друг к другу. Это было непросто, так как небольшие изменения в молекулярной структуре могут сильно изменять восприятие запаха. Прогресс в машинном обонянии имеет перспективные применения, включая персонализированные духи, улучшенные репелленты, новые химические датчики, раннее обнаружение болезней и более реалистичные впечатления от дополненной реальности. Будущее машинного обоняния выглядит светлым и обещает новые ароматы.