На Международной конференции по обработке изображений (IEEE ICIP) в Абу-Даби учёные из T-Bank AI Research представили новый метод под названием SDDE (Saliency-Diversified Deep Ensembles), способный существенно улучшить точность ИИ при распознавании объектов на изображениях.
В разработке участвовали также студенты МИСИС и МФТИ, и, по данным Forbes, новый метод позволяет снизить вероятность ошибки в анализе изображений примерно на 20 %. В основе SDDE лежат карты внимания, которые выделяют разные аспекты данных, что даёт моделям возможность "смотреть" на изображения под разными углами и улучшать общий результат анализа. Таким образом, распознавание объектов становится более детализированным и точным, подчёркивают в T-Bank AI Research. Этот метод может быть особенно полезен в таких областях, как беспилотные транспортные средства и медицинская диагностика.
Кроме того, модель научили учитывать при анализе и новую для неё информацию, что расширило её возможности в распознавании ранее неизвестных объектов. По словам Максима Голядкина, младшего научного сотрудника группы «ИИ в промышленности» в Институте AIRI, нейросети порой не осознают, что работают с незнакомыми данными, и из-за этого могут уверенно давать неверные прогнозы, аналогично тому, как некоторые языковые модели «галлюцинируют». «С разнообразием фокусов внутри ансамбля, модели лучше справляются с новыми и неизвестными данными», — отмечает Голядкин.
Мировой рынок компьютерного зрения, согласно Statista, показывает быстрый рост и увеличится с $25,8 млрд в 2024 году до $47 млрд к 2030 году. Особенно заметен рост в здравоохранении, где объём рынка увеличится с $986 млн в 2022 году до $31 млрд к 2031 году, с ежегодным приростом на 47 %, по данным Straits Research.
В России этот рынок также растёт: в этом году он превысит $600 млн, а к 2030 году, при среднем ежегодном росте 10,5 %, достигнет $1,1 млрд.