Google Research и исследовательская лаборатория Google в области искусственного интеллекта DeepMind раскрыли подробности о семействе передовых больших языковых моделей Med-Gemini, созданных для применения в сфере здравоохранения.
Хотя искусственные интеллектуальные модели все еще находятся на стадии исследований, авторы утверждают, что модели Med-Gemini, основанные на модели Google Gemini, превосходят другие модели, такие как GPT-4 от OpenAI. Они обладают значительным потенциалом в клинической диагностике и превосходят отраслевые стандарты в 14 популярных профильных тестах. В тесте MedQA (USMLE) модель Med-Gemini достигла точности 91,1%, используя стратегию поиска, основанную на неопределенности, превзойдя медицинскую LLM Med-PaLM 2 компании Google на 4,5%. Набор моделей также превзошел человека в обобщении медицинских текстов и составлении рекомендаций, причем в половине случаев врачи оценили ответы Med-Gemini-M 1.0 как хорошие или даже лучше, чем ответы экспертов.
Med-Gemini представляет собой семейство больших мультимодальных моделей (LMM), каждая из которых имеет свою специализацию. В отличие от других больших языковых моделей, Med-Gemini позволяют получить более точные, надежные и детальные результаты для сложных задач клинического обоснования.
Google сообщила, что модели Med-Gemini продемонстрировали значительное превосходство по семи мультимодальным тестам, включая проверку по изображениям New England Journal of Medicine (NEJM), по сравнению с моделью GPT-4.
Чтобы проверить способность Med-Gemini понимать и рассуждать на основе длинной контекстной медицинской информации, исследователи успешно выполнили задачу поиска "иголки в стоге сена" с использованием обширной общедоступной базы данных Medical Information Mart for Intensive Care (MIMIC-III), содержащей анонимные данные о состоянии здоровья пациентов, поступивших в отделение интенсивной терапии.
Поддержка Med-Gemini эффективного поиска в базе данных электронных медицинских записей (EHR) позволит значительно снизить когнитивную нагрузку врачей и расширить их возможности за счет эффективного извлечения и анализа важной информации из огромных объемов данных пациентов.
Однако Google отметила, что их модели требуют дальнейшей доработки и специализации перед тем, как их можно будет успешно использовать в здравоохранении.