Российский AI-помощник по здоровью прошел тестирование на реальных клинических случаях

AI-помощник СберЗдоровья показал 93% точности против 85% у зарубежного сервиса

Фото: Glenn Carstens-Peters / Unsplash

Эксперимент, проведенный специалистами Института AIRI, показал: российский AI-помощник по здоровью на базе нейросетевой модели GigaChat в тестах на 30 реальных клинических случаях (отобраны из 200 случайным образом) из журнала New England Journal of Medicine показал 93 процента точности (28 верных заключений). Тестирование было проведено по методике, аналогичной эксперименту компании Microsoft по проверке решения Microsoft AI Diagnostic Orchestrator (MAI-DxO).

Искусственный интеллект работал вслепую, начиная с базовых данных о пациенте — пола, возраста и симптомов. Далее модель последовательно запрашивала анализы, визуализацию и консультации, чтобы прийти к диагнозу. Медианное число диалоговых ходов составило три: информация от пациента — комментарий или вопрос врача — ответ пациента. Это говорит о высокой скорости принятия решений.

«Эксперимент показал, что наша технология не просто конкурентоспособна, но и может задавать стандарты в медицинской диагностике для всего мира. Мы видим, как мультиагентная архитектура ускоряет и улучшает процесс постановки диагноза. Особенно важно, что система демонстрирует гибкость: она пересматривает гипотезы, запрашивает дополнительные данные и даже реагирует на эмоциональную подачу клинических сценариев. В будущем это открывает двери для консилиумов, где AI станет надежным помощником врача», — отметил директор Центра индустрии здоровья Сбербанка Сергей Жданов.

Все клинические случаи были маркированы тремя типами сложности. Искусственный интеллект (AI) успешно распознал такие редкие патологии, как болезнь Уиппла (за один ход), ацерулоплазминемию (за шесть ходов) и метгемоглобинемию, вызванную расбуриказой.

Помощник продемонстрировал несколько ключевых преимуществ. Он работает быстро — в среднем за три хода. Мыслит логически, успешно диагностируя редкие и комплексные патологии. Сочетает клиническую строгость с гибкой диалоговой логикой и умеет работать с человекоориентированной подачей. Неожиданным эффектом эксперимента стала эмоциональная вовлеченность: драматические сценарии, как это часто происходит в реальной жизни, повысили диагностическую внимательность алгоритма.

«Сегодня мультиагентные системы способны уверенно разыскивать редкие, маскирующиеся патологии за пределами типовых алгоритмов приемного отделения. Способен ли медицинский AI-ассистент вовремя перестроить гипотезу, отбросив наиболее вероятную, но ложную дорогу? AI-помощник показал, что способен, и делал это быстрее, чем ожидал эксперт-наблюдатель с 15-летним стажем в медицине», — рассказал генеральный директор Института AIRI Иван Оселедец.

Эксперимент носит пилотный характер и продолжается в данный момент. Исследователи AIRI планируют расширить выборку, включив кейсы из других медицинских журналов. Однако уже сейчас технология демонстрирует потенциал не только для практической медицины, но и для обучения врачей, предлагая им реалистичные симуляции сложных случаев.

AI-помощник был разработан учеными Института AIRI и специалистами СберМедИИ и впервые представлен на конференции AI Journey 2024, после чего прошел пилотное тестирование в приложении медицинской компании «СберЗдоровье», где успешно функционирует и помогает людям. На данный момент им воспользовались уже более 160 тысяч раз.

Лента добра деактивирована.
Добро пожаловать в реальный мир.