Российский AI-помощник по здоровью прошел тестирование на реальных клинических случаях

AI-помощник СберЗдоровья показал 93% точности против 85% у зарубежного сервиса

Татьяна Романова (Редактор)

Эксперимент, проведенный специалистами Института AIRI, показал: российский AI-помощник по здоровью на базе нейросетевой модели GigaChat в тестах на 30 реальных клинических случаях (отобраны из 200 случайным образом) из журнала New England Journal of Medicine показал 93 процента точности (28 верных заключений). Тестирование было проведено по методике, аналогичной эксперименту компании Microsoft по проверке решения Microsoft AI Diagnostic Orchestrator (MAI-DxO).

Искусственный интеллект работал вслепую, начиная с базовых данных о пациенте — пола, возраста и симптомов. Далее модель последовательно запрашивала анализы, визуализацию и консультации, чтобы прийти к диагнозу. Медианное число диалоговых ходов составило три: информация от пациента — комментарий или вопрос врача — ответ пациента. Это говорит о высокой скорости принятия решений.

«Эксперимент показал, что наша технология не просто конкурентоспособна, но и может задавать стандарты в медицинской диагностике для всего мира. Мы видим, как мультиагентная архитектура ускоряет и улучшает процесс постановки диагноза. Особенно важно, что система демонстрирует гибкость: она пересматривает гипотезы, запрашивает дополнительные данные и даже реагирует на эмоциональную подачу клинических сценариев. В будущем это открывает двери для консилиумов, где AI станет надежным помощником врача», — отметил директор Центра индустрии здоровья Сбербанка Сергей Жданов.

Все клинические случаи были маркированы тремя типами сложности. Искусственный интеллект (AI) успешно распознал такие редкие патологии, как болезнь Уиппла (за один ход), ацерулоплазминемию (за шесть ходов) и метгемоглобинемию, вызванную расбуриказой.

Помощник продемонстрировал несколько ключевых преимуществ. Он работает быстро — в среднем за три хода. Мыслит логически, успешно диагностируя редкие и комплексные патологии. Сочетает клиническую строгость с гибкой диалоговой логикой и умеет работать с человекоориентированной подачей. Неожиданным эффектом эксперимента стала эмоциональная вовлеченность: драматические сценарии, как это часто происходит в реальной жизни, повысили диагностическую внимательность алгоритма.

«Сегодня мультиагентные системы способны уверенно разыскивать редкие, маскирующиеся патологии за пределами типовых алгоритмов приемного отделения. Способен ли медицинский AI-ассистент вовремя перестроить гипотезу, отбросив наиболее вероятную, но ложную дорогу? AI-помощник показал, что способен, и делал это быстрее, чем ожидал эксперт-наблюдатель с 15-летним стажем в медицине», — рассказал генеральный директор Института AIRI Иван Оселедец.

Эксперимент носит пилотный характер и продолжается в данный момент. Исследователи AIRI планируют расширить выборку, включив кейсы из других медицинских журналов. Однако уже сейчас технология демонстрирует потенциал не только для практической медицины, но и для обучения врачей, предлагая им реалистичные симуляции сложных случаев.

AI-помощник был разработан учеными Института AIRI и специалистами СберМедИИ и впервые представлен на конференции AI Journey 2024, после чего прошел пилотное тестирование в приложении медицинской компании «СберЗдоровье», где успешно функционирует и помогает людям. На данный момент им воспользовались уже более 160 тысяч раз.

Российский AI-помощник по здоровью прошел тестирование на реальных клинических случаях

Трамп поставил точку в вопросе о передаче Украине ракет Tomahawk. Какое решение принял президент США?

Российская блогерша оформила банкротство для ухода от уплаты налогов

В США назвали опасными планы НАТО по конфликту на Украине

Назван фаворит Кубка Гагарина

Пашинян включил песню Макана о любви и показал сердечко

Тысячи автомобилей столкнулись с пробкой на границе Белоруссии и Польши

Российская пенсионерка искусала и избила бревном соседей

Названа причина деиндустриализации Германии

Объяснен один тревожный феномен при засыпании

Власти России оценили возможность полного запрета на продажу табака