Зима близко, или Эта штука не работает
Как минимум в 4 публикациях от весьма авторитетных коллективов авторов из Британии и США была проанализирована практика использования средств искусственного интеллекта (ИИ) в борьбе с пандемией. Результат получился скорее отрицательный, хотя ожидания были большими
Процесс развития и принятия технологий происходит постепенно. Его описывает так называемая «кривая Gartner», по названию известного международного аналитического агентства. Причем идет этот процесс сначала по восходящей линии, затем по нисходящей, достигая «корыта разочарования», а затем снова по восходящей, выходя на плато продуктивного использования.
С технологиями ИИ все было еще сложнее и драматичнее. Таких взлетов и падений уже было два как минимум два, на рубеже 50-60 и 80-90 годов прошлого века. И разочарование, по крайней мере, на первой фазе, было очень серьезным, его назвали «зимой искусственного интеллекта», которая продолжалась более 20 лет. Причиной такого глубокого падения стали ограниченные ресурсы вычислительной техники тех лет.
В 80-90 годы тоже был взлет, за которым последовало определенное разочарование. Но это разочарование не было столь глубоким, как в середине столетия. Многие появившиеся тогда технологии достигли продуктивного уровня, и ими реально пользовались и пользуются. Это, например, системы оптического распознавания текста или ряд интеллектуальных инструментов обработки изображений. В итоге, по оценке Евгения Козловского, в 1995-97 годах наименее трудоемким способом преобразования документов в формате наиболее популярного в России в начале 90-х текстового процессора «Лексикон» в Word для Windows оказалось распознавание распечатки. По своему личному опыту могу сказать, что эта оценка близка к истине.
Сейчас также наблюдается некоторое разочарование. Лишним доказательством тому стали некоторые результаты попыток использования аналитических средств для борьбы с пандемией коронавируса. А они оказались неоднозначными. Так, в исследовании двух с лишним десятков авторов из разных европейских стран, опубликованном в British Medical Journal, главным выводом является то, что из 232 диагностических и прогностических моделей, которые тестировались в разных клиниках для выявления Covid-19, ни одна не пригодна для реального клинического использования.
Большие надежды возлагались на то, что ИИ поможет выявлять ковидных больных по результатам радиологических исследований (рентген, КТ). Первые эксперименты, казалось, обнадеживали, и выигрыш во времени при использовании ИИ мог достигать до 10 раз по сравнению с врачом-радиологом. Но кое-где результат был, скорее, отрицательным. «Наш обзор показывает, что ни одна из моделей не имеет потенциального клинического применения из-за методологических недостатков и/или лежащих в их основе предубеждений», – такой вывод делают полтора десятка авторов исследования, опубликованного в Nature Machine Intelligence.
Главная причина того, почему ожидания не оправдались – недостаток и низкое качество данных. «Проблемы, связанные с доступностью данных, доступом и стандартизацией, охватывали весь их спектр, который использовался для исследований во время пандемии», – говорится в отчете по итогам нескольких конференций, проведенных британским Институтом Алана Тьюринга. Серьезной проблемой для Британии стало получение данных из этнических районов, с жителями которых возникали проблемы с коммуникацией и объективная информация из которых часто просто отсутствовала. Тем более, что клиники весьма неохотно ими делились. Накладывался и фактор субъективизма. Наконец, существенную роль сыграло то, что модели, как правило, разрабатывают математики и программисты, не имеющие медицинских знаний, тогда как медики не владеют средствами, используемыми для обучения нейросетей.
К тому же далеко не всегда соблюдался принцип использования для тестирования и обучения инструментов, использующих нейросети, разные наборы данных. В итоге результаты получались, скажем так, странные. Например, нейросеть ставила диагноз Covid любым взрослым пациентам. Это случилось потому, что при обучении нейросети в качестве заведомо отрицательных образцов использовались исключительно снимки детей и подростков. Приводились примеры и того, когда нейросеть отказывалась выявлять специфические поражения у тех, чьи снимки сделаны в положении стоя, а не лежа.
Типичные поражения легких, характерные для коронавирусной инфекции |
Вместе с тем итоги пандемии нельзя назвать однозначно отрицательными. Есть вполне положительный опыт. Например, как отметил в своем блоге еще в ноябре прошлого года мэр Москвы Сергей Собянин, с помощью ИИ в одной только Москве было обработано более полумиллиона КТ-снимков, что позволило существенно снизить нагрузку на рентгенологов. Хорошие результаты были достигнуты и в других городах, где разработали свой инструментарий, в ряде случаев используя прежний опыт, накопленный при диагностике поражений легких, вызванных другими заболеваниями (рак, туберкулез, различные виды пневмонии).
Мэр Москвы Сергей Собянин рассказывает о первых результатах использования ИИ для диагностики Covd-19, апрель 2020 г. (Источник: Телеканал «Москва 24», www.m24.ru) |
Плюс ко всему, большое будущее у технологий m-health, когда для мониторинга состояния пациентов с хроническими заболеваниями применяются мобильные устройства, в том числе массовые. Уже никого не удивить историей о том, что умные часы за несколько часов выявили признаки серьезных проблем, угрожающих жизни владельца, и дали сигнал врачам для принятия мер. Иногда идут и дальше, адаптируя алгоритмы, применяемые для анализа состояния промышленного оборудования к диагностике разного рода болезней людей до того, когда появляются первые симптомы. Такие разработки есть и в России.
Типовая экосистема m-health |