Провести эффективную диагностику того или иного заболевания порой бывает очень трудно. Всех специалистов могут бросить на один фронт работ, в результате чего остальные останутся незащищёнными — и сегодня это вовсе не гипотетический сценарий. В Google Research работают над новой технологией, позволяющей ИИ проводить медицинскую визуализацию организма человека даже в условиях нехватки категоризированных данных.
Эксперты утверждают, что главное препятствие для использования глубинного обучения в медицинской визуализации — как раз нехватка категоризированных данных. Объяснить эту проблему достаточно легко. С исторической точки зрения, искусственный интеллект сейчас всё ещё находится на одном из начальных этапов развития, и наиболее эффективное его обучение происходит при помощи данных «с этикеткой»: «мужчина, 45 лет», «серый кот», «спортивный автомобиль» и так далее. В медицине подобные тренировочные данные всё ещё можно назвать дефицитом. Наиболее очевидный путь — долгое и упорное формирование массива соответствующих объёмов. Но в Google предложили альтернативный вариант, а именно так называемое «обучение без учителя».
Суть технологии заключается в том, ИИ проводит кластеринг самостоятельно: без вмешательства команды людей категоризирует огромные объёмы данных, разбивая их на различные группы, создание которых оправдано с точки зрения логики. Проще гововря, искусственный интеллект сам наклеивает упомянутые «этикетки», а учёные лишь на конечном этапе проверяют, правильно ли он это сделал. В Google утверждают, что их алгоритмы глубинного обучения «без учителя» уже показали первые успешные результаты в сфере здравоохранения. Эта альтернатива, предложенная компанией, может оказаться куда более эффективным путём. Нейросетям нужны миллионы (если не десятки миллионов) категоризированных примеров, а в сфере медицины они гораздо сложнее «серого кота» или «спортивного автомобиля».
Зафиксированное на фото или видео незначительное отклонение от нормы может превратиться в патологию только через несколько лет, но ИИ уже обязан это понимать и классифицировать. Как считают в Google, у предварительной тренировки под наблюдением — например, при помощи технологии ImageNet — есть свои ограничения. У искусственного интеллекта, проходящего такого рода обучение на обычных картинках, возникают затруднения при переключении на снимки медицинского характера. Именно поэтому следует попытаться прибегнуть к обучению, в ходе которого ИИ сам контролирует свои действия. Google разработали технологию MICLe, при помощи которой искусственный интеллект сопоставляет и категоризирует различные изображения одного и того же пациента. Эти изображения никак не подготовлены для эксперимента (на них нет текстовой и цифровой информации).
Учитывая, что в медицине речь идёт о человеческих жизнях, ИИ никак не может быть полностью предоставлен сам себе. На финальном этапе эксперимента искусственному интеллекту давали проанализировать подготовленный и категоризированный командой учёных массив данных, дабы алгоритм мог проверить, правильно ли он сам ранее разбил по категориям изображения без «этикеток» — и внести соответствующие коррективы. Серия экспериментов показала, что ИИ, которому на определённом этапе давали работать самостоятельно, действовал более эффективно, чем в том случае, когда приходилось работать исключительно по указке людей. В Google подчёркивают: в одном из практических заданий, связанных с дерматологией, самообучающийся ИИ потребовал в 5 раз меньше маркированных данных, чем нужно было раньше, когда алгоритмы действовали только под присмотром учёных. Это впечатляющий результат.
И речь здесь не только об экономии колоссальных средств, но и о времени, которое в медицине зачастую дороже любых денег. О специфике этой сферы упоминалось уже не раз: детально описать, например, поджелудочную железу намного сложнее, чем реактивный двигатель. Google движется к практическому применению своих новых технологий. Совсем недавно учёные компании опубликовали в престижном журнале Nature статью о том, что ИИ может не хуже профессионала определить будущие патологии в рентгеновских снимках грудной клетки. Конечно, Google не призывает заменить всех рентгенологов. Наоборот: компания указывает на сегодняшнюю нехватку и огромные нагрузки на специалистов, и предлагает им помощь.
Десятки алгоритмов уже получили разрешение от американской FDA и других регуляторов в сфере здравоохранения по всему миру, но проблема в том, что все они вручную «натренированы» на очень узкий спектр патологий. Даже если на снимке есть патология, но она не относится к сфере компетенции того или иного алгоритма, тот не подаст сигнала тревоги. Задача, которую поставили перед собой в Google, отличается от всех прочих решений тем, что их самообучающийся ИИ должен определять любые патологии. Любопытный факт: при создании «виртуального рентгенолога» Google использовали не только собственные наработки. В частности, в качестве математических мощностей проекта использовался кластер видеокарт Tesla V100 (компания Nvidia).
В качестве базы данных послужили более четверти миллиона рентгеновских снимков из США, Индии и Китая. Независимая команда профессиональных рентгенологов проанализировала и подтвердила результаты. Затем уже промаркированные изображения сделали общественным достоянием: любые компании, некоммерческие организации и лаборатории, занимающиеся научными изысканиями в этой сфере, теперь могут их использовать на бесплатной основе.
В Google неоднократно подчёркивали: их самообучающийся искусственный интеллект создаётся не с той целью, чтобы лишить кого-то работы, а для того, чтобы в этой нелёгкой работе помочь. Главная цель ИИ — отсеять нормальные снимки и категоризировать те, что содержат в себе аномалии, определив приоритеты для специалиста. Были проведены соответствующие эксперименты, в ходе которых удалось продемонстрировать высокую эффективность совместной работы машины и человека.