MAESIL доказал: медицинский ИИ учится лучше, когда видит меньше

Сегодня • arXiv cs.AI
В медицинском ИИ царит догма: чем больше данных, тем лучше диагностика. Но команда из Кореи создала MAESIL — систему, которая намеренно скрывает от себя 75% изображения и при этом превосходит модели, обученные на полных снимках.

Медицинский ИИ живёт по простому правилу: покажи алгоритму миллион рентгеновских снимков, и он научится находить рак лучше врача. Компании тратят миллионы на сбор медицинских изображений, больницы соревнуются в размерах датасетов. Логика железная — машине нужно видеть всё, чтобы понимать болезни.

MAESIL переворачивает эту логику. Masked Autoencoder for Enhanced Self-supervised Medical Image Learning работает как пазл наоборот: система получает медицинское изображение, скрывает случайные участки и учится восстанавливать потерянные фрагменты. Результат — модель, которая понимает анатомию глубже, чем системы, видевшие миллионы полных снимков.

Цифры говорят сами за себя: MAESIL показывает на 15-20% лучшую точность в классификации медицинских изображений при использовании в 10 раз меньшего количества размеченных данных. Система научилась видеть паттерны, которые пропускают традиционные подходы, именно потому что была вынуждена додумывать недостающие части.