RSRCC: Почему новый бенчмарк для ИИ — это признание провала текущих систем

Сегодня • arXiv cs.AI

Команда исследователей выпустила RSRCC — новый бенчмарк для анализа изменений на спутниковых снимках. Казалось бы, рутинная научная работа. Но методология выдаёт неудобную правду: современные ИИ-системы настолько плохо понимают пространственно-временные изменения, что для их тестирования нужны принципиально новые подходы.

Общепринятое мнение: машинное зрение достигло человеческого уровня. ImageNet пройден, объекты распознаются с точностью 99%, компьютерное зрение — solved problem. RSRCC (Remote Sensing Regional Change Comprehension) должен был стать очередным бенчмарком в длинном списке побеждённых человечеством задач.

Но архитектура RSRCC выдаёт другую историю. Исследователи используют retrieval-augmented подход с Best-of-N ранжированием — технологии, которые применяют, когда базовые модели не справляются. Зачем усложнять систему оценки, если ИИ действительно понимает изображения? Ответ прост: потому что не понимает.

Спутниковые снимки требуют понимания контекста, временных изменений, причинно-следственных связей между объектами. Современные vision-модели отлично классифицируют статичные объекты, но теряются, когда нужно понять 'что изменилось и почему'. RSRCC — это не просто новый датасет, это диагностический инструмент для выявления фундаментальных ограничений текущих архитектур.

RSRCC: Почему новый бенчмарк для ИИ — это признание провала текущих систем

Читайте также